ЗАСТОСУВАННЯ ГЛИБОКИХ НЕЙРОННИХ МЕРЕЖ ДЛЯ АНАЛІЗУ ТА ОБРОБКИ ДАНИХ
09.11.2023 14:16
[1. Information systems and technologies]
Author: Дубик Марта Олегівна, магістр, Західноукраїнський національний університет, м. Тернопіль;
Пігур Олег Ігорович, магістр, Західноукраїнський національний університет, м. Тернопіль;
Пінецький Ігор Ярославович, магістр, Західноукраїнський національний університет, м. Тернопіль;
Черняк Ілля Сергійович, магістр, Західноукраїнський національний університет, м. Тернопіль
Чичула Наталія Ярославівна, магістр, Західноукраїнський національний університет, м. Тернопіль
Алгоритми глибокого машинного навчання сприяють формуванню значущих абстракцій з сирої інформації, використовуючи багаторівневу ієрархічну структуру навчання. У цьому процесі, складніші і абстрактні концепції вивчаються на основі більш простих ідей, що є на нижніх щаблях ієрархії навчальних моделей. Глибоке навчання особливо корисне у роботі з великими масивами неструктурованих даних, що робить цю методологію привабливою для виявлення для отримання закономірностей з великих даних [1-4].
В роботі [5] зазначено, що алгоритми глибокого навчання ефективніше ідентифікують неочевидні та глобальні зв'язки в даних, ніж це можливо за допомогою менш складних навчальних архітектур.
Інші переваги абстрактних представлень, отриманих через глибоке навчання, включають:
–застосування відносно простих лінійних моделей, що ефективно використовують знання, отримані з складніших даних;
–підвищення автоматизації у вилученні даних з неконтрольованих джерел, що має широке застосування для різноманітних типів даних, таких як зображення, текст, аудіо тощо;
–можливість отримання реляційних та семантичних знань на вищих рівнях абстракції та аналізу сирої інформації.
Хоча існує багато переваг використання глибокого навчання для репрезентації даних, деякі особливості є ключовими для обробки масштабних датасетів. Враховуючи чотири основні атрибути великих даних – обсяг, різноманітність, швидкість і достовірність - технології глибокого навчання здаються ідеально підходящими для вирішення викликів, що пов'язані зі складністю і множинністю інформації. Глибоке навчання використовує потенціал масивних даних, дозволяючи алгоритмам розкривати більш складні патерни, що могли б залишитися непоміченими за допомогою більш поверхневих моделей навчання.
Крім того, глибоке навчання ідеально підходить для роботи з сирими даними різних форматів і джерел, оскільки воно спрощує процес абстракції і репрезентації інформації. Це також зменшує необхідність безпосереднього втручання фахівців для виділення характеристик з кожного нового виду даних, які часто зустрічаються у великих обсягах інформації. Аналітика великих даних зустрічається з унікальними проблемами, які традиційні методи аналізу можуть вирішити не повністю, що підкреслює потребу в розробці нових алгоритмів і моделей. Глибоке навчання пропонує рішення, які можуть служити експертам та аналітикам в якості цінного ресурсу. Зокрема, за допомогою глибокого навчання отримані репрезентації можуть бути використані як фундаментальна основа для рішень, класифікації візуальних, текстових і аудіо даних, вдосконалення пошуку інформації та інших напрямків аналітики великих даних.
Протягом останніх кількох років відбувся значний прогрес у вивченні застосування методів глибокого навчання для розпізнавання вторгнень. Однак, перед дослідниками все ще стоять ряд викликів. Наприклад, застосування глибокого навчання як класифікаторів для виявлення атак у реальному часі є складним завданням. Більшість досліджень зосереджені на зменшенні кількості характеристик для скорочення обчислювальних витрат на етапі екстракції ознак. Також, якість класифікації покращується зі збільшенням обсягу навчальних даних, але часто виникає проблема їх нестачі. Використання комбінації контрольованого та неконтрольованого навчання може сприяти підвищенню ефективності та достовірності у виявленні вторгнень.
Прогрес у галузі машинного навчання та розвиток теорії глибоких нейронних мереж [1-4] сприяли створенню численних згорткових нейронних мереж для ідентифікації та класифікації зображень. Сьогодні існує велика різноманітність архітектур згорткових нейронних мереж. Щороку публікуються нові дослідження, виникають нові архітектури або вдосконалюються вже існуючі. До таких архітектур відносяться DenseNet [6], InceptionV3 [7], Squeezenet [8], MobileNet [9] та AlexNet [10]. Перші дві архітектури відрізняються більшими розмірами та більш тривалим часом навчання, але вони забезпечують вищу точність. Останні дві архітектури менші за розміром і навчаються швидше, оскільки вони призначені для використання в пристроях з обмеженими обчислювальними ресурсами та пам'яттю.
Рішення в науці, бізнесі та економіці часто залежать від доступної інформації, отриманої з даних. В останні роки методи обчислювального інтелекту набули широкого застосування у процесі прийняття рішень. Однак варто відзначити, що ці методи мають обмеження в ефективній обробці даних з відсутніми значеннями, що ускладнює виконання завдань класифікації чи регресії. Розуміння причин відсутності даних є ключовим, оскільки це допомагає виявляти фактори, що впливають на це явище [11, 12].
Після аналізу відповідних джерел, програмного забезпечення та технологій, що використовуються для аналізу та обробки масивних даних, було визначено декілька проблемних питань, які вимагають термінового розв'язання.
Напівструктуровані та неструктуровані дані часто зустрічаються у реальних сценаріях. Тому однією з ключових проблем у аналізі великих даних є відновлення відсутніх даних. Важливо виявити приховані залежності в наборах даних, врахувати специфіку кожного набору даних і передбачити потенційні випадки відсутності даних. Тому попередня обробка даних із різних джерел часто базується на безперервних числових та категоріальних даних. Різні джерела даних також мають різну природу відсутності даних, що вимагає специфічного підходу до аналізу цих джерел.
Стосовно обробки великих даних, методи Big Data ефективно працюють зі структурованими даними, але менш ефективно з напівструктурованими. Неструктуровані дані виявляються складнішими для аналізу за допомогою традиційних методів. Глибоке навчання має потенціал допомогти в цьому аспекті.
Для глибокого навчання необхідні якісні дані, оскільки нейронним мережам потрібно багато даних для формування складних абстракцій. У сценаріях великих даних часто зустрічаються дані, які не завжди є точними чи високоякісними. Навіть незначні варіації вхідних даних, особливо присутність відсутніх даних, можуть значно вплинути на точність нейронних мереж.
Глибоке навчання вимагає великих, реалістичних даних для навчання і перенавчання, які потрібно безпечно передавати, зберігати та обробляти. Коли такі системи застосовуються у критичних інфраструктурах, існує ризик впливу зловмисників на процес аналізу, що може призвести до неправильних результатів або навіть надзвичайних ситуацій.
Глибоке навчання також має проблеми з адаптацією до зміни контексту. Моделі, навчені для певної задачі, можуть виявитися неефективними при роботі з подібними задачами в іншому контексті. Наприклад, системи глибокого навчання, які ефективно розпізнають певний набір зображень, можуть зазнати невдачі при роботі з зображеннями, які обернені або мають незначні відмінності.
З ростом обсягу великих даних, які передаються в режимі реального часу, зростає потреба в їх оперативному аналізі. Проте, використання глибокого навчання для аналізу даних в реальному часі є складним через великі обчислювальні та часові вимоги.
Отже, на основі аналізу релевантних джерел та досліджень виявлено протиріччя між зростанням джерел великих даних, доступними технологіями для їх обробки, які не завжди забезпечують достатню точність для неструктурованих даних, та зростаючими вимогами до аналізу даних в реальному часі. Це вказує на актуальність досліджень щодо розробки ефективних рішень, які зможуть ефективно працювати з великими даними, забезпечуючи високу точність та надійність в умовах відсутності, неповноти, нечіткості та невизначеності даних.
Таким чином, дослідження методів відновлення великих даних, виявлення вторгнень, класифікації зображень, розпізнавання тексту та побудова на їх основі ефективних систем обробки та аналізу великих даних залишається актуальним. Ці дослідження повинні підвищити ефективність та достовірність аналізу великих даних в різних предметних областях, забезпечити високу якість результатів навіть у складних умовах обмежених ресурсів та нестабільних даних.
Література
1.Bengio Y. Deep learning of representations: Looking forward. Lecture Notes in Computer Science. 2013. Vol. 7978. Pp. 1–37.
2.Bengio Y. Learning deep architectures for AI. Foundations and Trends in Machine Learning. 2009. Vo1. 2(1). Pp. 1–127.
3.Bengio Y., Bengio S. Modeling high-dimensional discrete data with multi-layer neural networks. In Proc. Adv. Neural Inf. Process. Syst. 2000. Vol. 12., Pp. 400–406.
4.Bengio Y., Courville A., Vincent P. Representation Learning: A Review and New Perspectives // IEEE Transactions on Pattern Analysis and Machine Intelligence. 2013. Vol. 35, No. 8. Pp. 1798–1828.
5.Bottou L., Chapelle O., DeCoste D., Weston J. Scaling learning algorithms towards AI. In Large Scale Kernel Machines: MIT Press. Cambridge, MA. 2007. Pp. 321–359.
6.Densely Connected Convolutional Networks [Електронний ресурс] – Режим доступу : https://arxiv.org/pdf/1608.06993v3.pdf.
7.Inception-v3 [Електронний ресурс] – Режим доступу : https://paperswithcode.com/method/inception-v3.
8.SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size [Електронний ресурс] – Режим доступу : https://arxiv.org/pdf/1602.07360.pdf.
9.MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications [Електронний ресурс] – Режим доступу : https://arxiv.org/pdf/1704.04861.pdf.
10.СNN Architectures: LeNet, AlexNet, VGG, GoogLeNet, ResNet and more [Електронний ресурс] – Режим доступу : https://medium.com/@sidereal/cnns-architectures-lenet-alexnet-vgg-googlenet-resnet-and-more-666091488df5.
11.Allison P. D. Missing Data: Quantitative Applications in the Social Sciences. Thousand Oaks, CA: Sage. 2002. P. 104.
12.Schafer J. L., Graham J. W. Missing data: Our view of the state of the art. Psychological Methods. 2002. Vol. 7(2). Pp. 147–177.
__________________________________________________________________________________________
Науковий керівник: Комар Мирослав Петрович, доктор технічних наук, професор, Західноукраїнський національний університет, м. Тернопіль