НАЛАШТУВАННЯ ПАРАМЕТРІВ ГЛИБОКИХ НЕЙРОННИХ МЕРЕЖ ЗА ДОПОМОГОЮ ЕВОЛЮЦІЙНИХ АЛГОРИТМІВ

01.12.2024 13:14

[1. Information systems and technologies]

Author: Книш Тетяна Олегівна, магістр, Західноукраїнський національний університет, м. Тернопіль

Глибокі нейронні мережі, хоч і дуже потужні, є надзвичайно складними через їхню варіативну архітектуру та велику кількість налаштувань. Якщо налаштування традиційного алгоритму машинного навчання, такого як Random Forest, є досить простим (де основним параметром є кількість дерев), то для глибокого навчання потрібно визначити складну архітектуру мережі, яка часто залежить від задачі, що розв’язується. Наприклад, для задач розпізнавання чи класифікації зображень глибокі мережі складаються з кількох шарів, кожен з яких виконує свою специфічну функцію у трансформації даних [1-3].

Глибока нейронна мережа будується із багатьох шарів, що розташовані у певному порядку та мають різні функції, щоб допомогти визначити складні, нелінійні зв'язки між вхідними даними та виходом. Кожен шар може містити різну кількість нейронів, мати свої початкові налаштування ваг і функції активації. Усі ці параметри повинні бути визначені до початку навчання, і простір можливих налаштувань дуже великий, оскільки оптимальна комбінація залежить від конкретної задачі, що потребує вирішення.

Конструкція багатошарової архітектури обмежується деякими правилами. Наприклад, вихід одного шару має відповідати формату вхідних даних наступного. Якщо шар очікує вектор на вході, а йому передують дані у двовимірній формі (як у випадку з шаром Reshape), необхідно забезпечити правильне узгодження даних. Також є обмеження щодо налаштувань кожного нового шару, який додається до моделі, – наприклад, шар Reshape потребує кортеж, що визначає розмірність вихідної матриці, яка має відповідати розміру вхідного вектора.

Таким чином, налаштування параметрів і структури нейронної мережі створюють великий простір пошуку з безліччю можливих конфігурацій. Оскільки головна мета полягає в досягненні максимальної точності моделі, вибір оптимальної конфігурації є завданням оптимізації. У цій роботі використано еволюційний алгоритм для виконання метаевристичного пошуку, що дозволяє знайти конфігурацію з високою точністю для задач класифікації.

Спроба налаштування різних комбінацій параметрів і архітектур шарів може сильно впливати на продуктивність моделі в задачах класифікації, які є одними з найпоширеніших для глибоких мереж. Тому правильний вибір параметрів і структури шарів можна розглядати як задачу оптимізації, де метою є поліпшення точності класифікації.

Через масштабність простору пошуку ми вирішили використати еволюційні алгоритми [4], які показали хороші результати в оптимізаційних задачах із великими просторами пошуку.

Еволюційний алгоритм також може знайти комбінацію параметрів або структуру шарів, яку експерт міг би не вибрати через певні упередження чи обмежені знання про задачу. Наприклад, експерт може уникати певних комбінацій шарів, оскільки такі конфігурації рідко зустрічаються в літературі. Однак еволюційний алгоритм може знайти унікальну послідовність шарів, яка покаже високі результати у класифікації, навіть якщо ця комбінація є нетиповою.

У даному підході кожен індивід у популяції еволюційного алгоритму представляє певну архітектуру мережі зі своїми параметрами. Значення придатності для кожного індивіда обчислюється як точність мережі при розв'язанні задачі класифікації. Користувачеві потрібно лише визначити, які параметри будуть включені в простір пошуку, та встановити діапазон значень для кожного з них. Щоб зменшити розмір простору пошуку, ми використали числові послідовності з певним кроком між значеннями. Для категоріальних параметрів, таких як функція активації, потрібно задати список можливих значень. Усі параметри передаються до функції ініціалізації індивіда, яка генерує популяцію, а також визначає обмеження для мутацій, щоб гарантувати допустимі варіації.

У кожному поколінні до індивідів послідовно застосовуються оператори рекомбінації та мутації з певною ймовірністю для кожного процесу. Це дає змогу відтворити необхідну кількість індивідів, які потім оцінюються на основі їхньої точності. Після оновлення значень придатності кожного індивіда застосовується метод відбору за рулеткою, що обирає індивідів пропорційно до їхніх значень придатності серед нової популяції та тих, що залишились з попереднього покоління. Це дозволяє зберегти індивідів з хорошою продуктивністю, зберігаючи різноманітність у популяції, щоб алгоритм не застряг у локальному максимумі.

Використання еволюційних алгоритмів забезпечує гнучкість і ефективність у пошуку оптимальних архітектур мереж, зберігаючи різноманітність конфігурацій і мінімізуючи ризик застрягання в локальних максимумах. Це дає змогу отримувати точні моделі навіть для складних задач класифікації, забезпечуючи їхню адаптацію до специфіки даних. Таким чином, інтеграція еволюційних алгоритмів у процес налаштування глибоких нейронних мереж є ефективним підходом для підвищення їхньої продуктивності.

Література

1. LeCun Y., Bengio Y., Hinton G. Deep learning, Nature, 2015. Vol. 521, No. 7553. Pp. 436–444.

2. Hinton G., Deng L., Yu D., Dahl G.E., Mohamed A.-r., Jaitly N., Senior A., Vanhoucke V., Nguyen P., Sainath T.N., et al. Deep neural networks for acoustic modeling in speech recognition: The shared views of four research groups, IEEE Signal Processing Magazine, 2012. Vol. 29, No. 6. Pp. 82–97.

3. Acharya U.R., Oh S.L., Hagiwara Y., et al. A deep convolutional neural network model to classify heartbeats. Computers in Biology and Medicine. 2017. Vol. 89. Pp. 389–396.

4. Eiben A.E., Smith J.E. Introduction to evolutionary computing, in: Natural Computing, Springer-Verlag Berlin Heidelberg, 2003.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Another articles in this section

Сonferences

Conference 2025

Information society: technological, economic and technical aspects of formation (issue 95) (16-17.01.2025)

Information society: technological, economic and technical aspects of formation (issue 96) (11-12.02.2025)

Information society: technological, economic and technical aspects of formation (issue 97) (13-14.03.2025)

Information society: technological, economic and technical aspects of formation (issue 98) (15-16.04.2025)

Information society: technological, economic and technical aspects of formation (issue 99) (14-15.05.2025)

Information society: technological, economic and technical aspects of formation (issue 100) (11-12.06.2025)

Information society: technological, economic and technical aspects of formation (issue 101) (09-10.07.2025)

Information society: technological, economic and technical aspects of formation (issue 102) (16-17.09.2025)

Information society: technological, economic and technical aspects of formation (issue 103) (14-15.10.2025)

Information society: technological, economic and technical aspects of formation (issue 104) (13-14.11.2025)

Conference 2024

Information society: technological, economic and technical aspects of formation (issue 84) (18-19.01.2024)

Information society: technological, economic and technical aspects of formation (issue 85) (15-16.02.2024)

Information society: technological, economic and technical aspects of formation (issue 86) (12-13.03.2024)

Information society: technological, economic and technical aspects of formation (issue 87) (11-12.04.2024)

Information society: technological, economic and technical aspects of formation (issue 88) (14-15.05.2024)

Information society: technological, economic and technical aspects of formation (issue 89) (12-13.06.2024)

Information society: technological, economic and technical aspects of formation (issue 90) (9-10.07.2024)

Information society: technological, economic and technical aspects of formation (issue 91) (10-11.09.2024)

Information society: technological, economic and technical aspects of formation (issue 92) (8-9.10.2024)

Information society: technological, economic and technical aspects of formation (issue 93) (12-13.11.2024)

Information society: technological, economic and technical aspects of formation (issue 94) (11-12.12.2024)

Conference 2023

Information society: technological, economic and technical aspects of formation (issue 74) (06-07.02.2023)

Information society: technological, economic and technical aspects of formation (issue 75) (06-07.03.2023)

Information society: technological, economic and technical aspects of formation (issue 76) (03-04.04.2023)

Information society: technological, economic and technical aspects of formation (issue 77) (09-10.05.2023)

Information society: technological, economic and technical aspects of formation (issue 78) (08-09.06.2023)

Information society: technological, economic and technical aspects of formation (issue 79) (06-07.07.2023)

Information society: technological, economic and technical aspects of formation (issue 80) (19-20.09.2023)

Information society: technological, economic and technical aspects of formation (issue 81) (11-12.10.2023)

Information society: technological, economic and technical aspects of formation (issue 82) (9-1.11.2023)

Information society: technological, economic and technical aspects of formation (issue 83) (7-8.12.2023)

Conference 2022

Information society: technological, economic and technical aspects of formation (issue 65) (8-9.02.2022)

Information society: technological, economic and technical aspects of formation (issue 66) (6-7.04.2022)

Information society: technological, economic and technical aspects of formation (issue 67) (11-12.05.2022)

Information society: technological, economic and technical aspects of formation (issue 68) (7-8.06.2022)

Information society: technological, economic and technical aspects of formation (issue 69) (4-5.07.2022)

Information society: technological, economic and technical aspects of formation (issue 70) (22-23.09.2022)

Information society: technological, economic and technical aspects of formation (issue 71) (18-19.10.2022)

Information society: technological, economic and technical aspects of formation (issue 72) (15-16.11.2022)

Information society: technological, economic and technical aspects of formation (issue 73) (08-09.12.2022)

Conference 2021

Information society: technological, economic and technical aspects of formation (Issue 55) (09.02.2021)

Information society: technological, economic and technical aspects of formation (Issue 56) (10.03.2021)

Information society: technological, economic and technical aspects of formation (issue 57) (13.04.2021)

Information society: technological, economic and technical aspects of formation (issue 58) (12.05.2021)

Information society: technological, economic and technical aspects of formation (issue 59) (08.06.2021)

Information society: technological, economic and technical aspects of formation (issue 60) (13.07.2021)

Information society: technological, economic and technical aspects of formation (issue 61) (15.09.2021)

Information society: technological, economic and technical aspects of formation (issue 62) (12.10.2021)

Information society: technological, economic and technical aspects of formation (issue 63) (11.11.2021)

Information society: technological, economic and technical aspects of formation (issue 64) (10.12.2021)

Congratulation from Internet Conference!

Рік заснування видання - 2011

НАЛАШТУВАННЯ ПАРАМЕТРІВ ГЛИБОКИХ НЕЙРОННИХ МЕРЕЖ ЗА ДОПОМОГОЮ ЕВОЛЮЦІЙНИХ АЛГОРИТМІВ

Another articles in this section