РОЗРОБКА ПІДХОДУ ГЕНЕРУВАННЯ ЗОБРАЖЕННЯ НА ОСНОВІ SAGAN

01.12.2022 14:08

[1. Інформаційні системи і технології]

Автор: Панчак Дмитро Вікторович, студент, Західноукраїнський національний університет, м. Тернопіль

Однією з найпоширеніших проблем навчання є «mode collapse». Результатом такої проблеми є те, що генератор завжди синтезує однакові, або майже ідентичні зображення. Це відбувається, зокрема, коли дискримінатор запізнюється з навчанням. В цьому випадку генератор знаходить якесь оптимальне зображення, яке завжди обманює дискримінатора. В результаті, незалежно від вхідного вектора шуму z, генератор буде синтезувати одне і те ж зображення. У зв'язку з цим всі останні дослідження сходяться на думці, що дискримінатора потрібно навчати швидше, ніж генератора. Це інтуїтивно зрозуміло, оскільки мережу розпізнавання спочатку потрібно навчити деяким шаблонам, перш ніж попросити розпізнати згенеровані зображення. Це міркування призвело до введення правила TTUR (two time-scale update). У статті Martin Heusel наводяться докази впливу такого підходу на зближення до точки рівноваги по Не-шу мінімакс гри дискримінатора і генератора

В основі мережі лежать три основні модулі – модуль «self-attention», модуль-генератор і модуль-дискримінатор. «self-attention» включається в якості додаткового шару, як в генераторі, так і в дискримінаторі. Самі модулі дискримінатора і генератора побудовані на основі глибоких згорткових мереж з тією різницею, що генератор використовує зворотні згорткові шари. Аналогічним чином для підвищення стійкості тренування, після кожного згортувального шару використовувався шар пакетної нормалізації.

Архітектура мережі зображена нижче на рисунку 1

Рис. 1 Схема мережі в реалізації SAGAN

Як видно з малюнка, мережі практично симетричні.

Додаткові механізми оптимізації:

1. Згладжування міток при розрахунку значення помилки навчання (наприклад, замість 1 буде використовуватися випадкове число з сегмента [0.8,1]), що мінімізує обнулення градієнта для генератора, тобто стабілізує процес навчання. У багатьох роботах радять використовувати згладжування з одного боку.

2. Замість «pooling» шарів використовувалися конвуляційні з зрушенням (Alec Radford, 2016)

3. Була використана нормалізація партіями для генератора (такий підхід характерний для мережі SAGAN.), а також функція активації Relu для генератора і LeakyRelu для дискримінатора.

4. Використання оптимізатора Adam.

Література

1. A. P. Parikh, O. Täckström, D. Das, and J. Uszkoreit, “A decomposable attention model for natural language inference,” in EMNLP, 2016. 51, 52

2. J. Cheng, L. Dong, and M. Lapata, “Long short-term memory-networks for machine reading,” in EMNLP, 2016.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції

ЗАСТОСУВАННЯ СУЧАСНИХ АЛГОРИТМІВ ДИНАМІЧНОГО ПОШУКУ В СКЛАДНИХ ІНФОРМАЦІЙНИХ СИСТЕМАХ
29.11.2022 03:05
СИСТЕМА ДОМАШНЬОГО АВТОМАТИЗУВАННЯ
29.11.2022 02:54
ТЕХНОЛОГІЇ «E-LEARNING» В СУЧАСНІЙ ОСВІТІ
29.11.2022 02:47
ВИМОГИ СТВОРЕННЯ SMART КУРСУ ЗМІШАНОГО НАВЧАННЯ
11.12.2022 00:24
МЕТОД ВИКОРИСТАННЯ ШАБЛОНУ КУРСУ ЗМІШАНОГО НАВЧАННЯ
11.12.2022 00:16

Конференції

Конференції 2024

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 84) (18-19.01.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 85) (15-16.02.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 86) (12-13.03.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 87) (11-12.04.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 88) (14-15.05.2024)

Конференції 2023

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 74) (06-07.02.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 75) (06-07.03.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 76) (03-04.04.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 77) (09-10.05.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 78) (08-09.06.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 79) (06-07.07.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 80) (19-20.09.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 81) (11-12.10.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 82) (9-10.11.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 83) (7-8.12.2023)

Конференції 2022

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 65) (8-9.02.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 66) (6-7.04.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 67) (11-12.05.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 68) (7-8.06.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 69) (4-5.07.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 70) (22-23.09.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 71) (18-19.10.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 72) (15-16.11.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 73) (08-09.12.2022)

Конференції 2021

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 55) (09.02.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 56) (10.03.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 57) (13.04.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 58) (12.05.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 59) (08.06.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 60) (13.07.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 61) (15.09.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 62) (12.10.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 63) (11.11.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 64) (10.12.2021)

Вас вітає Інтернет конференція!

Рік заснування видання - 2011

РОЗРОБКА ПІДХОДУ ГЕНЕРУВАННЯ ЗОБРАЖЕННЯ НА ОСНОВІ SAGAN

Інші наукові праці даної секції