МАСШТАБУВАННЯ ЗОБРАЖЕНЬ ЗАСОБАМИ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ ІЗ АРХІТЕКТУРОЮ СУПЕР-РОЗДІЛЬНОЇ ЗДАТНОСТІ

12.06.2024 23:45

[1. Інформаційні системи і технології]

Автор: Баловсяк Сергій Васильович, доктор технічних наук, доцент, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці; Гнатюк Юрій Анатолійович, аспірант, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці

ORCID: 0000-0002-3253-9006 Баловсяк С.В.

ORCID: 0009-0006-5605-9281 Гнатюк Ю.А.

У сучасних телекомунікаційних та комп’ютерних системах поширеним завданням є масштабування цифрових зображень [1]. Зменшення масштабу зображень виконується, наприклад, перед їх передаванням через канали зв’язку телекомунікаційної системи, при збереженні зображень у різноманітних інтернет-сервісах та сховищах. Завдання збільшення масштабу зображень виникає при обробці зображень, отриманих з низькою роздільною здатністю. Завдяки збільшенню масштабу зображень можливо підвищити точність їх комп’ютерної обробки та забезпечити кращу візуалізацію таких зображень.

Проте, існуючі алгоритми масштабування зображень, зокрема, найближчого сусіда, білінійної та бікубічної інтерполяції, призводять до певних спотворень зображень та їх розмиття. Одним з ефективних засобів масштабування зображень, який забезпечує їх високу візуальну якість, є штучні нейронні мережі (ШНМ). Тому в роботі для масштабування зображень використано ШНМ, а саме згорткові нейронні мережі (ЗНМ), структура яких пристосована для обробки зображень.

Масштабування зображень виконано ЗНМ із архітектурою супер-роздільної здатності (Super-Resolution Convolutional Neural Network – SRCNN) [2], яка спеціально розроблена для підвищення роздільної якості зображень із збереженням їх візуальної якості. В архітектурі SRCNN у найпростішому випадку застосовується 3 згорткових шари з відповідними ядрами згортки W (рис. 1). Навчання SRCNN виконується методом зворотного поширення помилки на зображеннях навчальної (train) вибірки, а застосування контрольної (valid) вибірки не допускає перенавчання нейромережі. Навчальна вибірка містить множину з Q_NT зображень F_T розміром M₀ × N₀ пікселів (зображень у початковому масштабі), які є правильними виходами ЗНМ. Контрольна вибірка містить множину з Q_NV зображень з таким самим розміром. Структура SRCNN дозволяє обробку зображень у відтінках сірого та кольорових зображень (для 3 каналів кольору).

На входи ЗНМ подаються зображення G_X, у виходами мережі є зображення G_Y (рис. 1). Для спрощення будови ЗНМ розміри зображень G_X та G_Y встановлюються однаковими (M_T × N_T пікселів, наприклад, M_T = N_T = 64 пікселі). Тому початкові зображення F_T розділяються на вікна (тайли) у вигляді локальних областей (фрагментів) S_T прямокутної форми розміром M_T × N_T пікселів.

Рис. 1. Схема навчання ЗНМ з архітектурою SRCNN, призначеної для масштабування зображень

Похибка навчання мережі оцінюється як корінь середньої квадратичної похибки Rmse (Root Mean Square Error) через різницю виходів мережі G_Y та правильних виходів S_T. Локальні вікна S_Tперекриваються між собою на Δ_X пікселів за шириною та Δ_Y пікселів за висотою (Δ_X = Δ_Y = 2 пікселі), що дозволяє уникати крайових ефектів на межах вікон. Оскільки нейронна мережа повинна збільшувати масштаб зображень, тому на основі зображень S_T розміром методами інтерполяції обчислюються зображення S_X розміром M_X × N_X пікселів (у зменшеному масштабі). Масштаб зображень зменшується у S_C разів (наприклад, S_C = 2), тобто M_X= [M_T/S_C], N_X = [N_T/S_C]. Тому для обчислення зображення G_X на основі зображення у зменшеному масштабі S_X використовується блок інтерполяції, в якому з використанням білінійної або бікубічної інтерполяції розмір зображення збільшується в S_С разів.

Масштабування зображень з використанням SRCNN реалізовано в програмі на мові Python. Інтерполяція зображень методами білінійної та бікубічної інтерполяції виконується функціями бібліотеки cv2, ЗНМ реалізована засобами бібліотеки tensorflow. Після навчання ЗНМ використовується для масштабування зображень F_X (розміром M₂ × N₂ пікселів). Такі зображення F_X розділяються на вікна S_X розміром M_X × N_X пікселів, які шляхом інтерполяції перетворюються у вхідні зображення G_X для нейронної мережі. На виходах ЗНМ отримуються вихідні зображення G_Y, з яких як з плиток складається зображення-результат F_Y у збільшеному масштабі.

Навчена ЗНМ дає змогу обчислювати зображення F_Y з вищою візуальною якістю, ніж методи інтерполяції. Якість масштабованих зображень на виході ЗНМ можливо підвищити за рахунок тривалого навчання мережі та збільшення розмірів навчальної й контрольної вибірок.

Література

1. Geron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow /A. Geron. - O'Reilly Media, Inc., 2019. – 510 p.

2. Super-Resolution Convolutional Neural Network. URL: https://goodboychan.github.io/python/deep_learning/vision/tensorflow-keras/2020/10/13/01-Super-Resolution-CNN.html#google_vignette

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції

Конференції

Конференції 2025

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 95) (16-17.01.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 96) (11-12.02.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 97) (13-14.03.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 98) (15-16.04.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 99) (14-15.05.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 100) (11-12.06.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 101) (09-10.07.2025)

Конференції 2024

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 84) (18-19.01.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 85) (15-16.02.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 86) (12-13.03.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 87) (11-12.04.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 88) (14-15.05.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 89) (12-13.06.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 90) (9-10.07.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 91) (10-11.09.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 92) (8-9.10.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 93) (12-13.11.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 94) (11-12.12.2024)

Конференції 2023

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 74) (06-07.02.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 75) (06-07.03.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 76) (03-04.04.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 77) (09-10.05.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 78) (08-09.06.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 79) (06-07.07.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 80) (19-20.09.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 81) (11-12.10.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 82) (9-10.11.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 83) (7-8.12.2023)

Конференції 2022

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 65) (8-9.02.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 66) (6-7.04.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 67) (11-12.05.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 68) (7-8.06.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 69) (4-5.07.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 70) (22-23.09.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 71) (18-19.10.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 72) (15-16.11.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 73) (08-09.12.2022)

Конференції 2021

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 55) (09.02.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 56) (10.03.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 57) (13.04.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 58) (12.05.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 59) (08.06.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 60) (13.07.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 61) (15.09.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 62) (12.10.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 63) (11.11.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 64) (10.12.2021)

Вас вітає Інтернет конференція!

Рік заснування видання - 2011

МАСШТАБУВАННЯ ЗОБРАЖЕНЬ ЗАСОБАМИ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ ІЗ АРХІТЕКТУРОЮ СУПЕР-РОЗДІЛЬНОЇ ЗДАТНОСТІ

Інші наукові праці даної секції