МАСШТАБУВАННЯ ЗОБРАЖЕНЬ ЗАСОБАМИ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ ІЗ АРХІТЕКТУРОЮ СУПЕР-РОЗДІЛЬНОЇ ЗДАТНОСТІ

12.06.2024 23:45

[1. Information systems and technologies]

Author: Баловсяк Сергій Васильович, доктор технічних наук, доцент, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці; Гнатюк Юрій Анатолійович, аспірант, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці

ORCID: 0000-0002-3253-9006 Баловсяк С.В.

ORCID: 0009-0006-5605-9281 Гнатюк Ю.А.

У сучасних телекомунікаційних та комп’ютерних системах поширеним завданням є масштабування цифрових зображень [1]. Зменшення масштабу зображень виконується, наприклад, перед їх передаванням через канали зв’язку телекомунікаційної системи, при збереженні зображень у різноманітних інтернет-сервісах та сховищах. Завдання збільшення масштабу зображень виникає при обробці зображень, отриманих з низькою роздільною здатністю. Завдяки збільшенню масштабу зображень можливо підвищити точність їх комп’ютерної обробки та забезпечити кращу візуалізацію таких зображень.

Проте, існуючі алгоритми масштабування зображень, зокрема, найближчого сусіда, білінійної та бікубічної інтерполяції, призводять до певних спотворень зображень та їх розмиття. Одним з ефективних засобів масштабування зображень, який забезпечує їх високу візуальну якість, є штучні нейронні мережі (ШНМ). Тому в роботі для масштабування зображень використано ШНМ, а саме згорткові нейронні мережі (ЗНМ), структура яких пристосована для обробки зображень.

Масштабування зображень виконано ЗНМ із архітектурою супер-роздільної здатності (Super-Resolution Convolutional Neural Network – SRCNN) [2], яка спеціально розроблена для підвищення роздільної якості зображень із збереженням їх візуальної якості. В архітектурі SRCNN у найпростішому випадку застосовується 3 згорткових шари з відповідними ядрами згортки W (рис. 1). Навчання SRCNN виконується методом зворотного поширення помилки на зображеннях навчальної (train) вибірки, а застосування контрольної (valid) вибірки не допускає перенавчання нейромережі. Навчальна вибірка містить множину з Q_NT зображень F_T розміром M₀ × N₀ пікселів (зображень у початковому масштабі), які є правильними виходами ЗНМ. Контрольна вибірка містить множину з Q_NV зображень з таким самим розміром. Структура SRCNN дозволяє обробку зображень у відтінках сірого та кольорових зображень (для 3 каналів кольору).

На входи ЗНМ подаються зображення G_X, у виходами мережі є зображення G_Y (рис. 1). Для спрощення будови ЗНМ розміри зображень G_X та G_Y встановлюються однаковими (M_T × N_T пікселів, наприклад, M_T = N_T = 64 пікселі). Тому початкові зображення F_T розділяються на вікна (тайли) у вигляді локальних областей (фрагментів) S_T прямокутної форми розміром M_T × N_T пікселів.

Рис. 1. Схема навчання ЗНМ з архітектурою SRCNN, призначеної для масштабування зображень

Похибка навчання мережі оцінюється як корінь середньої квадратичної похибки Rmse (Root Mean Square Error) через різницю виходів мережі G_Y та правильних виходів S_T. Локальні вікна S_Tперекриваються між собою на Δ_X пікселів за шириною та Δ_Y пікселів за висотою (Δ_X = Δ_Y = 2 пікселі), що дозволяє уникати крайових ефектів на межах вікон. Оскільки нейронна мережа повинна збільшувати масштаб зображень, тому на основі зображень S_T розміром методами інтерполяції обчислюються зображення S_X розміром M_X × N_X пікселів (у зменшеному масштабі). Масштаб зображень зменшується у S_C разів (наприклад, S_C = 2), тобто M_X= [M_T/S_C], N_X = [N_T/S_C]. Тому для обчислення зображення G_X на основі зображення у зменшеному масштабі S_X використовується блок інтерполяції, в якому з використанням білінійної або бікубічної інтерполяції розмір зображення збільшується в S_С разів.

Масштабування зображень з використанням SRCNN реалізовано в програмі на мові Python. Інтерполяція зображень методами білінійної та бікубічної інтерполяції виконується функціями бібліотеки cv2, ЗНМ реалізована засобами бібліотеки tensorflow. Після навчання ЗНМ використовується для масштабування зображень F_X (розміром M₂ × N₂ пікселів). Такі зображення F_X розділяються на вікна S_X розміром M_X × N_X пікселів, які шляхом інтерполяції перетворюються у вхідні зображення G_X для нейронної мережі. На виходах ЗНМ отримуються вихідні зображення G_Y, з яких як з плиток складається зображення-результат F_Y у збільшеному масштабі.

Навчена ЗНМ дає змогу обчислювати зображення F_Y з вищою візуальною якістю, ніж методи інтерполяції. Якість масштабованих зображень на виході ЗНМ можливо підвищити за рахунок тривалого навчання мережі та збільшення розмірів навчальної й контрольної вибірок.

Література

1. Geron A. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow /A. Geron. - O'Reilly Media, Inc., 2019. – 510 p.

2. Super-Resolution Convolutional Neural Network. URL: https://goodboychan.github.io/python/deep_learning/vision/tensorflow-keras/2020/10/13/01-Super-Resolution-CNN.html#google_vignette

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Another articles in this section

Сonferences

Conference 2026

Information society: technological, economic and technical aspects of formation (issue 106) (15-16.01.2026)

Information society: technological, economic and technical aspects of formation (issue 107) (10-11.02.2026)

Information society: technological, economic and technical aspects of formation (issue 108) (5-6.03.2026)

Conference 2025

Information society: technological, economic and technical aspects of formation (issue 95) (16-17.01.2025)

Information society: technological, economic and technical aspects of formation (issue 96) (11-12.02.2025)

Information society: technological, economic and technical aspects of formation (issue 97) (13-14.03.2025)

Information society: technological, economic and technical aspects of formation (issue 98) (15-16.04.2025)

Information society: technological, economic and technical aspects of formation (issue 99) (14-15.05.2025)

Information society: technological, economic and technical aspects of formation (issue 100) (11-12.06.2025)

Information society: technological, economic and technical aspects of formation (issue 101) (09-10.07.2025)

Information society: technological, economic and technical aspects of formation (issue 102) (16-17.09.2025)

Information society: technological, economic and technical aspects of formation (issue 103) (14-15.10.2025)

Information society: technological, economic and technical aspects of formation (issue 104) (13-14.11.2025)

Information society: technological, economic and technical aspects of formation (issue 105) (11-12.12.2025)

Conference 2024

Information society: technological, economic and technical aspects of formation (issue 84) (18-19.01.2024)

Information society: technological, economic and technical aspects of formation (issue 85) (15-16.02.2024)

Information society: technological, economic and technical aspects of formation (issue 86) (12-13.03.2024)

Information society: technological, economic and technical aspects of formation (issue 87) (11-12.04.2024)

Information society: technological, economic and technical aspects of formation (issue 88) (14-15.05.2024)

Information society: technological, economic and technical aspects of formation (issue 89) (12-13.06.2024)

Information society: technological, economic and technical aspects of formation (issue 90) (9-10.07.2024)

Information society: technological, economic and technical aspects of formation (issue 91) (10-11.09.2024)

Information society: technological, economic and technical aspects of formation (issue 92) (8-9.10.2024)

Information society: technological, economic and technical aspects of formation (issue 93) (12-13.11.2024)

Information society: technological, economic and technical aspects of formation (issue 94) (11-12.12.2024)

Conference 2023

Information society: technological, economic and technical aspects of formation (issue 74) (06-07.02.2023)

Information society: technological, economic and technical aspects of formation (issue 75) (06-07.03.2023)

Information society: technological, economic and technical aspects of formation (issue 76) (03-04.04.2023)

Information society: technological, economic and technical aspects of formation (issue 77) (09-10.05.2023)

Information society: technological, economic and technical aspects of formation (issue 78) (08-09.06.2023)

Information society: technological, economic and technical aspects of formation (issue 79) (06-07.07.2023)

Information society: technological, economic and technical aspects of formation (issue 80) (19-20.09.2023)

Information society: technological, economic and technical aspects of formation (issue 81) (11-12.10.2023)

Information society: technological, economic and technical aspects of formation (issue 82) (9-1.11.2023)

Information society: technological, economic and technical aspects of formation (issue 83) (7-8.12.2023)

Conference 2022

Information society: technological, economic and technical aspects of formation (issue 65) (8-9.02.2022)

Information society: technological, economic and technical aspects of formation (issue 66) (6-7.04.2022)

Information society: technological, economic and technical aspects of formation (issue 67) (11-12.05.2022)

Information society: technological, economic and technical aspects of formation (issue 68) (7-8.06.2022)

Information society: technological, economic and technical aspects of formation (issue 69) (4-5.07.2022)

Information society: technological, economic and technical aspects of formation (issue 70) (22-23.09.2022)

Information society: technological, economic and technical aspects of formation (issue 71) (18-19.10.2022)

Information society: technological, economic and technical aspects of formation (issue 72) (15-16.11.2022)

Information society: technological, economic and technical aspects of formation (issue 73) (08-09.12.2022)

Conference 2021

Information society: technological, economic and technical aspects of formation (Issue 55) (09.02.2021)

Information society: technological, economic and technical aspects of formation (Issue 56) (10.03.2021)

Information society: technological, economic and technical aspects of formation (issue 57) (13.04.2021)

Information society: technological, economic and technical aspects of formation (issue 58) (12.05.2021)

Information society: technological, economic and technical aspects of formation (issue 59) (08.06.2021)

Information society: technological, economic and technical aspects of formation (issue 60) (13.07.2021)

Information society: technological, economic and technical aspects of formation (issue 61) (15.09.2021)

Information society: technological, economic and technical aspects of formation (issue 62) (12.10.2021)

Information society: technological, economic and technical aspects of formation (issue 63) (11.11.2021)

Information society: technological, economic and technical aspects of formation (issue 64) (10.12.2021)

Congratulation from Internet Conference!

Рік заснування видання - 2011

МАСШТАБУВАННЯ ЗОБРАЖЕНЬ ЗАСОБАМИ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ ІЗ АРХІТЕКТУРОЮ СУПЕР-РОЗДІЛЬНОЇ ЗДАТНОСТІ

Another articles in this section