КОНЦЕПТУАЛЬНІ ОСНОВИ ВИРІШЕННЯ ЗАДАЧІ РОЗПІЗНАВАННЯ ОБ'ЄКТІВ НА СУПУТНИКОВИХ ЗНІМКАХ НА ОСНОВІ ГЛИБОКОГО НАВЧАННЯ - Наукові конференції

Вас вітає Інтернет конференція!

Вітаємо на нашому сайті

Рік заснування видання - 2011

КОНЦЕПТУАЛЬНІ ОСНОВИ ВИРІШЕННЯ ЗАДАЧІ РОЗПІЗНАВАННЯ ОБ'ЄКТІВ НА СУПУТНИКОВИХ ЗНІМКАХ НА ОСНОВІ ГЛИБОКОГО НАВЧАННЯ

01.12.2024 13:29

[1. Інформаційні системи і технології]

Автор: Марітчак Сергій Миколайович, магістр, Західноукраїнський національний університет, м. Тернопіль


Сучасні технології спостереження та аналізу зображень з супутникових і аерофотознімків відіграють ключову роль у забезпеченні національної безпеки, моніторингу природних ресурсів, управлінні надзвичайними ситуаціями та інших важливих сферах [1, 2]. У таких випадках точне розпізнавання об’єктів із різними орієнтаціями, розмірами та формами є критично важливим завданням, яке ускладнюється через різноманіття умов спостереження, масштабів зображень та присутність фонового шуму. Однак традиційні методи виявлення об’єктів часто виявляються недостатньо ефективними для задач, що вимагають обробки складних сценаріїв, де об’єкти можуть бути нахилені, частково приховані або мати нестандартні контури.

Для вирішення задачі точного і ефективного розпізнавання об'єктів на супутникових знімках, важливо визначити концептуальні основи, які забезпечать правильний підхід до обробки й аналізу зображень. Розглянемо основні елементи, що становлять основу цього підходу.

1. Використання глибокого навчання для аналізу зображень.

Сучасні моделі глибокого навчання, зокрема CNN [3], забезпечують високу точність у розпізнаванні об’єктів. Глибинне навчання дозволяє моделі автоматично вивчати патерни, характерні для об’єктів різних форм, розмірів та орієнтацій, без необхідності в ручному налаштуванні. Використання моделі YOLO [4] є особливо ефективним для обробки супутникових зображень завдяки її здатності працювати в реальному часі й швидко генерувати обмежувальні рамки для виявлених об’єктів.

2. Інтеграція анкерів для покращення точності розпізнавання.

Анкери дозволяють моделі адаптуватися до об'єктів різного розміру та форми, що особливо важливо для супутникових зображень, де присутні як великі, так і дрібні об’єкти. Під час навчання використовується набір анкерних рамок із різними аспектними співвідношеннями та розмірами, що дозволяє моделі краще "навчитися" знаходити об’єкти, навіть якщо вони мають змінну орієнтацію або є частково перекритими іншими об’єктами.

3. Впровадження кругових плавних міток для орієнтованих об'єктів.

Для підвищення точності виявлення об’єктів, які можуть бути повернуті під різними кутами, використовуються кругові плавні мітки (Circular Smooth Labels, CSL). Вони забезпечують гнучке визначення меж об'єктів, дозволяючи моделі розпізнавати орієнтацію об'єкта, що є критично важливим для обробки супутникових зображень. CSL дають можливість налаштовувати модель таким чином, щоб вона враховувала кути нахилу й дозволяла точніше визначати об'єкти, незалежно від їхньої орієнтації.

4. Модуль C3CS для підвищення точності розпізнавання.

Для покращення здатності моделі виділяти необхідні об'єкти, використовується модуль C3CS, що поєднує просторову та канальну увагу. Канальна увага допомагає моделі сконцентруватися на важливих характеристиках об'єкта, а просторова увага виділяє інформативні області зображення. Завдяки цьому, модель краще справляється з виділенням дрібних об'єктів на тлі великої кількості інших елементів або фонового шуму.

5. Використання інтерполяції та нелінійної активації для підвищення продуктивності.

Для підвищення якості обробки зображень впроваджується бікубічна інтерполяція замість найближчого сусіда, що забезпечує більш плавну й точну обробку зображень під час масштабування. Використання активаційної функції GELU, яка забезпечує плавнішу й менш лінійну реакцію на вхідні сигнали порівняно з ReLU, також сприяє покращенню точності моделі.

6. Оптимізація функцій втрат для підвищення точності моделі.

Функція втрат є ключовим елементом під час навчання моделі. Доцільним є використання спеціалізованих функцій втрат, зокрема об'єктної втрати, втрати класифікації, втрати обмежувальних рамок (box loss) та втрати кута (theta loss). Ці функції допомагають налаштовувати модель на точніше визначення меж об'єктів, їхніх класів та орієнтацій.

7. Підхід до налаштування гіперпараметрів.

Оптимізація гіперпараметрів, таких як початкова швидкість навчання, коефіцієнт інерції, затухання ваг, радіус кругової мітки та кутова мітка, дозволяє підвищити стабільність та ефективність навчання моделі. Заздалегідь налаштовані параметри дозволяють краще узгодити модель із даними і забезпечити її адаптивність до реальних умов роботи.

Отже, концептуальні основи вирішення задачі розпізнавання об'єктів у супутникових знімках зводяться до створення адаптивної, точної та продуктивної моделі, яка використовує анкерні рамки, кругові плавні мітки, модулі просторової і канальної уваги, оптимізовані функції втрат, а також налаштовані гіперпараметри. Такий підхід забезпечує можливість якісного розпізнавання об’єктів різних орієнтацій і розмірів у складних умовах, що робить його корисним для широкого кола практичних завдань.

Література

1. Zotov V. B., Demin S. S., Glazkova I. Y. Features of material flow accounting for the efficient supply chain management. International Journal of Supply Chain Management, 2019. 8.

2. Golovko V., Kroshchanka A., Mikhno E., Komar M., Sachenko A. Deep convolutional neural network for detection of solar panels. Lecture Notes on Data Engineering and Communications Technologies. 2020. 48. 371-389.

3. Mansour A., Hussein W.M., Said E. Small objects detection in satellite images using deep learning. 2019 Ninth International Conference on Intelligent Computing and Information Systems (ICICIS). 2019. 86–91.

4. Pravalika P., Kumar P., Srisaila A. Bridge detection using satellite images. 2023 2nd International Conference on Applied Artificial Intelligence and Computing (ICAAIC). 2023. 1123–1129.

Creative Commons Attribution Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License
допомога Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter
Конференції

Конференції 2025

Конференції 2024

Конференції 2023

Конференції 2022

Конференції 2021



Міжнародна інтернет-конференція з економіки, інформаційних систем і технологій, психології та педагогіки

Наукова спільнота - інтернет конференції

:: LEX-LINE :: Юридична лінія

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення