КОМП’ЮТЕРНА СИСТЕМА ДЛЯ ІНТЕЛЕКТУАЛЬНОГО АНАЛІЗУ ЗОБРАЖЕНЬ АВТОМОБІЛІВ
24.09.2021 21:36
[1. Інформаційні системи і технології]
Автор: Конопницький М.О., студент магістрант, кафедра комп'ютерних систем та мереж, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці
Завдання інтелектуального аналізу зображень автомобілів є актуальним, оскільки існує потреба у визначенні завантаженості автостоянок, трафіку на автомобільних транспортних шляхах та ін. Зображення автомобілів на стоянках і шляхах отримуються як за допомогою стаціонарних, так і мобільних відеокамер, розміщених на безпілотних літальних апаратах (БПЛА). Складність аналізу таких зображень автомобілів зумовлена присутністю в кадрі значної кількості додаткових об’єктів (наприклад, пішоходів, дорожньої розмітки), а також спотвореннями зображень за рахунок відблисків, затінення та шумів. Крім цього, при аналізі зображень автомобілів на стоянках або транспортних шляхах важливо не тільки розпізнати зображення автомобілів, але й комплексно обробити їх параметри: проаналізувати розміри і положення автомобілів, коефіцієнт заповнення автостоянки та ін. Тому в даній роботі розроблено програму на мові Python на хмарній платформі Google Colab [1] для інтелектуального аналізу зображень автомобілів, яка виконує бінаризацію та сегментацію зображень, розпізнавання зображень автомобілів і обчислення їх параметрів, кластеризацію та регресійний аналіз отриманих даних [2].
Початкове кольорове зображення зчитується з відеокамери або з веб-сайту як тривимірний масив fRGB(i, k, c), де i = 1, ..., M; k = 1, ..., N; M – висота зображення в пікселях, N – ширина зображення в пікселях, c – номер каналу кольору (Red, Green, Blue) (рис. 1а). Бінаризація зображення полягає у виділенні областей, на яких знаходяться, переважно, автомобілі. Поширені методи бінаризації (наприклад, метод Отсу), при цьому не забезпечують чіткого відділення зображень від фону. Тому в даній роботі запропоновано використовувати два пороги бінаризації: нижній ThL і верхній ThR, які обчислюються на основі ширини WT головного піку гістограми зображення (який відповідає фону); гістограма обчислюється на основі яскравості z зображення або значень його каналів кольору (рис. 1б). Завдяки такій бінаризації, а також за рахунок ерозії та дилатації бінаризованого зображення, забезпечується точніше розпізнавання зображень автомобілів. Сегментація зображення (кольорового або бінаризованого) виконується методом нарощування областей. Далі обчислюються геометричні параметри сегментів і виконується селекція сегментів за їх розмірами. Подальший аналіз полягає в кластеризації параметрів сегментів методом k-середніх, а також у регресійному аналізі взаємопов’язаних параметрів.
Рис. 1. Початкове зображення fRGB (а) та його гістограма h(z) (б)
Розроблена програма на мові Python використовує бібліотеки numpy, matplotlib, skimage та ін. Завдяки використанню гістограми підвищено точність розпізнавання зображень автомобілів та інших об’єктів.
Література:
1. Google Colab. [Electronic resource]. –Access mode: https://colab.research.google.com.
2. Гонсалес Р. Цифровая обработка изображений / Р. Гонсалес, Р. Вудс . – М.: Техносфера, 2005. – 1072 с.