РОЗПІЗНАВАННЯ ЗОБРАЖЕНЬ АВТОМОБІЛІВ ЗА ДОПОМОГОЮ ЗГОРТКОВИХ НЕЙРОННИХ МЕРЕЖ
15.11.2022 22:47
[1. Information systems and technologies]
Author: Одайська Христина Савеліївна, кандидат технічних наук, асистент, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці; Луцяк Олександр Сергійович, студент, Чернівецький національний університет імені Юрія Федьковича, м. Чернівці
Розробка комп’ютерної системи для розпізнавання зображень об’єктів, зокрема, автомобілів, є важливою для практики. Розпізнавання автомобілів на зображеннях дозволяє автоматизувати процес аналізу зображень, що забезпечує менші витрати часу для людини-оператора, підвищує точність і швидкодію обробки зображень. Потреба в апаратно-програмних засобах для розпізнавання зображень автомобілів виникає, наприклад, при побудові комп’ютерних систем відеоспостереження та систем паркування автомобілів. Комп’ютерні засоби для розпізнавання зображень автомобілів, пішоходів та інших об’єктів потенційно можуть забезпечити вищу безпеку дорожнього руху, зокрема, при керуванні безпілотними автомобілями.
Проте, завдання розпізнавання автомобілів є досить складним через зміну зображень об’єктів за рахунок різної відстані до відеокамери, кутів повороту, освітлення, перекривання пішоходами та ін. При розпізнаванні зображень об’єктів досить ефективними є штучні нейронні мережі (ШНМ), а особливо згорткові нейронні мережі (ЗНМ) [1-2]. Суттєвою перевагою ШНМ є можливість навчання за прикладами, тобто за множиною зображень та відповідних їм номерів класів для навчальної вибірки. У випадку розпізнавання зображень автомобілів за допомогою ЗНМ можуть виникати труднощі, які пов’язані з низькою швидкістю навчання ЗНМ та точністю розпізнавання. Тому актуальним завданням є вибір саме такої архітектури ЗНМ, яка б враховувала особливості зображень автомобілів, а відповідно до цього повинні вибиратися кількість і тип шарів, ядра згортки та параметри навчання.
Комп’ютерний аналіз зображень автомобілів можна поділити на етап локалізації автомобіля та етап розпізнавання локалізованої області. Локалізація автомобіля полягає у визначенні розмірів і положення прямокутної ділянки, у якій з найбільшою ймовірністю знаходиться автомобіль (рис. 1). Розпізнавання полягає у визначенні номерних знаків автомобіля, стану фар та ін.
Рис. 1. Приклад локалізації автомобіля на зображенні
Для програмної реалізації ЗНМ використано мову Python, засоби хмарної платформи Google Colab та веб-оболонки Jupyter Notebook, нейромережних бібліотек Tensorflow та Keras. Для побудови ЗНМ використано модифіковану архітектуру LeNet5, яка містить 5 згорткових шарів, 5 шарів підвибірки та 2 повнозв’язних шари. Після навчання на зображеннях, частина з яких містила автомобілі, ЗНМ дозволяє виділяти ділянки зображень з автомобілями. Подальше розпізнавання локалізованих ділянок можливо виконувати за допомогою іншої ЗНМ. Програма для розпізнавання зображень автомобілів також може виконуватися на базі одноплатного компʼютера Raspberry Pі.
Література
1. Шаховська Н. Б. Системи штучного інтелекту: навчальний посібник / Н.Б. Шаховська, Р. М. Камінський, О. Б. Вовк. – Львів : Видавництво Львівської політехніки, 2018. – 392 с.
2. TensorFlow. An end-to-end open source machine learning platform. [Електронний ресурс]. – Режим доступу: https://www.tensorflow.org.