РОЗРОБКА УНІВЕРСАЛЬНОГО АЛГОРИТМУ СТАБІЛІЗАЦІЇ ЯСКРАВОСТІ ВІДЕОДАНИХ У СИСТЕМАХ ТЕХНІЧНОГО ЗОРУ
02.10.2023 17:42
[1. Информационные системы и технологии]
Автор: Білозерський Владислав Олександрович, аспірант, Національний аерокосмічний університет ім. М.Є. Жуковського «Харківський авіаційний інститут», м. Харків;
Білоус Олександр Олександрович, студент, Національний аерокосмічний університет ім. М.Є. Жуковського «Харківський авіаційний інститут», м. Харків
При вирішенні різноманітного роду завдань виявлення і розпізнавання об'єктів за допомогою відеоспостереження одним із найвпливовіших негативних факторів є мінливість загального рівня яскравості сцени. Вона може коливатися через різні фактори, такі як природні зміни світлових умов, рух об'єктів або робота світлового обладнання. Іншими словами, зміни яскравості відеоданих можна розглядати як випадковий нестаціонарний процес, що містить швидкі (високочастотні) компоненти і складові, що повільно змінюються (низькочастотні), які обумовлені змінами загального рівня освітленості.
При аналізі відеозаписів або відео в реальному масштабі часу необхідно використовувати найбільш універсальний, стійкий та інформативний критерій якості, який дозволяє дати об'єктивну оцінку якості відео за різних умов зйомки та характеру освітленості сцени. Автори вважають, що найбільш доречним та чи не єдиним стійким показником якості є середня яскравість кадру AFB (Average Frame Brightness).
Для розрахунку значення AFB в першу чергу необхідно виконати перетворення колірного простору вихідного кадру з формату RGB в простір HSV (Hue, Saturation, Value), що дозволяє виконувати оцінку середнього рівня яскравості кадру за компонентом яскравості V, який обчислюється як
де V(i,j) – двомірний масив чисел, що визначають яскравість пікселів зображення кадру розміром M×N .
Для повноти аналізу необхідно досліджувати залежність середньої яскравості кадрів AFB від часу, і розрахувати статистичні характеристики цього випадкового процесу (середнє значення за усім інтервалом аналізу чи окремих ділянках відеопослідовності). Для цього було використано універсальний алгоритм просторово-часової обробки відеоданих, що формує з вихідного відео послідовність значень середньої яскравості кадрів AFB (рис. 1).
Рис. 1. Побудова графіків залежності AFB від часу для двох прикладів
На рис. 1 можна побачити вплив високочастотної компоненти шумоподібного характеру, що свідчить про швидку і спонтанну зміну яскравості кадрів відео. ВЧ компоненту слід розглядати як перешкоду, для усунення якої доречно використовувати усереднюючий фільтр зі ковзним вікном. Такий алгоритм працює за принципом буфера, де зберігаються останні дані для усереднення. Це числа, що відповідають середній яскравості кадрів AFB, кількість яких визначена розмірами вікна фільтра та швидкістю зміни кадрів (fps). На кожному кроці фільтрації процедура усереднення даних визначається формулою
де AFBw – одновимірний масив чисел, що становлять послідовність значень середньої яскравості кадрів AFB не більше вікна W фільтра. На кожному новому кроці буфер зсувається, до нього додається нове значення AFBw+1 і забирається найстаріше AFB1, після чого процедура усереднення повторюється.
Результати фільтрації даних про середню яскравість кадрів відеопослідовностей з різними розмірами вікна наведено на рис. 2.
Рис. 2. Застосування усереднюючого фільтра зі ковзним вікном
Як можна побачити, при використанні мінімальної розмірності вікна (T = 1s) ефективність фільтрації вкрай невелика – шумова компонента частково зберігається, а НЧ компонента модулюється середньочастотними змінами. При збільшенні розмірності якість фільтрації помітно підвищується – шумова компонента повністю пригнічується, а вплив середньочастотної компоненти суттєво зменшується.
Отримані результати були використані для стабілізації яскравості кадрів відеопотоку (рис. 3), використовуючи наступний алгоритм:
- середня яскравість фреймів після згладжування НЧ фільтром вибирається як опорне значення AFBfiltr i;
- для кожного кадру відеопотоку визначається різниця значень середньої яскравості вихідного значення AFBi та опорного значення AFBfiltr i з урахуванням знака;
- на базі отриманих прирощень ∆AFBi будується лінійний дискримінатор за правилом:
- if AFBi-AFBfiltr i≥0, то AFBi correction=AFBi - ∆AFBi;
- else AFBi-AFBfiltr i <0, , то AFBi correction=AFBi + ∆AFBi.;
- для всіх значень коригування вводяться обмеження, які не дозволяють пікселям стабілізованого кадру вийти межі діапазону яскравостей [0 … 255].
Рис. 3. Результати стабілізації яскравості відеопотоку
У результаті отримуємо алгоритм стабілізації яскравості відеоданих, який можна використовувати для покращення якості роботи систем технічного зору.
Література
1.Білозерський, В. О., Дергачов, К. Ю. і Краснов, Л. О. (2023) «Аналіз і попередня обробка відеоданих для підвищення якості роботи систем технічного зору», International Scientific Technical Journal "Problems of Control and Informatics", 68(2), с. 50–66. doi: 10.34229/1028-0979-2023-2-4.
2.Dergachov, K. et al. Data pre-processing to increase the quality of optical text recognition systems. Radioelektronni i komp'uterni sistemi – Radioelectronic and computer systems, 2021, no. 4(100), pp. 183-198. doi: 10.32620/reks.2021.4.15.