Вас вітає Наукова спільнота!

Вітаємо на нашому сайті

АЛГОРИТМИ РОБОТИ ДЛЯ ОБРОБКИ ЗОБРАЖЕНЬ З ВИКОРИСТАННЯМ МАШИННОГО НАВЧАННЯ

01.09.2021 21:37

[1. Інформаційні системи і технології]

Автор: Гура В.Т., кафедра радіоелектронних та комп’ютерних систем, Львівський національний університет імені Івана Франка, факультет електроніки та комп’ютерних технологій, м. Львів


Зображення завжди відігравали важливу роль у житті людини, оскільки зір, мабуть, є найважливішим відчуттям людини. Як наслідок, область обробки зображень має безліч застосувань (медичних, військових тощо). За такої великої кількості зображень традиційні методи обробки зображень мають вирішувати складніші проблеми та стикатися з їх адаптованістю відповідно до людського бачення. Зі складністю зору машинне навчання стало ключовим компонентом програм комп’ютерного зору, коли потрібна адаптація (наприклад, розпізнавання обличчя). 

Розпізнавання обличчя та транспортних засобів

У своїй роботі «Розпізнавання обличь за допомогою лінійних проекцій, заснованих на класифікації» Дж. Голдбергер та М. Бутман пропонують алгоритм розпізнавання обличь, заснований на лінійній проекції підпростору з аналізом компонентів сусідства та критерієм продуктивності для отримання оптимальної лінійної проекції.

У своїй роботі під назвою "Вивчення ядра гістограми місцевих фаз Габора для розпізнавання обличчя", Б. Чжан запропонував алгоритм розпізнавання обличь, заснований на методі Даугмана для розпізнавання райдужної оболонки і локального оператора шаблону XOR, поряд з аналізом дискримінанта ядра.

У статті під назвою "Виявлення обличчя на основі надійних місцевих особливостей та статистично-структурного підходу до навчання" І. Дефе та Д. Чжун пропонують основу для уніфікації статистичної та структурної інформації для пошуку зразків на основі локальних наборів ознак.

У своїй роботі "DOOMRED: нова техніка оптимізації посилених каскадних детекторів на примусовому навчальному наборі" К. Лі та Д. Парк пропонують новий метод оптимізації повністю навченого підсиленого каскадного детектора на примусовому навчальному наборі. 

У наступній роботі "Каскад посилених генеративних та дискримінаційних класифікаторів для виявлення транспортних засобів" П. Негрі та співавтори  запропонувати алгоритм вирішення проблеми виявлення бортового зору за допомогою каскаду посилених класифікаторів.

DOOMRED:

• Явне правило оптимізації, гарантоване математичними дослідженнями,

• Менший час оптимізації, ніж час повторного тренування,

• Низький показник хибнопозитивних даних при збереженні.

Розпізнавання обличь за допомогою лінійних проекцій, заснованих на класифікації:

• Характеризується невеликим розміром вибірки з однієї сторони і велика розмірність зразка з іншої.

• Оптимізація критерій поточних методів підпростору явно не пов'язанні до цілі класифікації, що призводить до потреби в додатковій процедурі навчання, яка повинна знайти відповідну функцію відстані у перетвореному підпросторі

• Оптимальне перетворення вибраний таким чином, що використання евклідової відстані в перетвореному просторі дає оптимальні результати класифікації.

• Методи підпростору збільшують складність алгоритму, що призводить до збільшення часу навчання.

Обробка зображень та багатогранників (manifold) 

У своїй роботі "Метричний багатовимірний підхід до нелінійного різноманітного навчання на основі масштабування для неконтрольованого скорочення даних", Крістоф Генріх  запропонувати нелінійне розширення аналізу основних компонентів для багатовимірного навчання, яке використовує стиснення та регресію разом із процедурою Баєса для проекції для розширення поза вибіркою.

У своїй роботі "Адаптивно прискорений метод розмивання байєсівських розчинок з ентропією" М. К. Сінгх та співавтори запропонувати метод розмивання зображення, який використовує мультиплікативний термін корекції і розрахований за допомогою показника ступеня коефіцієнта корекції.

У статті, озаглавленій "Ітеративні алгоритми оцінки, що використовують нижню межу спряженої функції та мінімізацію-максимізацію із застосуванням у шумоподавлення зображення", Г. Денг та В. Нг запропонував узагальнений алгоритм для шумоподавлення зображення вейвлет-домену шляхом вирішення задач оцінки відображення за лінійною моделлю спостереження Гауса.

У наступній роботі під назвою "Практичний підхід для одночасної оцінки положення джерела світла, структури сцени та відновлення бліків за допомогою фотометричних спостережень" С. Шарма та М. Джоші пропонують алгоритм для фотометричного стерео, який забезпечує положення джерела світла та структуру сцени, і виконує реставрацію бліків за даними спостережень.

Мультирезолюція та багаторесурсний аналіз 

У своїй роботі "Навчаючись витягувати з текстурних зображень особливості, інваріантні до обертання та інваріантні масштабу", Хав'єр Монтойя та співавтори запропонували систему розпізнавання текстур на основі керованого розкладання піраміди та оптимального шляху розпізнавання лісів. 

У наступній роботі "Параметризація зображень з роздільною здатністю для поліпшення класифікації текстур" Л. Шайн та І. Кононенко представляють автоматичну параметризацію зображення з різними роздільними здатностями на основі опису текстури зі спеціальними правилами асоціації та оцінки зображень методами машинного навчання.

У своїй роботі "Аналіз багатопотокових зображень за допомогою спільної кластеризації" Г. Форестьє та співавтори. запропонували спільну систему кластеризації зображень шляхом отримання консенсусу між кількома кластеризаціями, які використовують гетерогенні зображення.

Морфологічна обробка

У своїй роботі під назвою "Неоднорідне укладання для керованої класифікацією сегментації вододілу" І. Левнер та співавтори показують, як розробити автоматизовану систему сегментації, використовуючи автоматичне вилучення об’єктів у поєднанні з неоднорідним складанням для процесу водозбору.

У статті під назвою "Морфологічне перетворення для стиснення зображення" О. Погребняк та ін. представити метод стиснення зображення, заснований на морфологічному асоціативному меморію

Удосконалення таких методів відкривають перспективи для розробки десятки автосистем, що полегшить роботу людині.

Література:

1. Face recognition using classification-based linear projections, J. Goldberger and M. Butman

2. DOOMRED: a new optimization technique for boosted cascade detectors on enforced training set, K. M. Lee and D. W. Park



допомога Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter
Конференції

Конференції 2021