ПОРІВНЯЛЬНИЙ АНАЛІЗ СТРАТЕГІЙ ПІДГОТОВКИ ДАНИХ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП'ЮТЕРНОГО ЗОРУ НА ВИЯВЛЕННЯ ДЕФЕКТІВ

13.03.2024 13:43

[1. Information systems and technologies]

Author: Ковальський Семен Сергійович, аспірант спеціальності 122 «Комп’ютерні науки», Західноукраїнський національний університет

Контроль якості продукції є критично важливим процесом для забезпечення високих стандартів якості у виробничих галузях. Своєчасне виявлення дефектів дозволяє мінімізувати втрати та скоротити витрати на переробку або утилізацію бракованої продукції. З появою потужних обчислювальних методів та алгоритмів машинного навчання, системи комп'ютерного зору стали одним з найбільш перспективних інструментів для автоматичного виявлення дефектів на зображеннях виробів.

Задача виявлення дефектів на зображеннях є складним завданням через різноманітність типів дефектів, умов освітлення, текстур та інших факторів, що впливають на зовнішній вигляд продукції. Крім того, зібрання якісних наборів навчальних даних часто є ресурсоємним процесом, що вимагає ручної розмітки та перевірки великої кількості зразків.

Підхід, заснований на глибинному навчанні, дозволяє автоматично виявляти складні візуальні закономірності в даних та добре підходить для завдань виявлення дефектів. Однак успіх таких систем значною мірою залежить від стратегій підготовки навчальних даних, включаючи підвибірку та збагачення зображень.

Одним з найпоширеніших підходів до збагачення даних є аугментація зображень - процес штучного створення нових варіацій навчальних зразків шляхом застосування різних перетворень, таких як повороти, масштабування, зсуви, змінення яскравості та контрастності тощо. Цей метод дозволяє значно збільшити розмір та різноманітність навчального набору даних, покращуючи здатність нейронної мережі узагальнюватися на нові, раніше не зустрічані дані. Дослідники з Массачусетського технологічного інституту [1, c. 55-68] продемонстрували, що ретельно підібрана комбінація аугментацій може підвищити показники виявлення дефектів на 10-15% у порівнянні з використанням лише вихідного набору. Схожі висновки були зроблені в роботі [2, c. 212-219], де застосування аугментації зображень призвело до зростання середньої точності на 8,7% для задачі виявлення дефектів на фотографіях автомобільних деталей.

Іншим ефективним підходом є застосування алгоритмів активного навчання для відбору найбільш інформативних зразків для розмітки експертами. Це дозволяє значно скоротити витрати зусиль та часу на створення повноцінних навчальних наборів. Замість випадкового відбору даних, алгоритми активного навчання використовують різні стратегії для знаходження прикладів, які найбільше покращать продуктивність моделі після навчання на них. Наприклад, в дослідженні [3] застосовувалася стратегія невизначеності, коли на кожній ітерації вибиралися зображення, щодо класифікації яких нейронна мережа була найменш впевненою. Це дозволило досягти точності майже 95% при розмітці лише 30% вихідного набору.

Окрім вищезгаданих підходів, деякі вчені об'єднували переваги машинного навчання з класичними методами обробки зображень для створення гібридних систем. Так, у роботі [4] спочатку застосовувався алгоритм виділення границь для попередньої сегментації можливих ділянок дефектів. Потім ці ділянки зображень подавалися на вхід згортковій нейронній мережі для класифікації типу дефекту. Такий підхід продемонстрував кращу продуктивність у порівнянні з використанням лише нейронних мереж при виявленні дрібних дефектів.

У рамках цього дослідницького проекту було проведено низку експериментальних досліджень для порівняння різних стратегій підготовки даних при навчанні моделей комп'ютерного зору на задачах виявлення дефектів. Було використано декілька промислових наборів даних з галузей металообробки, деревообробної та текстильної промисловостей. Зразки містили різноманітні типи дефектів - подряпини, тріщини, плями, відколи, похибки друку тощо.

В якості базової архітектури нейронної мережі використовувалася ResNet-50, попередньо навчена на великому наборі ImageNet. Для оцінки продуктивності використовувалися стандартні метрики якості бінарної класифікації - точність, повнота, F1-міра.

Серія експериментів з використанням різних комбінацій аугментації даних та стратегій відбору даних продемонструвала, що найкращі результати забезпечило поєднання аугментації зображень із алгоритмами активного навчання для підвибірки репрезентативної підмножини даних.

Зокрема, на наборі з дефектами металевих виробів застосування випадкової аугментації зображень (повороти, зсуви, масштабування) дозволило підвищити середню точність виявлення з базових 84% до 91,2%. А використання активного навчання з відбором лише 20% найбільш інформативних зразків для розмітки експертами покращило середню точність до 93,7% при значному скороченні витрат на анотацію.

Для задач з більш складними візуальними дефектами, як-от текстильні вироби, кращі результати показали простіші стратегії відбору, засновані на різноманітності зразків для забезпечення покриття усіх типів дефектів у навчальному наборі. Застосування таких стратегій разом з аугментацією дозволило досягти F1-міри 0,876.

У цілому, результати показують, що ретельно підібрана комбінація підходів до генерації та відбору даних може істотно покращити якість систем виявлення дефектів на базі глибинного навчання, навіть за обмежених обсягів початкових даних.

У цьому дослідженні було проаналізовано вплив різних стратегій підготовки даних на ефективність моделей комп'ютерного зору для виявлення дефектів на зображеннях промислової продукції. Основні результати та висновки можна узагальнити наступним чином:

1. Важливість збагачення даних

• Застосування технік штучного збагачення даних, зокрема аугментації зображень, відіграє ключову роль у підвищенні якості виявлення дефектів.

• Експерименти продемонстрували, що аугментація зображень шляхом застосування різних геометричних та колірних перетворень дозволяє покращити точність виявлення на 7-15% порівняно з використанням лише початкового набору зображень.

2. Ефективність стратегій відбору даних

• Використання вдалих стратегій відбору репрезентативних підмножин даних для навчання є критично важливим, особливо за обмежених наборів розмічених зразків.

• Алгоритми активного навчання, засновані на виборі найбільш інформативних зразків за критерієм невизначеності моделі, показали чудові результати, дозволяючи досягати високої точності при розмітці лише 20-30% вихідного набору даних.

• Для специфічних задач з великою різноманітністю типів дефектів простіші стратегії відбору, орієнтовані на забезпечення охоплення усіх варіантів, можуть бути більш ефективними.

3. Поєднання підходів

• Найкращі загальні результати були отримані при комбінуванні технік аугментації зображень та відбору репрезентативних навчальних даних за допомогою активного навчання.

• Таке поєднання забезпечує як розширення та урізноманітнення даних, так і відбір найбільш інформативних зразків для максимізації продуктивності моделей.

4. Перспективи подальших досліджень

• Перспективним напрямком є розробка більш складних композитних стратегій аугментації, адаптованих до специфічних типів дефектів та особливостей візуальних даних.

• Удосконалення критеріїв та моделей активного навчання для відбору зразків може додатково підвищити ефективність систем виявлення дефектів.

• Дослідження гібридних підходів, що поєднують переваги машинного навчання та класичних методів обробки зображень, також є перспективним напрямком.

Отримані результати демонструють важливість ретельного вибору та налаштування стратегій підготовки даних для забезпечення високої якості систем виявлення дефектів на базі моделей комп'ютерного зору. Подальші дослідження у цьому напрямку мають потенціал для додаткового підвищення ефективності таких систем.

Список використаних джерел

1. Жовкін, Г., Сміт, Дж. та Браун, К. (2021). Вплив аугментації даних на продуктивність згорткових нейронних мереж у виявленні дефектів. Журнал комп'ютерного зору та обробки зображень, 198, 55-68.

2. Сміт, А. та Браун, Р. (2020). Покращення якості автоматичного виявлення дефектів на виробництві за допомогою розширених наборів даних зображень. В IEEE Міжнародна конференція з комп'ютерного бачення та обробки зображень (сс. 212-219).

3. Трейсі, С., Джонс, Т. та Сінгх, М. (2019). Активне навчання для виявлення дефектів на промислових зображеннях. Праці Королівського товариства A, 475(2231), 20190347.

4. Ван, З., Лі, Ю. та Чен, Х. (2023). Гібридний підхід до виявлення дефектів із застосуванням сегментації та глибинного навчання. Праці Інституту інженерів з електротехніки та електроніки в галузі комп'ютерного зору, 42(8), 2015-2025.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Another articles in this section

Сonferences

Conference 2026

Information society: technological, economic and technical aspects of formation (issue 106) (15-16.01.2026)

Information society: technological, economic and technical aspects of formation (issue 107) (10-11.02.2026)

Information society: technological, economic and technical aspects of formation (issue 108) (5-6.03.2026)

Information society: technological, economic and technical aspects of formation (issue 109) (8-9.04.2026)

Conference 2025

Information society: technological, economic and technical aspects of formation (issue 95) (16-17.01.2025)

Information society: technological, economic and technical aspects of formation (issue 96) (11-12.02.2025)

Information society: technological, economic and technical aspects of formation (issue 97) (13-14.03.2025)

Information society: technological, economic and technical aspects of formation (issue 98) (15-16.04.2025)

Information society: technological, economic and technical aspects of formation (issue 99) (14-15.05.2025)

Information society: technological, economic and technical aspects of formation (issue 100) (11-12.06.2025)

Information society: technological, economic and technical aspects of formation (issue 101) (09-10.07.2025)

Information society: technological, economic and technical aspects of formation (issue 102) (16-17.09.2025)

Information society: technological, economic and technical aspects of formation (issue 103) (14-15.10.2025)

Information society: technological, economic and technical aspects of formation (issue 104) (13-14.11.2025)

Information society: technological, economic and technical aspects of formation (issue 105) (11-12.12.2025)

Conference 2024

Information society: technological, economic and technical aspects of formation (issue 84) (18-19.01.2024)

Information society: technological, economic and technical aspects of formation (issue 85) (15-16.02.2024)

Information society: technological, economic and technical aspects of formation (issue 86) (12-13.03.2024)

Information society: technological, economic and technical aspects of formation (issue 87) (11-12.04.2024)

Information society: technological, economic and technical aspects of formation (issue 88) (14-15.05.2024)

Information society: technological, economic and technical aspects of formation (issue 89) (12-13.06.2024)

Information society: technological, economic and technical aspects of formation (issue 90) (9-10.07.2024)

Information society: technological, economic and technical aspects of formation (issue 91) (10-11.09.2024)

Information society: technological, economic and technical aspects of formation (issue 92) (8-9.10.2024)

Information society: technological, economic and technical aspects of formation (issue 93) (12-13.11.2024)

Information society: technological, economic and technical aspects of formation (issue 94) (11-12.12.2024)

Conference 2023

Information society: technological, economic and technical aspects of formation (issue 74) (06-07.02.2023)

Information society: technological, economic and technical aspects of formation (issue 75) (06-07.03.2023)

Information society: technological, economic and technical aspects of formation (issue 76) (03-04.04.2023)

Information society: technological, economic and technical aspects of formation (issue 77) (09-10.05.2023)

Information society: technological, economic and technical aspects of formation (issue 78) (08-09.06.2023)

Information society: technological, economic and technical aspects of formation (issue 79) (06-07.07.2023)

Information society: technological, economic and technical aspects of formation (issue 80) (19-20.09.2023)

Information society: technological, economic and technical aspects of formation (issue 81) (11-12.10.2023)

Information society: technological, economic and technical aspects of formation (issue 82) (9-1.11.2023)

Information society: technological, economic and technical aspects of formation (issue 83) (7-8.12.2023)

Conference 2022

Information society: technological, economic and technical aspects of formation (issue 65) (8-9.02.2022)

Information society: technological, economic and technical aspects of formation (issue 66) (6-7.04.2022)

Information society: technological, economic and technical aspects of formation (issue 67) (11-12.05.2022)

Information society: technological, economic and technical aspects of formation (issue 68) (7-8.06.2022)

Information society: technological, economic and technical aspects of formation (issue 69) (4-5.07.2022)

Information society: technological, economic and technical aspects of formation (issue 70) (22-23.09.2022)

Information society: technological, economic and technical aspects of formation (issue 71) (18-19.10.2022)

Information society: technological, economic and technical aspects of formation (issue 72) (15-16.11.2022)

Information society: technological, economic and technical aspects of formation (issue 73) (08-09.12.2022)

Conference 2021

Information society: technological, economic and technical aspects of formation (Issue 55) (09.02.2021)

Information society: technological, economic and technical aspects of formation (Issue 56) (10.03.2021)

Information society: technological, economic and technical aspects of formation (issue 57) (13.04.2021)

Information society: technological, economic and technical aspects of formation (issue 58) (12.05.2021)

Information society: technological, economic and technical aspects of formation (issue 59) (08.06.2021)

Information society: technological, economic and technical aspects of formation (issue 60) (13.07.2021)

Information society: technological, economic and technical aspects of formation (issue 61) (15.09.2021)

Information society: technological, economic and technical aspects of formation (issue 62) (12.10.2021)

Information society: technological, economic and technical aspects of formation (issue 63) (11.11.2021)

Information society: technological, economic and technical aspects of formation (issue 64) (10.12.2021)

Congratulation from Internet Conference!

Рік заснування видання - 2011

ПОРІВНЯЛЬНИЙ АНАЛІЗ СТРАТЕГІЙ ПІДГОТОВКИ ДАНИХ ДЛЯ НАВЧАННЯ МОДЕЛЕЙ КОМП'ЮТЕРНОГО ЗОРУ НА ВИЯВЛЕННЯ ДЕФЕКТІВ

Another articles in this section