ВИЗНАЧЕННЯ КІЛЬКОСТІ КЛАСТЕРІВ З ДОПОМОГОЮ ОПТИМІЗАЦІЇ З ВЕЙВЛЕТ-ПЕРЕТВОРЕННЯМ
15.09.2023 19:35
[1. Інформаційні системи і технології]
Автор: Щербакова Галина Юріївна, доктор технічних наук, професор, Національний університет «Одеська політехніка», Одеса;
Сахно Кирило Олександрович, аспірант, Національний університет «Одеська політехніка», Одеса;
Петрова Світлана Володимирівна, студентка, Національний університет «Одеська політехніка», Одеса
Процедуру кластеризації використовують в багатьох задачах обробки даних вимірів, при обробці зображень (в технічній, медичній діагностиці), при підготовці даних для певних нейронних мереж (НМ) [1]. Наприклад, до таких мереж можна віднести ймовірнісні НМ, які реалізують класифікатор Байеса [1]. Важливою особливістю цих НМ є те, що навчання їх відбувається швидко. Однак кількість нейронів цих НМ визначається кількістю векторів вихідних даних. У випадку великих наборів даних при навчанні така НМ буде мати більш складну структуру та їй потрібно буде більше часу для прийняття діагностичного рішення. Спростити структуру такої НМ дозволяє процедура кластеризації [1, 2]. В роботі з цією метою пропонується метод кластеризації, який заснований на оптимізації з використанням вейвлет-перетворення [2, 3].
Процедура кластеризації використовує гіпотезу компактності, коли дані одного кластеру зближені, а різних кластерів – рознесені в просторі ознак [1]. Завадостійкість і точність процедури обумовлені властивостями показників оптимальності кількості кластерів [4, 5]. Ці властивості визначаються способами оцінки компактності даних кластерів та відстані між ними. Проведений аналіз існуючих підходів до оцінки кількості кластерів дозволив обрати для кластеризації у випадку кластерів складної форми відому гіпотезу - компактності, яка дозволяє проводити границю між кластерами на основі оцінки змінення локальної щільності розташування даних в просторі ознак [4, 5].
Основні етапи методу визначення кількості кластерів (груп) у даних для класифікації з допомогою ймовірнісної НМ наведені в роботі [4]. Цей метод був перевірений на прикладі оцінки якості паяних з’єднань при монтажі інтегральних схем (ІС) на поверхню. Досліджувались значення відгуку паяних з’єднань на дію імпульсного лазерного випромінювання [4]. Для визначення неякісних паяних з’єднань з допомогою ймовірнісної НМ побудована поверхня, яка розділює в просторі ознак інтегральні схеми з якісними і дефектними паяними з’єднаннями. В якості ознак при розпізнаванні в роботі [4] обрані два: відносне відхилення відгуку на дію лазерного випромінювання еталонної ІС (з якісними паяними з’єднаннями) та досліджуваної ІС -f(t) у часовій області Er=(∫(f(t)-r(t))2 dt)/∫(r(t))2 dt) та перша власна частота вібрації ІС з паяними з’єднаннями. При класифікації по звичайній методиці [1] кожен вектор у просторі ознак відповідає одному нейрону прихованого шару ймовірнісної НМ. Після групування вихідних даних запропонованим методом визначення кількості кластерів з допомогою кластеризації на базі вейвлет-перетворення кількість таких нейронів ймовірнісної НМ скоротилось майже в 3 рази, час класифікації – скоротився більше, ніж в 2,5 рази.
Література
1.Advanced Methods and Deep Learning in Computer Vision / E.R. Davies and Matthew Turk edition. - Elsevier Inc., 2022. – 562 р.– Режим доступу: https://doi.org/10.1016/C2019-0-03221-9.
2.Shcherbakova G., Adaptive Clustering in Hyperbolic Wavelet Domain / G. Shcherbakova, V. Krylov // Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications: 5th IEEE Int. Workshop IDAACS’2009. Rende (Cozenca), Italy, 21-23 sept. 2009.: proceeding. – 2009. – P.400-403.
3.Крилов В.Н., Субградієнтний ітеративний метод оптимізації в просторі вейвлет – перетворення / В.Н. Крилов, Г.Ю. Щербакова // Збірник наук. праць Військ. ін-ту Київського нац. ун-ту ім. Т. Шевченка. - №12. - 2008. - С. 56-60.
4.Shcherbacova, G., The probabilistic neural net neuron’s number calculations / Shcherbacova G., Krylov, V., & Logvinov, O. // International Journal of Computing. - №11(2). – 2014.– P. 137-144. – Режим доступу: https://doi.org/10.47839/ijc.11.2.559.
5.Davies D.L., A cluster separation measure / D.L. Davies, D. W. Bouldin. / IEEE Trans. Pattern Anal. Machine Intell. - №1 (4) - 1979. - P. 224 - 227. PMID: 21868852.