КЛАСТЕРИЗАЦІЯ ОБ’ЄКТІВ

11.12.2021 11:37

[1. Інформаційні системи і технології]

Автор: Микитась А.О., студент, «Комп’ютерна інженерія та управління», Харківський національний університет радіоелектроніки; Скрипка Я.В., студент, «Комп’ютерна інженерія та управління», Харківський національний університет радіоелектроніки; Кононенко О.М., студент, «Комп’ютерна інженерія та управління», Харківський національний університет радіоелектроніки;

Кластеризація (сегментація) – це угруповання об'єктів (спостережень, подій) на основі даних, що описують властивості об'єктів. Об'єкти всередині кластера повинні бути схожими один на одного і відрізнятися від інших, які увійшли до інших кластерів. Таким чином, кластеризація - це процес, в якому необхідно ідентифікувати аналогічну або ідентичну групу даних у наборі даних, та застосування функціональності у цьому наборі даних відповідно до нашого очікуваного висновку відоме як алгоритм кластеризації. В даний час це найпопулярніша методика в галузі науки про дані.

По суті, алгоритм кластеризації поділяється на дві підгрупи:

1. Жорстка кластеризація. У жорсткій кластеризації група подібних об'єктів даних повністю відноситься до аналогічної характеристики або кластеру. Якщо об'єкти даних не схожі на певну умову, об'єкт даних повністю видаляється з набору кластерів.

2. М'яка кластеризація. У м'якій кластеризації розслаблення надається кожному об'єкту даних, який знаходить схожий об'єкт даних єдиної структури на формування кластера. У цьому типі кластеризації унікальний об'єкт даних може бути знайдений у кількох кластерах, встановлених відповідно до їх єдиної структури.

Кожна методологія кластеризації слідує за набором правил, які визначають їх набір подібності між об'єктом даних. Сьогодні на ринку є сотні методологій кластеризації. Отже, розглянемо деякі з них, які є дуже популярними в даний час:

1. Моделі підключення

Судячи з назви, у цьому механізмі алгоритм знаходить найближчий аналогічний об'єкт даних у групі встановлених об'єктів даних, виходячи з уявлення про те, що точки даних знаходяться ближче в просторі даних. Таким чином, об'єкт даних, розташований ближче до аналогічного об'єкта даних, демонструватиме більшу схожість, ніж об'єкт даних, що лежить дуже далеко.

2. Центроїдні моделі

У цьому типі ітераційного алгоритму спочатку береться до уваги певна точка центроїду, потім аналогічний об'єкт даних відповідно до їх близькості щодо цієї точки центроїду встановлюється кластер. Найпопулярніший алгоритм кластеризації K-Means був успішним у цьому типі алгоритму кластеризації. Ще одне зауваження: у моделях центроїдів немає певних кластерів, тому ми маємо аналіз вихідних даних.

3. Моделі розповсюдження

У цьому типі алгоритму метод знаходить, наскільки можливо, щоб кожен елемент даних у кластері належав до одного або того ж розподілу, як гаусовий або нормальний. Одним з недоліків цього алгоритму є те, що в цьому типі кластеризації об'єкт набору даних повинен страждати від перенавчання.

4. Моделі густини

Використовуючи цей алгоритм, набір даних ізолюється щодо різних областей густини даних у просторі даних, а потім об'єкту даних призначаються конкретні кластери.

Отже, у наведеній вище статті було розглянуто, що таке кластеризація, її тип та використання у розробці програмного забезпечення. Використовуючи кластеризацію, можно легко підвищити точність підходу машинного навчання. Тому, беручи до уваги майбутні аспекти, можна сказати, що алгоритм кластеризації використовується майже в кожній технології розробки програмного забезпечення.

Список використаних джерел:

1. Кластеризация [Електронний ресурс]. – 2017. – Режим доступу до ресурсу: https://proginfo.ru/clustering/.

2. Кластеризация [Електронний ресурс] – Режим доступу до ресурсу: https://help.loginom.ru/userguide/processors/datamining/clustering.html.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції

Конференції

Конференції 2026

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 106) (15-16.01.2026)

Конференції 2025

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 95) (16-17.01.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 96) (11-12.02.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 97) (13-14.03.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 98) (15-16.04.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 99) (14-15.05.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 100) (11-12.06.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 101) (09-10.07.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 102) (16-17.09.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 103) (14-15.10.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 104) (13-14.11.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 105) (11-12.12.2025)

Конференції 2024

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 84) (18-19.01.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 85) (15-16.02.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 86) (12-13.03.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 87) (11-12.04.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 88) (14-15.05.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 89) (12-13.06.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 90) (9-10.07.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 91) (10-11.09.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 92) (8-9.10.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 93) (12-13.11.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 94) (11-12.12.2024)

Конференції 2023

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 74) (06-07.02.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 75) (06-07.03.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 76) (03-04.04.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 77) (09-10.05.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 78) (08-09.06.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 79) (06-07.07.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 80) (19-20.09.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 81) (11-12.10.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 82) (9-10.11.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 83) (7-8.12.2023)

Конференції 2022

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 65) (8-9.02.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 66) (6-7.04.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 67) (11-12.05.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 68) (7-8.06.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 69) (4-5.07.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 70) (22-23.09.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 71) (18-19.10.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 72) (15-16.11.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 73) (08-09.12.2022)

Конференції 2021

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 55) (09.02.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 56) (10.03.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 57) (13.04.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 58) (12.05.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 59) (08.06.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 60) (13.07.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 61) (15.09.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 62) (12.10.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 63) (11.11.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 64) (10.12.2021)

Вас вітає Інтернет конференція!

Рік заснування видання - 2011

КЛАСТЕРИЗАЦІЯ ОБ’ЄКТІВ

Інші наукові праці даної секції