КЛАСТЕРНИЙ АНАЛІЗ ПАРАМЕТРІВ ЗАЛІЗНИЧНИХ ДІЛЬНИЦЬ - Научное сообщество

Вас приветствует Интернет конференция!

Приветствуйем на нашем сайте

Рік заснування видання - 2011

КЛАСТЕРНИЙ АНАЛІЗ ПАРАМЕТРІВ ЗАЛІЗНИЧНИХ ДІЛЬНИЦЬ

21.10.2021 23:35

[1. Информационные системы и технологии]

Автор: Томаш В.В., к.п.н., кафедра професійної та технологічної освіти і загальної фізики, Чернівецький національний університет імені Юрія Федьковича


На сьогоднішній день існує потреба у розробці інформаційних систем для аналізу параметрів залізничних дільниць. При цьому важливо максимально автоматизувати як процес отримання даних про залізничні дільниці, так і сам процес їх аналізу та контролю. Дані про стан залізничних дільниць зчитуються з сенсорів або з таблиць на офіційному сайті Укрзалізниці. Такі дані про залізничні дільниці можуть використовуватися для наступної обробки. Проте, при аналізі даних виникають складнощі через їх значний об’єм та взаємозв’язки між різними характеристиками залізничних дільниць. Аналіз таких даних у ручному режимі є досить трудомістким і вимагає високої кваліфікації виконавця. Ще одним недоліком аналізу даних у ручному режимі є значна суб’єктивність такого підходу. Тому з метою зменшення трудомісткості аналізу та підвищення його точності у даній роботі запропонованого проводити аналіз характеристик залізничних дільниць методом кластеризації. 

Кластеризацію параметрів залізничних дільниць, зокрема, їх довжини та вантажонапруженості, виконано методом k-середніх [1]. Така обробка дозволяє об’єднувати подібні за вибраними параметрами дільниці у кластери і робити висновки про ефективність роботи дільниць (рис. 1). Аналіз параметрів дільниць реалізовано на мові Python з використанням відкритих бібліотек Pandas, Sklearn та бази даних SQLite засобами хмарної платформи Google Colab. Таку обробку даних також можливо реалізувати апаратно засобами мікрокомп’ютера Raspberry Pi 3 B+.




Рис. 1. Спрощений приклад кластеризації залізничних дільниць за їх параметрами «довжина» та «вантажонапруженість»; 8 дільниць об’єднано в 3 кластери 

У наведеному прикладі (рис. 1) кластери не перетинаються, проте при аналізі вибірок даних значних розмірів (сотні об’єктів) деякі об’єкти розміщуються на межах кластерів. У такому випадку доцільно застосовувати кластери, що перекриваються, а степінь належності об’єкта з номером i до кластера з номером k описувати нечіткою функцією належності μk (d), де d – відстань від об’єкта i до центра кластера k. Для кожного кластера k введено лінгвістичну змінну «Степінь належності до кластера k» (з термами «низька», «середня», «висока»), яка описується носієм хk нечіткої множини (відстанню d від об’єкта до центра кластера) [2]. Аналогічно введено лінгвістичну змінну «Вантажонапруженість дільниці» (з такими ж термами), яка описується носієм z. З використанням вищеописаних лінгвістичних змінних розроблено нечітку базу знань Мамдані, на основі якої виконується нечітке логічне виведення. Це дозволяє, зокрема, оцінювати вантажонапруженість дільниць. 

Література:

1. Черняк О.І. Інтелектуальний аналіз даних: Підручник / О.І. Черняк, П.В. Захарченко. – Київський національний університет ім. Т. Шевченка. – К. : Знання, 2014. – 599 с.

2. Борисов В. В. Нечеткие модели и сети / В. В. Борисов, В. В. Круглов, А. С. Федулов. – М.: Горячая линия – Телеком, 2007. – 284 с.



Creative Commons Attribution Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License
допомога Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter
Конференции

Конференции 2024

Конференции 2023

Конференции 2022

Конференции 2021



Міжнародна інтернет-конференція з економіки, інформаційних систем і технологій, психології та педагогіки

Наукова спільнота - інтернет конференції

:: LEX-LINE :: Юридична лінія

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення