РОЗРОБКА МЕТОДИКИ АВТОМАТИЗОВАНОГО ЗБОРУ ТА АНАЛІЗУ ДАНИХ OPENSTREETMAP ДЛЯ ПОПЕРЕДЖЕННЯ КІБЕРІНЦИДЕНТІВ У КОМЕРЦІЙНІЙ ЦИФРОВІЙ ІНФРАСТРУКТУРІ - Научное сообщество

Вас приветствует Интернет конференция!

Приветствуйем на нашем сайте

Рік заснування видання - 2011

РОЗРОБКА МЕТОДИКИ АВТОМАТИЗОВАНОГО ЗБОРУ ТА АНАЛІЗУ ДАНИХ OPENSTREETMAP ДЛЯ ПОПЕРЕДЖЕННЯ КІБЕРІНЦИДЕНТІВ У КОМЕРЦІЙНІЙ ЦИФРОВІЙ ІНФРАСТРУКТУРІ

12.12.2025 20:11

[1. Systemy i technologie informacyjne]

Автор: Пітель Богдан Вікторович, здобувач вищої освіти навчально-наукового фізико-технічного інституту, Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського», Україна


ВСТУП

Сучасні комерційні організації дедалі більше залежать від розподіленої цифрової інфраструктури – дата центрів, хмарних платформ, мережевих вузлів, офісів та точок продажу, що підтримують безперервність бізнес процесів і надання послуг клієнтам. Зростання кількості та складності кібератак вимагає використання відкритих джерел розвідувальної інформації (OSINT) і геопросторових даних для підвищення ситуаційної обізнаності та раннього виявлення ризиків. OSINT розглядається як один з ключових інструментів сучасної кібербезпеки, що дозволяє поєднувати дані з відкритих реєстрів, інтернет ресурсів та публічних геоданих [1] [2].

Геопросторові дані, зокрема добровільно надана географічна інформація (VGI), вже використовуються для візуалізації та аналізу кіберзагроз, виявлення патернів атак і підтримки прийняття рішень [3] [4]. OpenStreetMap є одним із наймасштабніших VGI проєктів, що надає вільні геодані про будівлі, транспортну, телекомунікаційну та комерційну інфраструктуру [5] [6]. У низці робіт продемонстровано застосування OSM об’єктів та точок інтересу для побудови моделей ризику та прогнозування злочинності [7; 8], що свідчить про потенціал OSM у задачах безпеки.

Мета – розробити та обґрунтувати методику автоматизованого збору й аналізу даних OpenStreetMap для виявлення просторових факторів ризику та підтримки попередження кіберінцидентів у комерційній цифровій інфраструктурі (офіси, дата-центри, вузли доступу тощо).

Зміст завдання – аналіз підходів OSINT та використання геопросторових даних у кібербезпеці, визначення релевантних об’єктів і атрибутів OSM для моделювання ризиків комерційних цифрових сервісів;

проєктування та реалізація ETL-процесу (збір, очищення, нормалізація та зберігання даних OSM у ГІС-сховищі), розроблення й апробація процедур просторового та мережевого аналізу для побудови карт ризику й формування аналітичних висновків щодо можливих кіберінцидентів.

Цільова аудиторія – дослідники у галузі кібербезпеки,

фахівці SOC/CERT та аналітики з моніторингу кіберзагроз,

інженери з інформаційної безпеки та архітектори інфраструктури комерційних цифрових сервісів, представники бізнесу.

1 АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ

OSINT у кібербезпеці розглядається як процес збирання та перетворення відкритих даних на інформацію, що використовується для оцінки загроз та вразливостей організацій [1] [2]. Було показано, що геопросторові дані можуть істотно посилювати аналіз кіберзагроз: дозволяють відстежувати географію атак, відображати розташування задіяних вузлів та візуалізувати просторове поширення інцидентів у часі. Водночас підкреслюється важливість інтеграції геоданих з іншими джерелами (журнали подій, телеметрія, бізнес метрики) для формування повної картини ризиків [3] [4].

OpenStreetMap, як відкрита й редагована спільнотою карта світу, забезпечує деталізований опис об’єктів, пов’язаних із комерційною цифровою інфраструктурою: офісів ІТ компаній, бізнес центрів, технологічних майданчиків, телекомунікаційних вишок, дата центрів, магазинів електроніки тощо. При цьому дослідження якості OSM вказують на неоднорідність повноти й точності різних типів об’єктів і територій, а також на потребу в методах оцінювання та контролю якості [5] [6]. Окремі випадки пропонують використання внутрішніх (intrinsic) індикаторів якості за відсутності авторитетних еталонних наборів даних [6].

Практика застосування OSM у задачах безпеки та прогнозування ризиків уже продемонстрована у сфері кримінології: на основі точок інтересу OSM будуються моделі просторового розподілу злочинності, а також порівнюється ефективність використання OSM даних та офіційних реєстрів у прогнозуванні злочинів. Показано, що OSM дані можуть бути достатньо інформативними для побудови моделей ризику, особливо у великих міських агломераціях [7] [8].

2 ОПИС ЗАПРОПОНОВАНОЇ МЕТОДИКИ АВТОМАТИЗОВАНОГО ЗБОРУ ТА АНАЛІЗУ ДАНИХ OSM

Запропонована методика орієнтована на підтримку аналізу ризиків для інфраструктури умовного комерційного провайдера цифрових сервісів, що має мережу офісів, дата центрів, вузлів доступу до мережі, технічних майданчиків та партнерських об’єктів у межах окремого регіону. Ці об’єкти частково або повністю представлені в OpenStreetMap у вигляді точок, ліній та полігонів із відповідними тегами (office=, telecom=, building=, data_center= тощо). Як базовий технологічний стек використано Python, бібліотеки для роботи з геоданими (GeoPandas, Shapely), інструменти OSMnx для завантаження та аналізу мереж з OSM, Overpass API для формування запитів до бази OSM, а також PostgreSQL/PostGIS для просторового зберігання та QGIS для візуалізації  [10]. 

Архітектура методики, що реалізує ETL конвеєр (Extract–Transform–Load):

1. Збір даних.

– Вибір географічного регіону, що відповідає зоні присутності провайдера цифрових послуг (наприклад, агломерація великого міста).

– Формування запитів до OSM через Overpass API або OSMnx для вибірки об’єктів, які потенційно репрезентують елементи комерційної цифрової інфраструктури (офіси ІТ компаній, бізнес центри, будівлі з ознаками розміщення ІКТ обладнання, телекомунікаційні вишки, об’єкти з тегами, що вказують на дата центри або вузли зв’язку).

– Завантаження даних у форматах XML/PBF або безпосередньо у GeoJSON/Shape файли з подальшим імпортом до PostGIS (за потреби – через osm2pgsql).

2. Обробка й типізація даних.

– Нормалізація тегів OSM: уніфікація значень ключів та побудова словника відповідності між «сирими» тегами та внутрішніми категоріями (офіс, технічний майданчик, телекомунікаційний вузол, дата центр, інший комерційний об’єкт).

– Фільтрація неактуальних або явно неповних об’єктів, агрегування дублюючих записів, просторове узгодження з межами адміністративних районів чи транспортними зонами.

– Оцінювання базових показників якості даних (щільність покриття, наявність ключових атрибутів, кількість правок у історії об’єктів) з використанням підходів intrinsic оцінки якості [5] [6].

3. Аналітична обробка.

– Побудова карт щільності та кластерів комерційних об’єктів, пов’язаних із наданням цифрових сервісів (heatmap аналіз, кластеризація за допомогою DBSCAN чи простих ієрархічних методів).

– Аналіз близькості до інших об’єктів, що можуть впливати на ризики (наприклад, сусідство з транспортними вузлами, великими торговельними центрами, бізнес кластерами), використання буферизації та просторових об’єднань у PostGIS.

– Мережевий аналіз транспортної та вуличної мережі [10].

4. Інтерпретація результатів для задач попередження кіберінцидентів.

3 ЕКСПЕРИМЕНТАЛЬНЕ ДОСЛІДЖЕННЯ ТА ОЦІНКА ЕФЕКТИВНОСТІ МЕТОДИКИ

Для апробації методики було сформовано тестовий сценарій, у якому комерційний провайдер цифрових сервісів розгортає мережу офісів, дата центрів та вузлів доступу в межах великого міського регіону. Як джерело даних про фізичні об’єкти використано OSM дані для відповідної території. Набір об’єктів відбирався за тегами, що відповідають офісам, бізнес центрам, телекомунікаційним об’єктам, будівлям з ознаками розміщення ІТ інфраструктури.

На першому етапі було реалізовано Python скрипти для автоматизованого завантаження OSM даних через Overpass API та OSMnx з подальшим імпортом у базу PostgreSQL/PostGIS [10]. Після нормалізації тегів і фільтрації нерелевантних об’єктів побудовано кілька тематичних шарів: шар «комерційні цифрові вузли» (умовні офіси, вузли доступу, дата центри), шар допоміжних об’єктів середовища (транспортні вузли, великі торговельні та бізнес центри), а також шар адміністративного зонування міста.

Далі було виконано просторовий аналіз:

– побудовано карти щільності розміщення комерційних цифрових об’єктів;

– для кожної адміністративної одиниці обчислено показники щільності та середньої відстані між об’єктами комерційної інфраструктури, що дає змогу оцінити потенційну «зосередженість» ризиків;

– на основі мережі вулиць, завантаженої з OSM, за допомогою OSMnx виконано аналіз транспортної доступності до ключових вузлів, що може бути використано для планування маршрутів груп реагування або оцінювання можливостей фізичного доступу до інфраструктури [10].

Отримані результати показали, що навіть при використанні виключно відкритих OSM даних можна:

– сформувати базове уявлення про просторова розміщення комерційних цифрових об’єктів;

– виділити зони з потенційно високою концентрацією критичних для бізнесу сервісів;

– виявити території, де відсутні резервні майданчики у прийнятній транспортній досяжності, що може бути сигналом до перегляду стратегії розміщення інфраструктури.

З погляду попередження кіберінцидентів така інформація дозволяє:

– пріоритизувати об’єкти для додаткового захисту, інспекцій та тестування на проникнення;

– краще планувати сценарії стійкості (resilience), зокрема розгортання резервних вузлів у географічно віддалених зонах;

– поєднувати просторовий аналіз з іншими OSINT джерелами (відкриті згадки про інциденти, доменні реєстри, технічні відбитки сервісів) для формування комплексних моделей ризику.

Якісна оцінка показала, що обмеження методу пов’язані насамперед із неповнотою OSM даних для окремих типів комерційних об’єктів, неоднорідністю деталізації тегів і відсутністю «прямих» ознак, які однозначно вказують на наявність ІТ  або телекомунікаційної інфраструктури всередині будівлі [5] [6]. У практичних сценаріях це вимагає комбінувати OSM із іншими відкритими або внутрішніми корпоративними джерелами.

ВИСНОВКИ

У тезах запропоновано методику автоматизованого збору та аналізу даних OpenStreetMap для підтримки попередження кіберінцидентів у контексті комерційної цифрової інфраструктури. Показано, що, поєднуючи OSINT підходи з геопросторовими даними, можна формувати карти ризиків для мережі офісів, дата центрів та вузлів доступу комерційних провайдерів цифрових послуг, виділяти кластери підвищеної концентрації цифрових активів та зони з недостатнім резервуванням. Це сприяє підвищенню ситуаційної обізнаності та підтримує прийняття рішень фахівцями SOC/CERT, аналітиками ризиків та менеджментом організацій.

Наукова новизна роботи полягає у формалізації методики, яка поєднує: а) автоматизований ETL процес завантаження та нормалізації даних OSM; б) набір просторових та мережевих індикаторів для оцінювання ризиків для комерційних цифрових об’єктів; в) орієнтацію саме на превентивні задачі кібербезпеки, а не лише на реагування на інциденти. Практична цінність методики полягає в можливості її інтеграції в існуючі процеси моніторингу загроз та планування заходів кіберзахисту без необхідності придбання дорогих комерційних геоданих.

Серед обмежень слід відзначити залежність від якості та повноти OSM даних, неоднорідність покриття для різних типів об’єктів і територій. Напрямами подальших досліджень є: інтеграція запропонованої методики з іншими OSINT джерелами, використання методів машинного навчання для побудови комплексних моделей ризику на основі OSM та інших наборів даних, а також розширення сценаріїв застосування для підтримки різних типів комерційних сервісів.

Література

1. Yadav A., Kumar A., & Singh V. (2023). Open-source intelligence: a comprehensive review of the current state, applications and future perspectives in cyber security. Artificial Intelligence Review, 56, 12407–12438.

2. Böhm I., & Lolagar S. (2021). Open source intelligence: introduction, legal, and ethical considerations. International Cybersecurity Law Review, 2, 317–337.

3. Veerasamy N., Moolla Y., & Dawood Z. (2022). Application of geospatial data in cyber security. In Proceedings of the 21st European Conference on Cyber Warfare and Security (ECCWS 2022).

4. Vasdev K. (2020). GIS in cybersecurity: mapping threats and vulnerabilities with geospatial analytics. Journal article.

5. Al Bakri M. (2015). Ten years of OpenStreetMap project: have we addressed data quality appropriately? Journal of Engineering, 21(4), 158–175.

6. Sehra S. S., Singh J., & Rai H. S. (2017). Assessing OpenStreetMap data using intrinsic quality indicators: an extension to the QGIS processing toolbox. Future Internet, 9(2), 15.

7. Cichosz P. (2020). Urban crime risk prediction using point of interest data. ISPRS International Journal of Geo-Information, 9(7), 459.

8. Kronkvist K., Borg A., Boldt M., & Gerell M. (2025). Predicting public violent crime using register and OpenStreetMap data: a risk terrain modeling approach across three cities of varying size. Applied Spatial Analysis and Policy, 18, 9.

9. Solymosi R., Buil Gil D., Ceccato V., Kim E., & Jansson U. (2023). Privacy challenges in geodata and open data. Area. https://doi.org/10.1111/area.12888

10. Boeing G. (2017). OSMnx: A Python package to work with graph-theoretic OpenStreetMap street networks. Journal of Open Source Software, 2(12), 215.



Creative Commons Attribution Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License
допомога Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter
Конференции

Конференции 2025

Конференции 2024

Конференции 2023

Конференции 2022

Конференции 2021



Міжнародна інтернет-конференція з економіки, інформаційних систем і технологій, психології та педагогіки

Наукова спільнота - інтернет конференції

:: LEX-LINE :: Юридична лінія

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення