ПРОГНОЗУВАННЯ РЕЗУЛЬТАТІВ СПОРТИВНИХ ЗМАГАНЬ НА ОСНОВІ СТАТИСТИЧНИХ МОДЕЛЕЙ
12.10.2021 22:43
[1. Information systems and technologies]
Author: Репалюк О.І., студент, кафедра інформатики та програмної інженерії, Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського", м. Київ
Оцінка ефективності команд та спортсменів, а також прогнозування їх успішності є важливою для багатьох сфер бізнесу: формування спонсорських контрактів, букмекерська діяльність, проведення та обслуговування спортивних подій. Програмне забезпечення, що реалізує моделі аналізу статистичних даних може використовуватись у щоденній діяльності для побудови довгострокової стратегії відносин зі спортивними організаціями. Однак на сьогодні компанії, які пропонують прогнози щодо результатів матчу, зазвичай не розкривають дані щодо використовуваних алгоритмів і моделей. Актуальною є задача створення відкритого програмного забезпечення для перевірки ефективності статистичних моделей прогнозування результатів на основі даних попередніх ігор та поточних характеристик.
Метою даної роботи є підвищення ефективності взаємовідносин бізнесу зі спортивними організаціями за рахунок розробки програмного модулю аналізу результатів спортивних змагань, комунікація користувача з яким відбуватиметься через систему управління взаємовідносинами з клієнтами. Для досягнення поставленої мети необхідно провести аналіз існуючих підходів до прогнозування результатів спортивних змагань, обрати моделі для подальшого дослідження. На основі обраних алгоритмів пропонується створити мікросервісне рішення, яке дозволить користувачеві порівняти результати за кількома моделями.
Для прогнозування результатів спортивних змагань використовуються наступні алгоритми: лінійна регресія [1], логістична регресія, нейронні мережі, метод опорних векторів, наївний баєсів класифікатор, випадковий ліс [2].
В якості вхідних даних дослідження обрано підсумки зустрічей команд з трьох видів спорту: хокею, баскетболу, бейсболу за кожен сезон з 2010 року. Результатом роботи системи є величина, що визначає ймовірність перемоги однієї з команд. Для створення системи було обрано алгоритми, що базуються на методах лінійної та логістичної регресії.
Для побудови статистичних моделей було обрано наступні значимі характеристики: рахунок (кількість забитих та пропущених голів або кількість набраних очок); розташування змагання (вдома/в гостях); ефективність атаки/захисту; процент перемог вдома/в гостях; показник особистих зустрічей за декілька сезонів; параметри, характерні для окремого виду спорту (баскетбол: вільні кидки, відскоки, підбори. бейсбол: рейтинг пітчерів).
Рис. 1. Узагальнена схема програмного застосунку
Отже, інтеграція системи прогнозування в систему управління взаємовідносинами з клієнтами дозволить спростити комунікації та підвищити ефективність роботи за рахунок надання прозорих прогнозів щодо результатів змагань.
Література:
1. Прогнозування за допомогою лінійної регресії – The Power Rank [Електронний ресурс]. – Режим доступу: https://thepowerrank.com/2018/08/14/how-to-make-accurate-football-predictions-with-linear-regression/
2. Corentin Herbinet. Predicting Football Results Using Machine Learning Techniques [Електронний ресурс]. – Режим доступу до ресурсу: https://www.imperial.ac.uk/media/imperial-college/faculty-of-engineering/computing/public/1718-ug-projects/Corentin-Herbinet-Using-Machine-Learning-techniques-to-predict-the-outcome-of-profressional-football-matches.pdf
________________
Науковий керівник: Мажара Ольга Олександрівна, к.т.н., Національний технічний університет України "Київський політехнічний інститут імені Ігоря Сікорського"