АДАПТАЦІЯ ТРАНСФОРМЕРНИХ МОДЕЛЕЙ ДЛЯ ВИЯВЛЕННЯ ТОКСИЧНОЇ ПОВЕДІНКИ В ОНЛАЙН-ІГРАХ У РЕАЛЬНОМУ ЧАСІ

05.03.2026 10:37

[1. Information systems and technologies]

Author: Ромащенко Максим Олександрович, Національний університет «Одеська політехніка», м. Одеса

АНОТАЦІЯ. У статті досліджено проблему автоматизованої модерації текстового контенту в багатокористувацьких онлайн-іграх. Проведено порівняльний аналіз сучасних архітектур нейронних мереж, обґрунтовано вибір моделі DistilBERT як найбільш ефективного рішення для систем, що працюють у режимі реального часу. Детально описано стратегію доменного навчання (fine-tuning) та методику препроцесингу неструктурованих даних ігрового чату. Запропоновано гібридний підхід, що поєднує контекстне розуміння трансформерів із аналізом специфічних лінгвістичних патернів ігрового сленгу.

Вступ. У сучасну епоху цифрової трансформації онлайн-ігри перетворилися на складні соціальні платформи, де рівень емоційної напруги часто провокує прояви токсичної поведінки [4]. Під токсичністю розуміють широкий спектр деструктивних дій: від нецензурної лексики до системного булінгу та розпалювання ворожнечі, що негативно впливає на утримання аудиторії [4]. Актуальність дослідження зумовлена низькою ефективністю традиційних методів модерації, які не враховують семантичний контекст повідомлень та специфіку ігрового жаргону [6]. Використання інтелектуальних систем на базі архітектури Transformer дозволяє вирішити проблему розпізнавання агресії в умовах високошвидкісного потоку даних [1].

Мета роботи. Розробка та наукове обґрунтування методики адаптації трансформерних моделей для ідентифікації токсичного контенту в умовах високошвидкісного потоку даних ігрових чатів.

Основна частина роботи.

1. Порівняльний аналіз та вибір базової архітектури. Для реалізації системи було розглянуто моделі на основі механізму Self-Attention [1]. Модель BERT забезпечує високу якість розуміння мови [2], проте її обчислювальна складність є надмірною для ігрових серверів. Натомість було обрано модель DistilBERT, яка використовує метод дистиляції знань для зменшення кількості параметрів на 40% при збереженні високої точності класифікації [3]. Порівняльні характеристики моделей підтверджують, що DistilBERT демонструє оптимальний баланс між F1-score та затримкою, що є критичним для систем реального часу.

Порівняльні характеристики різних підходів до виявлення токсичності наведено в таблиці 1.

Таблиця 1 – Порівняння продуктивності NLP-моделей

2. Стратегія адаптації до ігрового домену. Основна проблема використання стандартних трансформерів полягає в тому, що вони навчені на «чистих» мовних корпусах (Wikipedia, BookCorpus), які майже не містять специфічної лексики онлайн-спільнот [4]. Стратегія адаптації в даній роботі базується на дворівневому підході:

Доменний Fine-tuning: Модель проходить етап додаткового навчання на вузькоспеціалізованих датасетах, таких як Jigsaw Toxicity Classification [5] та корпуси крос-культурної агресивної лексики.

Гібридна векторизація та Feature Engineering: Окрім контекстних векторів від DistilBERT, до класифікатора додаються евристичні ознаки (Caps Lock, пунктуаційна щільність, символьна обфускація).

3. Препроцесинг та токенізація. Текст ігрових чатів характеризується високим рівнем «шуму» та використанням символьної обфускації [4]. Для обробки використано алгоритм WordPiece, який розбиває слова на суб-токени [2]. Це дозволяє моделі ідентифікувати токсичні корені навіть у словах із навмисними помилками. На етапі нормалізації було збережено ключові займенники та частки, які є важливими маркерами спрямованої агресії в ігровому контексті [6].

4. Результати дослідження та оцінка ефективності. Експериментально доведено, що адаптована модель DistilBERT забезпечує точність класифікації на рівні 90% при середній затримці обробки 65 мс. Додавання гібридних ознак підвищило виявлення завуальованих образ на 12% порівняно з базовими архітектурами. Це дозволяє інтегрувати систему в ігрові платформи для автоматичного попередження користувачів або превентивного блокування контенту.

Висновки. Адаптація трансформерних моделей через механізми fine-tuning та спеціалізований препроцесинг дозволяє ефективно боротися з токсичністю в онлайн-іграх. Використання DistilBERT забезпечує необхідну продуктивність для роботи в реальному часі, а поєднання семантичного аналізу з лінгвістичними метриками сленгу підвищує надійність системи в умовах специфічної ігрової комунікації.

Література

1. Vaswani A. et al. Attention is All You Need. Advances in Neural Information Processing Systems. 2017. Vol. 30.

2. Devlin J. et al. BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding. NAACL. 2019. P. 4171–4186.

3. Sanh V. et al. DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter. arXiv preprint arXiv:1910.01108. 2019.

4. Maroengsit W. et al. A Survey on Emotional and Toxic Behavior in Massive Multiplayer Online Games. IEEE Access. 2021. Vol. 9. P. 125000–125015.

5. Jigsaw Unit. Toxicity Classification Data. Kaggle Competition Dataset. 2019. URL: https://www.kaggle.com/c/jigsaw-unintended-bias-in-toxicity-classification

6. Ковальчук І. О. Крос-культурні аспекти сприйняття агресивного мовлення в онлайн-іграх. Проблеми лінгвістики. 2023. № 4. С. 45–52.

_________________________________

Науковий керівник: Щербакова Галина Юріївна, доктор технічних наук, професор, Національний університет «Одеська політехніка», м. Одеса

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Another articles in this section

Сonferences

Conference 2026

Information society: technological, economic and technical aspects of formation (issue 106) (15-16.01.2026)

Information society: technological, economic and technical aspects of formation (issue 107) (10-11.02.2026)

Information society: technological, economic and technical aspects of formation (issue 108) (5-6.03.2026)

Information society: technological, economic and technical aspects of formation (issue 109) (8-9.04.2026)

Conference 2025

Information society: technological, economic and technical aspects of formation (issue 95) (16-17.01.2025)

Information society: technological, economic and technical aspects of formation (issue 96) (11-12.02.2025)

Information society: technological, economic and technical aspects of formation (issue 97) (13-14.03.2025)

Information society: technological, economic and technical aspects of formation (issue 98) (15-16.04.2025)

Information society: technological, economic and technical aspects of formation (issue 99) (14-15.05.2025)

Information society: technological, economic and technical aspects of formation (issue 100) (11-12.06.2025)

Information society: technological, economic and technical aspects of formation (issue 101) (09-10.07.2025)

Information society: technological, economic and technical aspects of formation (issue 102) (16-17.09.2025)

Information society: technological, economic and technical aspects of formation (issue 103) (14-15.10.2025)

Information society: technological, economic and technical aspects of formation (issue 104) (13-14.11.2025)

Information society: technological, economic and technical aspects of formation (issue 105) (11-12.12.2025)

Conference 2024

Information society: technological, economic and technical aspects of formation (issue 84) (18-19.01.2024)

Information society: technological, economic and technical aspects of formation (issue 85) (15-16.02.2024)

Information society: technological, economic and technical aspects of formation (issue 86) (12-13.03.2024)

Information society: technological, economic and technical aspects of formation (issue 87) (11-12.04.2024)

Information society: technological, economic and technical aspects of formation (issue 88) (14-15.05.2024)

Information society: technological, economic and technical aspects of formation (issue 89) (12-13.06.2024)

Information society: technological, economic and technical aspects of formation (issue 90) (9-10.07.2024)

Information society: technological, economic and technical aspects of formation (issue 91) (10-11.09.2024)

Information society: technological, economic and technical aspects of formation (issue 92) (8-9.10.2024)

Information society: technological, economic and technical aspects of formation (issue 93) (12-13.11.2024)

Information society: technological, economic and technical aspects of formation (issue 94) (11-12.12.2024)

Conference 2023

Information society: technological, economic and technical aspects of formation (issue 74) (06-07.02.2023)

Information society: technological, economic and technical aspects of formation (issue 75) (06-07.03.2023)

Information society: technological, economic and technical aspects of formation (issue 76) (03-04.04.2023)

Information society: technological, economic and technical aspects of formation (issue 77) (09-10.05.2023)

Information society: technological, economic and technical aspects of formation (issue 78) (08-09.06.2023)

Information society: technological, economic and technical aspects of formation (issue 79) (06-07.07.2023)

Information society: technological, economic and technical aspects of formation (issue 80) (19-20.09.2023)

Information society: technological, economic and technical aspects of formation (issue 81) (11-12.10.2023)

Information society: technological, economic and technical aspects of formation (issue 82) (9-1.11.2023)

Information society: technological, economic and technical aspects of formation (issue 83) (7-8.12.2023)

Conference 2022

Information society: technological, economic and technical aspects of formation (issue 65) (8-9.02.2022)

Information society: technological, economic and technical aspects of formation (issue 66) (6-7.04.2022)

Information society: technological, economic and technical aspects of formation (issue 67) (11-12.05.2022)

Information society: technological, economic and technical aspects of formation (issue 68) (7-8.06.2022)

Information society: technological, economic and technical aspects of formation (issue 69) (4-5.07.2022)

Information society: technological, economic and technical aspects of formation (issue 70) (22-23.09.2022)

Information society: technological, economic and technical aspects of formation (issue 71) (18-19.10.2022)

Information society: technological, economic and technical aspects of formation (issue 72) (15-16.11.2022)

Information society: technological, economic and technical aspects of formation (issue 73) (08-09.12.2022)

Conference 2021

Information society: technological, economic and technical aspects of formation (Issue 55) (09.02.2021)

Information society: technological, economic and technical aspects of formation (Issue 56) (10.03.2021)

Information society: technological, economic and technical aspects of formation (issue 57) (13.04.2021)

Information society: technological, economic and technical aspects of formation (issue 58) (12.05.2021)

Information society: technological, economic and technical aspects of formation (issue 59) (08.06.2021)

Information society: technological, economic and technical aspects of formation (issue 60) (13.07.2021)

Information society: technological, economic and technical aspects of formation (issue 61) (15.09.2021)

Information society: technological, economic and technical aspects of formation (issue 62) (12.10.2021)

Information society: technological, economic and technical aspects of formation (issue 63) (11.11.2021)

Information society: technological, economic and technical aspects of formation (issue 64) (10.12.2021)

Congratulation from Internet Conference!

Рік заснування видання - 2011

АДАПТАЦІЯ ТРАНСФОРМЕРНИХ МОДЕЛЕЙ ДЛЯ ВИЯВЛЕННЯ ТОКСИЧНОЇ ПОВЕДІНКИ В ОНЛАЙН-ІГРАХ У РЕАЛЬНОМУ ЧАСІ

Another articles in this section