СИСТЕМА АНАЛІЗУ ТЕКСТУ НА БАЗІ НЕЙРОННОЇ МЕРЕЖІ
07.03.2023 14:42
[1. Інформаційні системи і технології]
Автор: Нечипор Дан Романович, магістрант, Чернівецький національний університет імені Ю. Федьковича, м. Чернівці
Система аналізу тексту на основі нейронної мережі – це передова технологія, яка використовує штучний інтелект і алгоритми машинного навчання для аналізу та класифікації текстових даних. Система здатна розуміти природну мову та може автоматично класифікувати завдання та помилки на основі їх опису [1].
Однією з головних переваг автоматизованої системи аналізу тексту на основі нейронної мережі є підвищена ефективність. Система може автоматично класифікувати завдання та помилки, звільняючи час для розробників, щоб зосередитися на більш важливих завданнях [2]. Крім того, автоматизована система може аналізувати та обробляти великі обсяги даних набагато швидше, ніж люди, що ще більше підвищує ефективність.
Ще одна перевага — підвищена точність. Людська помилка може призвести до неправильної класифікації проблеми, що може мати значні наслідки для проектів розробки програмного забезпечення. Автоматизована система може мінімізувати ці помилки шляхом постійного застосування заздалегідь визначених правил і алгоритмів [3].
Метою роботи є створення та використання системи аналізу тексту на базі машинного навчання, яке дозволяє системі вивчати попередні класифікації та постійно підвищувати свою точність. Система може аналізувати та розуміти природну мову, дозволяючи їй точно класифікувати завдання та помилки на основі їх описів.
Вибір алгоритму є ключовим аспектом розробки системи аналізу тексту на основі нейронної мережі. Вибір алгоритму може значно вплинути на ефективність і точність системи. Наприклад, згорткова нейронна мережа (CNN) часто використовується для завдань класифікації тексту, оскільки вона може витягувати ознаки з тексту та точно класифікувати їх. Однак конкретний використаний алгоритм залежатиме від типу даних, що аналізуються, і бажаного результату.
Архітектура Transformer дозволяє краще розпаралелювати навчання та ефективніше обробляти довгі вхідні послідовності [4]. Наприклад ChatGPT попередньо навчається на величезній кількості текстових даних за допомогою підходу до самоконтролю, що називається моделюванням мови, який передбачає передбачення наступного слова в послідовності за попередніми словами. Цей процес попереднього навчання дозволяє йому генерувати узгоджені та релевантні контексту відповіді на дані користувача.
Результатом роботи є автоматизована система аналізу тексту на основі нейронної мережі.
Література
1. "Automated Text Analysis in Management Research" by Denise M. Rousseau and Kenneth R. Brousseau (2013)
2. "Automatic Text Classification for Bug Reports" by Yang Liu, et al. (2018)
3. "Applying Machine Learning to Software Quality Assurance: Benefits and Limitations" by Piyush D. Kharbanda and Mohit Jain (2019)
4. Transformer: [Електронний ресурс] – Режим доступу: https://en.wikipedia.org/wiki/Transformer_(machine_learning_model)
_____________________
Науковий керівник: Дейбук Віталій Григорович, доктор фізико-математичних наук, професор, Чернівецький національний університет імені Ю. Федьковича, м. Чернівці