РОЗПІЗНАВАННЯ КЛЮЧОВИХ СЛІВ У МОВЛЕННІ ЛЮДИНИ З ДОПОМОГОЮ МОБІЛІНОГО ПРИСТРОЮ ТА TENSORFLOW
04.04.2022 16:00
[3. Технічні науки]
Автор: Ткачук Микола Юрійович, бакалавр, Чернівецький національний університет ім. Юрія Федьковича, Чернівці
Штучні нейронні мережі (ШНМ) – це один з найпоширеніших методів класифікації в інтелектуальному аналізі даних. Такі системи навчаються розв‘язувати проблеми, шляхом розгляду загальних прикладів, без спеціального програмування під конкретну задачу, за відсутності знань про задачу. Дві сильні сторони штучних нейронних мереж – це паралелізм при обробці інформації та здатність до самонавчання.
Згідно з [1], нейронна мережа – це величезний розподілений паралельний процесор, який складається з елементарних блоків обробки інформації, накопичує експериментальні знання та забезпечує їх для подальших перетворень. Шляхом розгляду певних прикладів системи навчаються виконувати завдання з поступовим удосконаленням власних одержаних результатів.
Є багато прикладів використання нейронних мереж у різних сферах діяльності. Google і Microsoft використовують нейронні мережі у своїх програмах перекладу. Magenta Research Group продемонстрували перші розробки в галузі машинної творчості на музичному фестивалі Moogfest, який відбувся в Даремі (США). Програма на основі п‘яти отриманих нотаток відтворили більш складну і довшу мелодію [2].
Згідно з [3] штучна нейронна мережа - це обчислювальна модель людського мозку. Кожен нейрон окремо виконує лише прості перетворення, але паралельна робота великої кількості нейронів і величезна кількість зв'язків між ними призводять до того, що нейронні мережі в цілому можуть виконувати дуже складні перетворення сигналів у реальному часі. Крім того, велика кількість з'єднань робить нейронну мережу стійкою до помилок.
Навчання мережі здійснюється шляхом послідовного надання вхідних векторів з одночасним коригуванням ваг за певною процедурою. Нейронні мережі мають високу обчислювальну потужність з низки причин. По-перше, нейронна мережа – це паралельно розподілена система процесорних елементів (нейронів), здатна виконувати найпростіше оброблення даних і може коригувати свої параметри у процесі навчання на емпіричних даних. По-друге, вона здатна до навчання, а отже, до узагальнення. Накопичені знання про нейронної мережі зосереджені в масштабах міжелементних зв'язків [3].
Метою нашого проєкту є створення нейромережі, яка самостійно виявлятиме зазначені нами ключові слова та рахуватиме кількість їхнього повторення. Спочатку ми отримуємо аудіо запис далі конвертуємо його в текст та робимо пошук по ключових словах. Отримуємо аудіо з допомогою телефону.
Програмна розробка виконана мовою Рython з використанням бібліотеки Tensorflow для обробки зображень. TensorFlow - це комплексна платформа з відкритим вихідним кодом для машинного навчання. Він має всеосяжну гнучку екосистему інструментів, бібліотек і ресурсів спільноти, яка дозволяє дослідникам просувати новітні досягнення в галузі машинного навчання, а розробникам легко створювати і розгортати додатки на основі машинного навчання [4].
Наша система зможе визначати кількість тегових слів вжитих користувачем. Результати роботи системи можна буде побачити в мобільному додатку.
Список літератури
1. Саймон Хайкин, Нейронные сети. Полный курс. Второе издание, 2016 – 1102 с.
2. Воронцов Н. Искусственный интеллект Google займется сочинением музыки. Режим доступу: https://nplus1.ru/news/2016/05/23/magenta.
3. Стариков А. Применение нейронных сетей для задач классификации : [Електронний ресурс] / А. Стариков. Режим доступу: www.basegroup.ru. С. 2.
4. Документація Tensorflow [Електронний ресурс]. Режим доступу: https://github.com/tensorflow
________________
Науковий керівник: Мельничук Степан Васильович, доктор фізико-математичних наук, професор, Чернівецький національний університет імені Юрія Федьковича