СИСТЕМА ОБРОБКИ ІНФОРМАЦІЇ ГОЛОСОВОГО ЗАПИСУ В РЕЖИМІ РЕАЛЬНОГО ЧАСУ

01.04.2022 23:25

[1. Информационные системы и технологии]

Автор: Максим’юк Анастасія Миколаївна, бакалавр, Чернівецький національний університет імені Ю. Федьковича, Чернівці

У сьогоденні системи розпізнавання мовлення людини використовуються майже у всіх сферах людської діяльності де задіяні комп’ютерні та електронні пристрої. Голосове введення дає змогу диктувати електронні листи та документи, натиснувши опцію мікрофона на клавіатурі пристрою. Відсутність необхідності друкувати або писати довгі нотатки – це величезна економія часу, а технологія розпізнавання мовлення надає можливості транскрипції, які допомагають підвищити продуктивність і прибутковість [1].

Програмне забезпечення для розпізнавання мовлення дає змогу телефонам, комп’ютерам, планшетам та іншим машинам отримувати, розпізнавати та розуміти людські висловлювання. Воно використовує природну мову як вхідні дані, щоб ініціювати дію, дозволяючи нашим пристроям реагувати на наші голосні команди [2].

Розроблений проект розширює сферу використання систем розпізнавання голосу, дозволяючи користувачам застосовувати систему для навчання та самовдосконалення. Метою роботи є створення додатку для платформ IoS та Android на основі існуючих методів розпізнавання мовлення людини, який в режимі реального часу зчитуватиме мовлення людини з допомогою смартфону і реагуватиме на окремі слова, які були зазначені користувачем. Програма призначена для удосконалення мовлення людини. До прикладу, користувач може підрахувати скільки слів паразитів він сказав за певний час, чи скільки раз він вжив нововивчене іноземне слово. Додаток розроблений за допомогою фреймворка React Native. React Native — це кросплатформний фреймворк з відкритим вихідним кодом для розробки нативних мобільних додатків на JavaScript і TypeScript [3].

У системах розпізнавання мови, що містять слова, вхідне слово порівнюється з усіма словами у словник. Розпізнавання може бути реалізоване різними методами такими як приховані моделі Маркова (Hidden Markov Model), часові динамічні алгоритмів (DTW - Dynamic Time Warping) та нейронні мережі (Neural networks). Кожен з методів має свої переваги та недоліки.

Згідно з [4] алгоритм прихованих моделей Маркова дозволяє розглядати мову як деякий код, а мовний потік – як послідовність деяких кодових пакетів. Неважливо, що є елементом цього коду – фонеми, склади або цілі слова, значення має лише те, що імовірність появи будь-якого елемента коду залежить від деякого числа попередніх елементів. Таким чином, мова породжується Марківським джерелом, а мовний код є випадковим.

Алгоритм динамічного трансформування часу (DTW) визначає оптимальну послідовність трансформації (деформації) часу між двома тимчасовими рядами. Алгоритм обчислює обидва значення деформації між двома рядами та відстанню між ними. DTW алгоритми дуже корисні для розпізнавання окремих слів в обмеженому словнику [5].

Нейронні мережі (Neural network, NN) або штучні нейронні мережі (Artificial neural networks, ANN) – є підмножиною машинного навчання і лежать в основі алгоритмів глибокого навчання. Їх назва та структура натхненні людським мозком, імітуючи спосіб, яким біологічні нейрони сигналізують один одного [6].

В процесі виконання роботи були проаналізовані дані алгоритми розпізнавання голосу, визначено переваги і недоліки кожного з них. Нейронні мережі мають високу швидкість роботи, більшу точність розпізнавання, та високу коректність роботи в умовах підвищеного шуму, саме тому у даній роботі розпізнавання мовлення людини виконується методом нейронних мереж. Результатом роботи є мобільний додаток, що дозволяє прослуховувати мову людини, перекладати її в текст, та в режимі реального часу реагувати на конкретні слова, тим самим дозволяючи користувачеві самоудосконалювати своє мовлення .

Література

1. Innovative Uses of Speech Recognition Today: [Електронний ресурс] - Режим доступу: https://summalinguae.com/language-technology/innovative-uses-of-speech-recognition/

2. Speech Recognition Software: Past, Present, and future: [Електронний ресурс] - Режим доступу: https://summalinguae.com/language-technology/speech-recognition-software-history-future/

3. React native: [Електронний ресурс] - Режим доступу: https://ru.wikipedia.org/wiki/React_Native

4. Аналіз методів розпізнавання мовлення: [Електронний ресурс] -Режим доступу: http://ir.lib.vntu.edu.ua/bitstream/handle/123456789/20642/5144.pdf?sequence=3&isAllowed=y

5. Динамическое программирование в алгоритмах распознавания речи: [Електронний ресурс] - Режим доступу: https://habr.com/ru/post/135087

6. What are neural networks?: [Електронний ресурс] - Режим доступу: https://www.ibm.com/cloud/learn/neural-networks

____________________

Науковий керівник: Яковлєва Інна Дмитрівна, кандидат технічних наук, доцент, Чернівецький національний університет імені Юрія Федьковича

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Другие научные работы даной секции

Конференции

Konferencje 2026

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 106) (15-16.01.2026)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 107) (10-11.02.2026)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 108) (5-6.03.2026)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 109) (8-9.04.2026)

1. Systemy i technologie informacyjne 10
2. Nauki ekonomiczne 8
3. Nauki techniczne 9
4. Nauki pedagogiczne 12
5. Nauki prawne 5

Konferencje 2025

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 95) (16-17.01.2025)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 96) (11-12.02.2025)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 97) (13-14.03.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 98) (15-16.04.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 99) (14-15.05.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 100) (11-12.06.2025)

1. Systemy i technologie informacyjne 10
2. Nauki ekonomiczne 15
3. Nauki techniczne 5
4. Nauki pedagogiczne 0
5. Nauki prawne 1

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 101) (09-10.07.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 102) (16-17.09.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 103) (14-15.10.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 104) (13-14.11.2025)

1. Systemy i technologie informacyjne 11
2. Nauki ekonomiczne 11
3. Nauki techniczne 8
4. Nauki pedagogiczne 4
5. Nauki prawne 8

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 105) (11-12.12.2025)

1. Systemy i technologie informacyjne 19
2. Nauki ekonomiczne 13
3. Nauki techniczne 7
4. Nauki pedagogiczne 8
5. Nauki prawne 7

Konferencje 2024

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 84) (18-19.01.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 85) (15-16.02.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 86) (12-13.03.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 87) (11-12.04.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 88) (14-15.05.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 89) (12-13.06.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 90) (9-10.07.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 91) (10-11.09.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 92) (8-9.10.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 93) (12-13.11.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 94) (11-12.12.2024)

Konferencje 2023

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 74) (06-07.02.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 75) (06-07.03.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 76) (03-04.04.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 77) (09-10.05.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 78) (08-09.06.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 79) (06-07.07.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 80) (19-20.09.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 81) (11-12.10.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 82) (9-10.11.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 83) (7-8.12.2023)

Konferencje 2022

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 65) (8-9.02.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 66) (6-7.04.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 67) (11-12.05.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 68) (7-8.06.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 69) (4-5.07.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 70) (22-23.09.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 71) (18-19.10.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 72) (15-16.11.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 73) (08-09.12.2022)

Konferencje 2021

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 55) (09.02.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 56) (10.03.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 57) (13.04.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 58) (12.05.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 59) (08.06.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 60) (13.07.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 61) (15.09.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 62) (12.10.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 63) (11.11.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 64) (10.12.2021)

Вас приветствует Интернет конференция!

Рік заснування видання - 2011

СИСТЕМА ОБРОБКИ ІНФОРМАЦІЇ ГОЛОСОВОГО ЗАПИСУ В РЕЖИМІ РЕАЛЬНОГО ЧАСУ

Другие научные работы даной секции