СУЧАСНІ МЕТОДИ ОБРОБКИ ТЕКСТОВОЇ ІНФОРМАЦІЇ В УМОВАХ СКЛАДНИХ ТЕКСТОВИХ КОНСТРУКЦІЙ

19.10.2022 19:13

[1. Информационные системы и технологии]

Автор: Калабуха Дмитро Владиславович, студент, Одеський національний морський університет, м. Одеса, Україна

Загальний напрямок, що вивчає проблеми комп'ютерного аналізу та синтезу природних мов, отримало назву Natural Language Processing (NLP), що найчастіше перекладається як обробка природної мови або комп'ютерна лінгвістика [1,2].

Розвиток NLP та комп'ютерної лінгвістики проходило при вирішенні кількох основних завдань, таких як створення автоматизованих інформаційно-пошукових систем і систем машинного перекладу. Більшість систем аналізу і обробки текстів у тій чи іншій мірі пов'язані з обчисленням його ймовірнісно-статистичних характеристик.

Можливість застосування кількісних методів заснована на ймовірнісному характері мови. Це підтверджується наступними фактами:

- дискретність одиниць;

- масовість мовних одиниць;

- повторюваність їх у висловлюванні;

- можливість вибору певного елемента з ряду однорідних.

Основним завданням статистичної лінгвістики є застосування точних методів і використання математичного апарату для розкриття закономірностей функціонування одиниць мови в мовленні, а також встановлення закономірностей побудови тексту. Причому важливо саме системне розглядання механізмів породження тексту та його системних складових, в тому числі і лексики.

Таким чином, можна виділити два методологічних підходи до розгляду текстових даних і автоматичного аналізу текстів: інформаційно-аналітичний і лінгвістичний, в ці підходи названі декларативною і процедурної компонентами. Також слід зазначити використання на практиці «підходів, заснованих на правилах» (rule based approach) і «підходів, заснованих на прикладах (прецедентах)» (example based approach). При цьому ці підходи доповнюють один одного, оскільки методи, що відносяться до першого підходу, є найчастіше більш швидкими, ніж методи аналогії.

Особливості побудови систем розуміння текстів виділяють кілька типів структур, кожна з яких відображає аналіз текстів на деякому рівні.

- Лінгвістичні структури пропозицій.

- Семантична мережа цілого тексту.

- Інформаційні структури цілого тексту (потоків текстів).

Структури баз даних і знань. Структури такого типу фіксують вибіркове спеціальне «розуміння», в максимальній мірі враховує лінгвістичне уявлення, відображення дійсності. До таких структур можуть бути віднесені сценарії, ситуації, кадри, тощо. Такі структури одержали широке поширення в системах штучного інтелекту, вони відображають уявлення цілого тексту і байдужі до розділу на пропозиції.

Література

1. Lomakina L.S., Rodionov V.B., Surkova A.S. Hierarchical Clustering of Text Documents // Automation and Remote Control. – 2014. – Vol. 75. – N. 7. – P. 1309-1315.

2. Berry M.W., Kogan J. Text Mining. Applications and Theory. – Wiley. – 2010. – 207 p.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Другие научные работы даной секции

Конференции

Konferencje 2026

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 106) (15-16.01.2026)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 107) (10-11.02.2026)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 108) (5-6.03.2026)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 109) (8-9.04.2026)

1. Systemy i technologie informacyjne 10
2. Nauki ekonomiczne 8
3. Nauki techniczne 9
4. Nauki pedagogiczne 12
5. Nauki prawne 5

Konferencje 2025

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 95) (16-17.01.2025)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 96) (11-12.02.2025)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 97) (13-14.03.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 98) (15-16.04.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 99) (14-15.05.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 100) (11-12.06.2025)

1. Systemy i technologie informacyjne 10
2. Nauki ekonomiczne 15
3. Nauki techniczne 5
4. Nauki pedagogiczne 0
5. Nauki prawne 1

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 101) (09-10.07.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 102) (16-17.09.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 103) (14-15.10.2025)

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 104) (13-14.11.2025)

1. Systemy i technologie informacyjne 11
2. Nauki ekonomiczne 11
3. Nauki techniczne 8
4. Nauki pedagogiczne 4
5. Nauki prawne 8

Społeczeństwo informacyjne: technologiczne, ekonomiczne i techniczne aspekty rozwoju (nr 105) (11-12.12.2025)

1. Systemy i technologie informacyjne 19
2. Nauki ekonomiczne 13
3. Nauki techniczne 7
4. Nauki pedagogiczne 8
5. Nauki prawne 7

Konferencje 2024

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 84) (18-19.01.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 85) (15-16.02.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 86) (12-13.03.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 87) (11-12.04.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 88) (14-15.05.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 89) (12-13.06.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 90) (9-10.07.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 91) (10-11.09.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 92) (8-9.10.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 93) (12-13.11.2024)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 94) (11-12.12.2024)

Konferencje 2023

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 74) (06-07.02.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 75) (06-07.03.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 76) (03-04.04.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 77) (09-10.05.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 78) (08-09.06.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 79) (06-07.07.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 80) (19-20.09.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 81) (11-12.10.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 82) (9-10.11.2023)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 83) (7-8.12.2023)

Konferencje 2022

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 65) (8-9.02.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 66) (6-7.04.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 67) (11-12.05.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 68) (7-8.06.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 69) (4-5.07.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 70) (22-23.09.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 71) (18-19.10.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 72) (15-16.11.2022)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 73) (08-09.12.2022)

Konferencje 2021

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 55) (09.02.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 56) (10.03.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 57) (13.04.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 58) (12.05.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 59) (08.06.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 60) (13.07.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 61) (15.09.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 62) (12.10.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 63) (11.11.2021)

Информационное общество: технологические, экономические и технические аспекты становления (выпуск 64) (10.12.2021)

Вас приветствует Интернет конференция!

Рік заснування видання - 2011

СУЧАСНІ МЕТОДИ ОБРОБКИ ТЕКСТОВОЇ ІНФОРМАЦІЇ В УМОВАХ СКЛАДНИХ ТЕКСТОВИХ КОНСТРУКЦІЙ

Другие научные работы даной секции