CHARACTERISTICS OF THE MAIN NLP MODELS

08.06.2022 13:46

[1. Інформаційні системи і технології]

Автор: Radoutskyi K. E., senior lecturer, V. N. Karazin Kharkiv National University, Kharkiv, Ukraine; Radoutska A.K., student, Kharkiv National University of Radio electronics, Kharkiv, Ukraine

One of the tasks of language modeling is to predict the next word based on knowledge of the previous text. This is necessary for correcting typos, auto-completion, chat bots, etc. Therefore, in this work, I want to determine the pros and cons of the most popular models.

1. Recurrent Neural Network Language Model (RNNLM)

Advantages:

- Simplicity.

- Good learnability and embedding generation.

- Availability of pre-trained versions.

Disadvantages:

- Does not take into consideration long-term dependencies.

- Simplicity limits the possibilities of use.

- The new models are much more versatile and powerful.

2. word2vec

Advantages:

- Convenient architecture.

- Fast learnability of the model and easy generation of embeddings.

- A simple deciphering of controversial points.

- Versatility, useful in many areas.

Disadvantages:

- Lack of context for the use of the word, the impossibility of determining the meaning of the word if it has more than one meaning.

- It is complicated to process rare words.

3. GloVe

Advantages:

- Simple architecture without a neural network.

- The model is fast and this may be sufficient for simple applications.

- More meaningful embeddings.

Disadvantages:

- While the co-occurrence matrix provides global information, GloVe remains trained at the word level and adds data about the sentence and the context in which the word is used.

- Handles unknown and rare words poorly.

4. FastText

Advantages:

- Relatively simple architecture: one input, one hidden layer, one output.

- Because of n-grams, it works well on rare words.

Disadvantages:

- Lack of context for the use of the word, the impossibility of determining the meaning of the word if it has more than one meaning.

- Embedding works much better than GloVe and Word2Vec on rare and non-dictionary words thanks to the n-gram method.

Ця робота ліцензується відповідно до Creative Commons Attribution 4.0 International License

Знайшли помилку? Виділіть помилковий текст мишкою і натисніть Ctrl + Enter

Інші наукові праці даної секції

ВАЖЛИВІСТЬ ВИКОРИСТАННЯ МЕНЕДЖЕРІВ ПАРОЛІВ У СУЧАСНОМУ СВІТІ
23.05.2022 16:03
АНАЛІЗ ПІДХОДІВ ДО ВИКОРИСТАННЯ СИСТЕМ ПРИМАНОК ДЛЯ РОЗВІДКИ ЗАГРОЗ
08.06.2022 14:38
STRUCTURE OF COMPACT STORAGE OF POLYGONAL 3D MODELS WITH SELECTIVE ACCESS
08.06.2022 13:40
ДОСЛІДЖЕННЯ ІНТЕГРАЦІЇ ІНФОРМАЦІЙНИХ ТЕХНОЛОГІЙ В СФЕРУ БУДІВНИЦТВА
08.06.2022 12:04
КОЛЬОРОВА ПОЛЯРИЗАЦІЙНА ДІАГРАМА
08.06.2022 11:36

Конференції

Конференції 2025

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 95) (16-17.01.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 96) (11-12.02.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 97) (13-14.03.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 98) (15-16.04.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 99) (14-15.05.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 100) (11-12.06.2025)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 101) (09-10.07.2025)

Конференції 2024

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 84) (18-19.01.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 85) (15-16.02.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 86) (12-13.03.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 87) (11-12.04.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 88) (14-15.05.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 89) (12-13.06.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 90) (9-10.07.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 91) (10-11.09.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 92) (8-9.10.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 93) (12-13.11.2024)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 94) (11-12.12.2024)

Конференції 2023

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 74) (06-07.02.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 75) (06-07.03.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 76) (03-04.04.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 77) (09-10.05.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 78) (08-09.06.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 79) (06-07.07.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 80) (19-20.09.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 81) (11-12.10.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 82) (9-10.11.2023)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 83) (7-8.12.2023)

Конференції 2022

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 65) (8-9.02.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 66) (6-7.04.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 67) (11-12.05.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 68) (7-8.06.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 69) (4-5.07.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 70) (22-23.09.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 71) (18-19.10.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 72) (15-16.11.2022)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 73) (08-09.12.2022)

Конференції 2021

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 55) (09.02.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 56) (10.03.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 57) (13.04.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 58) (12.05.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 59) (08.06.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 60) (13.07.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 61) (15.09.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 62) (12.10.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 63) (11.11.2021)

Інформаційне суспільство: технологічні, економічні та технічні аспекти становлення (випуск 64) (10.12.2021)

Вас вітає Інтернет конференція!

Рік заснування видання - 2011

CHARACTERISTICS OF THE MAIN NLP MODELS

Інші наукові праці даної секції