Основа для кластеризации слов в предложениях Bangla с использованием языковой модели высшего порядка N-Gram
Кластеризация слов – это метод, который используется для разбиения наборов слов на подмножества семантически похожих слов. Кластеризация слов имеет решающее значение во многих приложениях обработки естественного языка, таких как теги POS, проверка орфографии, проверка грамматики, устранение неоднозначности смысла слов и многое другое. В этой статье мы предлагаем модель с использованием языковой модели высшего порядка N-граммы,