Введение в Word2Vec
Алгоритм кластеризации, такой как k-means, обычно требует, чтобы ввод текста был представлен как вектор фиксированной длины. Этот вид представления очень важен для обработки естественного языка. Представление слов из документов в виде разреженных векторов, полученных с помощью методов обучения нейронных сетей, называется Word Embeddings. Word2vec – это группа связанных моделей, которые используются для встраивания слов. Эти