Term Frequency – обратная частота документов в корпусе документов
TF – IDF означает Term Frequency – Inverse Frequency для документа, используя этот TF-IDF вес документа, рассчитывается. Это числовая статистика, предназначенная для отражения того, насколько важно слово для документа в коллекции или корпусе. Он часто используется в качестве весового коэффициента при поиске информации, поиске текста и моделировании пользователей. Вес TF-IDF рассчитывается двумя терминами: TF: Term