Сочинение на тему Ограничения классификации ближайших соседей
- Опубликовано: 19.05.2020
- Предмет: жизнь, образование
- Темы: Дом, Исследование, Обучение, соседи
K-Nearest Neighbor (KNN) – один из самых популярных алгоритмов распознавания образов. Многие исследователи обнаружили, что алгоритм KNN обеспечивает очень хорошую производительность в своих экспериментах на разных наборах данных. Традиционный алгоритм классификации KNN имеет три ограничения: (i) сложность расчета из-за использования всех обучающих выборок для классификации, (ii) производительность зависит исключительно от обучающего набора и выбора k.
Поиск ближайших соседей – один из самых популярных методов обучения и классификации, предложенных Фиксом и Ходжесом, который оказался простым и мощным алгоритмом распознавания. Ковер и Харт показали, что правило принятия решений работает хорошо, учитывая, что нет явных знаний о данных. Простое обобщение этого метода называется правилом K-NN, в котором новый шаблон классифицируется в классе с наибольшим числом членов среди K ближайших соседей.
Традиционная классификация текста KNN имеет три ограничения:
- Высокая сложность вычислений. Чтобы определить k ближайших соседних выборок, все сходства между обучающими выборками меньше, классификатор KNN больше не является оптимальным, но если обучающий набор содержит огромное количество выборок, классификатор KNN нужно больше времени для вычисления сходства. Эта проблема может быть решена тремя способами: уменьшение размеров пространства объектов; использование меньших наборов данных; используя улучшенный алгоритм, который может ускоряться до;
Эффективность kNNC во многом зависит от эффективного выбора k-ближайших соседей. Ограничение обычного kNNC состоит в том, что, как только мы выбираем критерии для выбора k-ближайших соседей, критерии остаются неизменными. Но эта характеристика kNNC не подходит для многих случаев, если мы хотим сделать правильный прогноз или классификацию в реальной жизни. Экземпляр описывается в базе данных с использованием ряда атрибутов и соответствующих значений этих атрибутов. Таким образом, сходство между любыми двумя экземплярами определяется сходством значений атрибутов. Но в реальных данных, когда мы описываем два экземпляра и пытаемся выяснить сходство между этими двумя, сходства в разных атрибутах не имеют одинакового веса в отношении конкретной классификации. Более того, поскольку со временем поступает больше обучающих данных, может случиться так, что сходство в конкретном значении атрибута будет иметь более или менее важное значение, чем раньше. Например, скажем, мы пытаемся предсказать исход футбольного матча на основе предыдущих результатов. Теперь в этом прогнозе место и погода играют очень важную роль в исходе игры. Но в будущем, если все футбольные матчи будут проходить на закрытых стадионах, полевая погода больше не будет оказывать одинакового влияния на исход игры.
Если взглянуть на школы в Ричмонде, штат Калифорния, и сравнить их со школами в Конкорде, штат Калифорния, можно увидеть огромную разницу. Мало того, что жилой
Преподавание существительных в важной области интересов в преподавании английского языка, которая всегда привлекала мое внимание и внимание моих учеников. Это обширная область, которая может связать
В графическом романе Элисон Бешдель «Веселый дом» она рассказывает о своей семье, но больше о своих отношениях с отцом. Она изображает своего отца эмоционально разъединенным