Сочинение на тему Майнинг частых предметов над потоками данных

Опубликовано: 16.08.2020
Предмет: Здоровье
Темы: Анализ данных, Лекарство

Работа, связанная с извлечением частых элементов через потоки, тесно связана с добычей частых элементов над потоками данных. Тем не менее, добыча Частых Предметов намного сложнее, чем подсчет одиночных предметов из-за комбинаторного взрыва количества наборов предметов. Обширные исследования были проведены по обработке запросов и управления данными в потоках данных. Вопросы моделей данных, языков запросов в контексте потоков данных являются основными темами исследований. Мы отсылаем читателей к превосходным обзорам Babcock et al. [4] и Golab и ¨Ozsu [19]. Некоторые предшествующие работы над алгоритмами потоковой передачи для майнинга Frequent Items включают Carma [1] и SWF [3]. Carma дважды сканирует базу данных транзакций, чтобы найти набор всех Частых элементов, где первое сканирование Carma может быть применено для вычисления ложно-положительного набора Частых элементов через окно ориентира. SWF добывает точный набор всех часто встречающихся предметов в скользящем окне, основанном на времени. SWF сначала вычисляет набор всех Частых элементов в первом окне, а затем требуется только одно сканирование базы данных для каждого инкрементного обновления. Однако сканирование всего окна для каждого слайда может быть недостаточно эффективным для обработки высокоскоростных потоков данных. Что касается недавнего развития добычи полезных ископаемых / FCI по потокам данных, нам известны следующие два исследования.

Джин и Агравал [20] разрабатывают Алгоритм потокового майнинга, используя потенциальные частые наборы из 2 элементов, и свойство Apriori, чтобы уменьшить количество наборов кандидатов. Они также проектируют резидентную структуру сводных данных, которая реализует компактное дерево префиксов с использованием хеш-таблицы. Их алгоритм является приблизительным и ложноположительным, что имеет детерминированные пределы точности. Принятая ими модель окна является ориентиром, и они не различают последние данные от старых. Cheng et al. [21] применяют модель скользящего окна для приблизительного анализа Частых элементов над потоками данных. Основным вкладом этой работы является то, что она предлагает постепенно увеличивающуюся функцию минимальной поддержки для решения дилеммы, вызванной? в большинстве существующих алгоритмов. Когда набор элементов сохраняется в окне дольше, метод требует минимального порога поддержки, чтобы приблизиться к минимальной поддержке Частого элемента. В результате он может увеличиваться o, чтобы значительно повысить эффективность майнинга и сэкономить потребление памяти за счет лишь незначительно сниженной точности. Предложенный алгоритм этой работы, названный MineSW, показан Cheng et al. превзойти улучшенную версию алгоритма, предложенного в [22], в котором применяется алгоритм подсчета с потерями [23] для поиска часто встречающихся предметов через скользящее окно.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Эффект плацебо пациента: понимание биохимического процесса

30.10.2020 Комментариев нет

Несмотря на то, что в клинических условиях много раз наблюдали преимущества эффекта плацебо у пациентов, внимательно изучая пациентов, проходящих лечение от болезни Паркинсона, лечения боли

Читать полностью »

Плюсы и минусы кесарева сечения доставки

30.10.2020 Комментариев нет

Доставка кесарева сечения также называется доставкой кесарева сечения. Этот способ включает развертывание операции по доставке детей, то есть одного или нескольких. Роды кесарева сечения часто

Читать полностью »

Как создать хорошее юридическое уведомление для вашего сайта

30.10.2020 Комментариев нет

Некоторые из самых частых вопросов, которые мы получаем, – это вопросы, которые касаются вопросов, связанных с законностью и налогообложением, которые связаны с созданием блога или

Читать полностью »