Майнинг частых предметов над потоками данных сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Майнинг частых предметов над потоками данных

Работа, связанная с извлечением частых элементов через потоки, тесно связана с добычей частых элементов над потоками данных. Тем не менее, добыча Частых Предметов намного сложнее, чем подсчет одиночных предметов из-за комбинаторного взрыва количества наборов предметов. Обширные исследования были проведены по обработке запросов и управления данными в потоках данных. Вопросы моделей данных, языков запросов в контексте потоков данных являются основными темами исследований. Мы отсылаем читателей к превосходным обзорам Babcock et al. [4] и Golab и ¨Ozsu [19]. Некоторые предшествующие работы над алгоритмами потоковой передачи для майнинга Frequent Items включают Carma [1] и SWF [3]. Carma дважды сканирует базу данных транзакций, чтобы найти набор всех Частых элементов, где первое сканирование Carma может быть применено для вычисления ложно-положительного набора Частых элементов через окно ориентира. SWF добывает точный набор всех часто встречающихся предметов в скользящем окне, основанном на времени. SWF сначала вычисляет набор всех Частых элементов в первом окне, а затем требуется только одно сканирование базы данных для каждого инкрементного обновления. Однако сканирование всего окна для каждого слайда может быть недостаточно эффективным для обработки высокоскоростных потоков данных. Что касается недавнего развития добычи полезных ископаемых / FCI по потокам данных, нам известны следующие два исследования.

Джин и Агравал [20] разрабатывают Алгоритм потокового майнинга, используя потенциальные частые наборы из 2 элементов, и свойство Apriori, чтобы уменьшить количество наборов кандидатов. Они также проектируют резидентную структуру сводных данных, которая реализует компактное дерево префиксов с использованием хеш-таблицы. Их алгоритм является приблизительным и ложноположительным, что имеет детерминированные пределы точности. Принятая ими модель окна является ориентиром, и они не различают последние данные от старых. Cheng et al. [21] применяют модель скользящего окна для приблизительного анализа Частых элементов над потоками данных. Основным вкладом этой работы является то, что она предлагает постепенно увеличивающуюся функцию минимальной поддержки для решения дилеммы, вызванной? в большинстве существующих алгоритмов. Когда набор элементов сохраняется в окне дольше, метод требует минимального порога поддержки, чтобы приблизиться к минимальной поддержке Частого элемента. В результате он может увеличиваться o, чтобы значительно повысить эффективность майнинга и сэкономить потребление памяти за счет лишь незначительно сниженной точности. Предложенный алгоритм этой работы, названный MineSW, показан Cheng et al. превзойти улучшенную версию алгоритма, предложенного в [22], в котором применяется алгоритм подсчета с потерями [23] для поиска часто встречающихся предметов через скользящее окно.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.