Сочинение на тему Функции интеллектуального анализа данных

Опубликовано: 02.09.2020
Предмет: Информационная наука
Темы: Информационные технологии, Сбор данных

Различные типы шаблонов могут быть обнаружены в зависимости от используемых задач интеллектуального анализа данных. Выполняется два типа задач интеллектуального анализа данных: описательные задачи интеллектуального анализа данных, которые имеют дело с общими свойствами существующих данных, и интеллектуальные задачи интеллектуального анализа данных, которые пытаются идентифицировать прогнозы на основе доступных данных. Функции интеллектуального анализа данных и разнообразные знания, которые они обнаруживают, кратко представлены в следующем списке:

Характеристика. Это обобщение общих характеристик объектов в целевом классе и создание так называемых характеристических правил. Данные, относящиеся к указанному пользователем классу, обычно извлекаются запросом к базе данных и проходят через модуль суммирования, чтобы извлечь сущность данных на разных уровнях абстракций. Например, можно пожелать охарактеризовать покупателей магазина, которые регулярно арендуют более 30 фильмов в год. С иерархиями понятий на атрибутах, описывающих целевой класс, метод индуктивно-ориентированной индукции может использоваться для выполнения суммирования данных. С кубом данных, содержащим суммирование данных, простые операции OLAP соответствуют цели характеристики данных.

Дискриминация. Дискриминация данных порождает так называемые дискриминируемые правила и представляет собой сравнение общих свойств объектов между двумя классами, называемыми целевым классом и контрастным классом. Например, можно пожелать сравнить общие характеристики клиентов, которые арендовали более 30 фильмов за последний год, с теми, чья арендная запись меньше 5. Методы, используемые 49 для распознавания данных, аналогичны методам, используемым для характеристики данных. за исключением того, что результаты дискриминации данных включают сравнительные меры.

Анализ ассоциации. Анализ ассоциации изучает частоту появления элементов в транзакционных базах данных и на основе порога, называемого поддержкой, идентифицирует наборы частых элементов. Другой порог, доверие, которое является условной вероятностью появления элемента в транзакции при появлении другого элемента, используется для определения правил связывания. Это обычно используется для анализа корзины. Например, руководителю может быть полезно узнать, какие фильмы часто снимаются вместе или есть ли связь между арендой фильмов определенного типа и покупкой попкорна или поп-музыки. Обнаруженные правила ассоциации имеют вид: P → Q [s, c], где P и Q – соединения пар значений атрибута, а s (поддержка) – вероятность того, что P и Q появятся вместе в транзакции, а c ( достоверность) – это условная вероятность того, что Q появляется в транзакции, когда присутствует P. Например, RentType (X, «game») ∧Age (X, «13-19») → Buys (X, «pop») [s = 2%, = 55%] Приведенное выше правило будет означать, что 2% Рассматриваемые транзакции касаются клиентов в возрасте от 13 до 19 лет, которые арендуют игру и покупают поп, и что существует 55% уверенность, что подростковые клиенты, которые арендуют игру, также покупают поп.

Классификация. Это организация данных в заданных классах. Классификация использует заданные метки классов для упорядочения объектов в сборе данных. Подходы классификации обычно используют обучающий набор, где все объекты уже связаны с известными метками классов. Алгоритм классификации учится на тренировочном наборе и строит модель. Модель используется для классификации новых объектов. Например, после запуска кредитной политики менеджер магазина может проанализировать поведение покупателей по отношению к их кредиту и соответствующим образом пометить покупателей, которые получили кредиты, тремя возможными метками «безопасный», «рискованный» и «очень рискованный». Классификационный анализ создаст модель, которая может использоваться для принятия или отклонения кредитных заявок в будущем.

Прогноз. Прогноз привлек значительное внимание, учитывая потенциальные последствия успешного прогнозирования в контексте бизнеса. Существует два основных 50 типов прогнозов: один может либо попытаться предсказать некоторые недоступные значения данных или ожидающие тенденции, либо предсказать метку класса для некоторых данных. Последнее связано с классификацией. Как только модель классификации построена на основе обучающего набора, можно предвидеть метку класса объекта на основе значений атрибутов объекта и значений атрибутов классов. Прогноз, однако, чаще относится к прогнозу пропущенных числовых значений или к увеличению / уменьшению трендов во временных данных. Основная идея состоит в том, чтобы использовать большое количество прошлых значений для рассмотрения возможных будущих значений.

Кластеризация. Подобно классификации, кластеризация – это организация данных в классах. Однако, в отличие от классификации, в кластеризации метки классов неизвестны, и алгоритм кластеризации должен находить приемлемые классы. Кластеризацию также называют неконтролируемой классификацией, потому что классификация не продиктована данными метками классов. Существует много подходов к кластеризации, основанных на принципе максимизации сходства между объектами одного класса (сходство внутри класса) и минимизации сходства между объектами разных классов (сходство между классами).

Анализ выбросов: выбросы – это элементы данных, которые нельзя сгруппировать в данном классе или кластере. Также известные как исключения или неожиданности, их часто очень важно идентифицировать. Хотя выбросы могут считаться шумом и отбрасываться в некоторых приложениях, они могут выявить важные знания в других областях и, таким образом, могут быть очень значительными, а их анализ – ценным.

Анализ эволюции и отклонений. Анализ эволюции и отклонений относится к изучению связанных со временем данных, которые изменяются во времени. Эволюционный анализ моделирует эволюционные тенденции в данных, которые согласуются для характеристики, сравнения, классификации или кластеризации данных, связанных со временем. Анализ отклонений, с другой стороны, рассматривает различия между измеренными значениями и ожидаемыми значениями и пытается найти причину отклонений от ожидаемых значений. Часто пользователи не имеют четкого представления о типах шаблонов, которые они могут обнаружить или которые им необходимо обнаружить из имеющихся данных. Поэтому важно иметь универсальную и инклюзивную систему интеллектуального анализа данных, которая позволяет обнаруживать различные виды знаний и на разных уровнях абстракции. Это также делает интерактивность важным атрибутом системы интеллектуального анализа данных.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Краткая история кибербезопасности

30.10.2020 Комментариев нет

Кибербезопасность или защита информационных технологий – это методы защиты компьютеров, сетей, программ и данных от несанкционированного доступа или атак, направленных на эксплуатацию. Существует четыре типа

Читать полностью »

Геоинформационная система (ГИС)

30.10.2020 Комментариев нет

Ахмад Альдхафири CEGR 4802/1/2018 ГИС Геоинформационная система (ГИС) – это система, предназначенная для сбора, хранения, обработки, анализа, управления и представления всех типов географических данных. Ключевым

Читать полностью »

Как вы можете зарабатывать деньги в Интернете с помощью биткойнов

29.10.2020 Комментариев нет

Биткойн становится все более популярным и победоносным в мире криптовалют. С момента его создания в 2009 году стоимость биткойна в 2018 году выросла втрое. В

Читать полностью »