Сочинение на тему Функции интеллектуального анализа данных
- Опубликовано: 02.09.2020
- Предмет: Информационная наука
- Темы: Информационные технологии, Сбор данных
Различные типы шаблонов могут быть обнаружены в зависимости от используемых задач интеллектуального анализа данных. Выполняется два типа задач интеллектуального анализа данных: описательные задачи интеллектуального анализа данных, которые имеют дело с общими свойствами существующих данных, и интеллектуальные задачи интеллектуального анализа данных, которые пытаются идентифицировать прогнозы на основе доступных данных. Функции интеллектуального анализа данных и разнообразные знания, которые они обнаруживают, кратко представлены в следующем списке:
- Характеристика. Это обобщение общих характеристик объектов в целевом классе и создание так называемых характеристических правил. Данные, относящиеся к указанному пользователем классу, обычно извлекаются запросом к базе данных и проходят через модуль суммирования, чтобы извлечь сущность данных на разных уровнях абстракций. Например, можно пожелать охарактеризовать покупателей магазина, которые регулярно арендуют более 30 фильмов в год. С иерархиями понятий на атрибутах, описывающих целевой класс, метод индуктивно-ориентированной индукции может использоваться для выполнения суммирования данных. С кубом данных, содержащим суммирование данных, простые операции OLAP соответствуют цели характеристики данных.
- Дискриминация. Дискриминация данных порождает так называемые дискриминируемые правила и представляет собой сравнение общих свойств объектов между двумя классами, называемыми целевым классом и контрастным классом. Например, можно пожелать сравнить общие характеристики клиентов, которые арендовали более 30 фильмов за последний год, с теми, чья арендная запись меньше 5. Методы, используемые 49 для распознавания данных, аналогичны методам, используемым для характеристики данных. за исключением того, что результаты дискриминации данных включают сравнительные меры.
- Анализ ассоциации. Анализ ассоциации изучает частоту появления элементов в транзакционных базах данных и на основе порога, называемого поддержкой, идентифицирует наборы частых элементов. Другой порог, доверие, которое является условной вероятностью появления элемента в транзакции при появлении другого элемента, используется для определения правил связывания. Это обычно используется для анализа корзины. Например, руководителю может быть полезно узнать, какие фильмы часто снимаются вместе или есть ли связь между арендой фильмов определенного типа и покупкой попкорна или поп-музыки. Обнаруженные правила ассоциации имеют вид: P → Q [s, c], где P и Q – соединения пар значений атрибута, а s (поддержка) – вероятность того, что P и Q появятся вместе в транзакции, а c ( достоверность) – это условная вероятность того, что Q появляется в транзакции, когда присутствует P. Например, RentType (X, «game») ∧Age (X, «13-19») → Buys (X, «pop») [s = 2%, = 55%] Приведенное выше правило будет означать, что 2% Рассматриваемые транзакции касаются клиентов в возрасте от 13 до 19 лет, которые арендуют игру и покупают поп, и что существует 55% уверенность, что подростковые клиенты, которые арендуют игру, также покупают поп.
- Классификация. Это организация данных в заданных классах. Классификация использует заданные метки классов для упорядочения объектов в сборе данных. Подходы классификации обычно используют обучающий набор, где все объекты уже связаны с известными метками классов. Алгоритм классификации учится на тренировочном наборе и строит модель. Модель используется для классификации новых объектов. Например, после запуска кредитной политики менеджер магазина может проанализировать поведение покупателей по отношению к их кредиту и соответствующим образом пометить покупателей, которые получили кредиты, тремя возможными метками «безопасный», «рискованный» и «очень рискованный». Классификационный анализ создаст модель, которая может использоваться для принятия или отклонения кредитных заявок в будущем.
Кибербезопасность или защита информационных технологий – это методы защиты компьютеров, сетей, программ и данных от несанкционированного доступа или атак, направленных на эксплуатацию. Существует четыре типа
Ахмад Альдхафири CEGR 4802/1/2018 ГИС Геоинформационная система (ГИС) – это система, предназначенная для сбора, хранения, обработки, анализа, управления и представления всех типов географических данных. Ключевым
Биткойн становится все более популярным и победоносным в мире криптовалют. С момента его создания в 2009 году стоимость биткойна в 2018 году выросла втрое. В