Data Mining и хранилище данных сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Data Mining и хранилище данных

Современная экономика – это большой непрерывный поток данных. Возможность собирать, анализировать и использовать данные в интересах своей компании является бесценным активом. Процесс компиляции и организации данных в одну общую базу данных является хранилищем данных. Процесс интеллектуального анализа данных опирается на данные, скомпилированные на этапе размещения хранилища данных, для выявления значимых закономерностей.

Хранилище данных – это база данных, используемая для хранения данных. Это центральное хранилище данных, в котором хранятся данные из разных источников. Это хранилище данных затем используется для отчетности и анализа данных. Его можно использовать для создания отчетов о тенденциях для отчетности высшего руководства, таких как годовые и квартальные сравнения. Целью хранилища данных является предоставление пользователю гибкого доступа к данным. Хранилище данных, как правило, относится к комбинации множества различных баз данных по всему предприятию.

Хранилище данных подчеркивает сбор данных из различных источников для полезного анализа и доступа, но обычно не начинается с точки зрения конечного пользователя, которому может понадобиться доступ к специализированным, иногда локальным базам данных. Последняя идея известна как витрина данных.

Существует два подхода к хранилищу данных: сверху вниз и снизу вверх. Нисходящий подход приводит к раскладке витрин данных для определенных групп пользователей после создания полного хранилища данных. Подход «снизу вверх» сначала строит витрины данных, а затем объединяет их в одно всеобъемлющее хранилище данных.

Как правило, хранилище данных размещается на корпоративном мэйнфреймовом сервере или все чаще в облаке. Данные из различных приложений для онлайн-обработки транзакций (OLTP) и других источников выборочно извлекаются для использования аналитическими приложениями и пользовательскими запросами.

Термин «хранилище данных» был придуман Уильямом Инмоном, который известен как отец хранилищ данных. Инмон описал хранилище данных как предметно-ориентированный, интегрированный, изменяющийся во времени и энергонезависимый сбор данных, который поддерживает процесс принятия решений руководством.

Data Mining – это фактически анализ данных. Это компьютерный процесс, позволяющий анализировать и анализировать огромные наборы данных, которые либо были скомпилированы компьютером, либо введены в компьютер. При извлечении данных компьютер будет анализировать данные и извлекать из них смысл. Он также будет искать скрытые шаблоны в данных и пытаться предсказать будущее поведение. Data Mining в основном используется для поиска и отображения взаимосвязей между данными. Цель интеллектуального анализа данных, также известного как обнаружение знаний, состоит в том, чтобы позволить компаниям просматривать эти модели поведения, тенденции и / или отношения и иметь возможность учитывать их в своих решениях. Это позволяет предприятиям принимать упреждающие, основанные на знаниях решения.

Термин «интеллектуальный анализ данных» происходит от того факта, что процесс интеллектуального анализа данных, то есть поиск взаимосвязей между данными, аналогичен интеллектуальному анализу и поиску драгоценных материалов. Инструменты интеллектуального анализа данных используют искусственный интеллект, машинное обучение, статистику и системы баз данных для поиска корреляции между данными. Эти инструменты могут помочь ответить на деловые вопросы, которые традиционно занимали слишком много времени.

Data Mining включает в себя различные этапы, включая этап необработанного анализа, аспекты управления базой данных и данными, предварительную обработку данных, соображения модели и логического вывода, метрики интересности, соображения сложности, постобработку обнаруженных структур, визуализацию и онлайн-обновление.

В интеллектуальном анализе данных правила ассоциации создаются путем анализа данных на частые шаблоны if / then, а затем с использованием критериев поддержки и достоверности для определения наиболее важных отношений в данных. Поддержка – это то, как часто элементы появляются в базе данных, а достоверность – это количество раз, когда / тогда утверждения точны.

Другие параметры интеллектуального анализа данных включают анализ последовательности или пути, классификацию, кластеризацию и прогнозирование. Параметры анализа последовательности или пути ищут шаблоны, в которых одно событие приводит к другому более позднему событию. Последовательность – это упорядоченный список наборов элементов, и это общий тип структуры данных, встречающийся во многих базах данных. Параметр Classification ищет новые шаблоны и может привести к изменению способа организации данных. Алгоритмы классификации предсказывают переменные на основе других факторов в базе данных.

Параметры кластеризации находят и визуально документируют группы фактов, которые ранее были неизвестны. Кластеризация группирует набор объектов и объединяет их в зависимости от того, насколько они похожи друг на друга.

Пользователь может реализовать кластер различными способами, которые различают каждую модель кластеризации. Внедрение параметров в интеллектуальный анализ данных может выявить закономерности в данных, которые могут привести к разумным прогнозам на будущее, также известным как прогнозный анализ.

Методы интеллектуального анализа данных используются во многих областях исследований, включая математику, кибернетику, генетику и маркетинг. В то время как методы интеллектуального анализа данных являются средством повышения эффективности и прогнозирования поведения клиента, при правильном использовании бизнес может отличаться от своих конкурентов с помощью прогнозного анализа.

Веб-интеллектуальный анализ, тип интеллектуального анализа данных, используемый при управлении взаимоотношениями с клиентами, объединяет информацию, собранную с помощью традиционных методов и технологий интеллектуального анализа данных через Интернет. Веб-майнинг предназначен для понимания поведения клиентов и оценки эффективности конкретного веб-сайта.

Другие методы интеллектуального анализа данных включают сетевые подходы, основанные на многозадачном обучении для классификации шаблонов, обеспечения параллельного и масштабируемого выполнения алгоритмов интеллектуального анализа данных, интеллектуального анализа больших баз данных, обработки реляционных и сложных типов данных и машинного обучения. Машинное обучение – это инструмент интеллектуального анализа данных, который разрабатывает конкретные алгоритмы, из которых можно учиться и прогнозировать.

Как правило, преимущества интеллектуального анализа данных заключаются в способности выявлять скрытые шаблоны и взаимосвязи в данных, которые можно использовать для прогнозирования, влияющего на бизнес. Конкретные преимущества интеллектуального анализа данных зависят от цели и отрасли. Отделы продаж и маркетинга могут собирать данные о клиентах, чтобы повысить коэффициент конверсии потенциальных клиентов или создать индивидуальные маркетинговые кампании. Информационный анализ данных об исторических моделях продаж и поведении клиентов может использоваться для построения моделей прогнозирования будущих продаж, новых продуктов и услуг.

Компании в финансовой отрасли используют инструменты интеллектуального анализа данных для построения моделей риска и выявления случаев мошенничества. В обрабатывающей промышленности используются инструменты интеллектуального анализа данных для повышения безопасности продукции, выявления проблем с качеством, управления цепочкой поставок и улучшения операций.

Основное различие между хранилищем данных и интеллектуальным анализом данных заключается в том, что хранилище данных представляет собой процесс компиляции и организации данных в одну общую базу данных, тогда как интеллектуальный анализ данных представляет собой процесс извлечения значимых данных из этой базы данных. Интеллектуальный анализ данных может быть выполнен только после завершения хранилища данных.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.