Сочинение на тему Аналитика больших данных и ее алгоритмы

Опубликовано: 22.08.2020
Предмет: Информационная наука
Темы: Большое количество данных, компьютер, Компьютерная наука

Аналитика больших данных включает сбор данных из нескольких ресурсов, хранение их таким образом, чтобы они стали достаточно структурированными для обработки аналитиками данных и в конечном итоге доставили продукт данных, полезный для организаций или предприятий. Процесс преобразования большого количества неструктурированных необработанных данных, собранных из разных источников, для получения отфильтрованного, чистого и полезного набора данных формирует цель анализа данных.

Алгоритмы майнинга для определенных задач. Наряду с большими данными одновременно появился большой анализ данных, который заключил, что поиск чего-либо из больших данных будет одной из основных задач в области исследований. Алгоритмы интеллектуального анализа данных играют важную роль в анализе больших данных с точки зрения стоимости вычислений, требований к хранилищу и точности результатов. Некоторые примеры алгоритмов извлечения больших данных приведены ниже

Алгоритмы кластеризации. Когда мы говорим о больших данных, традиционные алгоритмы кластеризации становятся абсолютными, так как им, как правило, требуется, чтобы данные присутствовали в одном формате, а данные должны быть загружены на тот же компьютер, чтобы найти информацию о наших потребностях. Многие исследователи из разных областей были привлечены к многомерному и крупномасштабному набору данных, и в связи с тем, что в последние несколько лет было представлено несколько решений, свойства больших данных все еще поднимают много новых проблем для алгоритмов кластеров данных. Среди них снижение сложности данных является одной из основных проблем кластеризации больших данных.

Алгоритмы классификации. Подобно алгоритмам кластеризации для добычи больших данных, различные исследователи также пытались обновить традиционные алгоритмы классификации, чтобы они могли обрабатывать данные в среде параллельных вычислений. В алгоритме классификации входные данные, которые генерируются различными источниками данных, будут обрабатываться разнородной группой учащихся. Такин и соавт. представил новый алгоритм классификации под названием «Классифицировать или отправить на классификацию (CoS)». Предполагается, что каждый учащийся может использоваться для обработки входных данных двумя различными способами в распределенной системе классификации данных. Один выполняет классификационную функцию, а другой пересылает входные данные другому ученику, чтобы пометить их. Информация будет постоянно обмениваться между разными учениками.

Алгоритмы интеллектуального анализа шаблонов. Большинство исследователей, работающих над алгоритмом интеллектуального анализа шаблонов (включает в себя правила сопоставления и последовательный анализ шаблонов), изначально были сосредоточены на анализе крупномасштабных данных крупных торговых сетей. Количество транзакций превысило миллионы, вопрос о том, как обрабатывать большие данные, изучался много лет. Одним из предложенных способов было FP-дерево, использующее древовидную структуру для включения частых шаблонов данных, чтобы сократить время вычислений при добыче данных. Кроме того, параллельные вычисления и технологии облачных вычислений привлекли исследователей.

Решение Map-Reduce использовалось в исследованиях для повышения эффективности алгоритма поиска по частым шаблонам, исследование также позволило пользователям выразить свои специфические ограничения интереса в алгоритме. Производительность возможности интеллектуального анализа данных этих алгоритмов может быть увеличена с помощью облачных вычислений, чем алгоритмы, работающие на одной машине.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Несколько советов от команды реагирования на инциденты компьютерной безопасности

30.10.2020 Комментариев нет

Группа реагирования на инциденты в области компьютерной безопасности (CSIRT, пояснено «see-sirt») – это подразделение, которое получает отчеты о взрывах безопасности, проводит проверки отчетов и отвечает

Читать полностью »

Позвоните в полицию. На моем компьютере преступник!

30.10.2020 Комментариев нет

Обычным сюжетом голливудских триллеров является устройство «Не отвечай на телефон». В этом фильме няня знает, что придет маньяк, чтобы убить ее или детей. Важный момент

Читать полностью »

Как общаться с диалогами Microsoft Dynamics помогает пользователям CRM достичь дохода и успеха в обслуживании

29.10.2020 Комментариев нет

Миллионы пользователей полагаются на Microsoft Dynamics CRM в качестве основного центра всей своей клиентской информации. Конфронтные группы клиентов используют его для суммирования и разбивки информации

Читать полностью »