Что такое большие данные? сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Что такое большие данные?

Искусственный интеллект (AI), мобильные устройства, социальные сети и Интернет вещей (IoT) определяют сложность данных, новые формы и источники данных. Аналитика больших данных – это использование передовых методов анализа в отношении очень больших, разнообразных наборов данных, которые включают структурированные, полуструктурированные и неструктурированные данные из разных источников и в разных размерах от терабайтов до зетабайтов. Большие данные – это термин, применяемый к наборам данных, чьи Размер или тип недоступны для традиционных реляционных баз данных для сбора, обработки и обработки данных с малой задержкой. И он имеет одну или несколько из следующих характеристик – большой объем, высокая скорость или большое разнообразие. Большие данные поступают от датчиков, устройств, видео / аудио, сетей, файлов журналов, транзакционных приложений, Интернета и социальных сетей – большая часть их генерируется в режиме реального времени и в очень большом масштабе. Анализ больших данных позволяет аналитикам, исследователям и бизнесу пользователи могут принимать более качественные и быстрые решения, используя данные, которые ранее были недоступны или недоступны.

Используя передовые методы анализа, такие как анализ текста, машинное обучение, прогнозирующая аналитика, интеллектуальный анализ данных, статистика и обработка на естественном языке, предприятия могут анализировать ранее неиспользованные источники данных независимо или вместе со своими существующими корпоративными данными, чтобы получить новые идеи, что приведет к улучшению и более быстрые решения. Quora и Facebook используют инструменты больших данных, чтобы больше узнать о вас и предоставить вам канал, который вам теоретически может показаться интересным. Тот факт, что канал не интересен, должен показать, насколько серьезна проблема. Компании, выпускающие кредитные карты, анализируют миллионы транзакций, чтобы найти схемы мошенничества. Может быть, если вы купили pepsi на карточке, а затем совершили крупную покупку билета, это может быть мошенником? Большие данные описывают целостную стратегию управления информацией, которая включает в себя и интегрирует многие новые типы данных и управление данными наряду с традиционными данными. Большие данные также были определяется четырьмя V: объем. Количество данных. Хотя объем указывает на большее количество данных, это гранулярный характер данных, которые являются уникальными.

Большие данные требуют обработки больших объемов неструктурированных данных Hadoop с низкой плотностью, то есть данных неизвестного значения, таких как потоки данных Twitter, потоки кликов на веб-странице и мобильное приложение, сетевой трафик, оборудование с поддержкой датчиков захват данных со скоростью света и многое другое. Задача больших данных – преобразовать такие данные Hadoop в ценную информацию. Для некоторых организаций это может быть десятки терабайт, для других – сотни петабайт. Скорость. Высокая скорость, с которой данные принимаются и, возможно, применяются. Данные с самой высокой скоростью обычно передаются непосредственно в память, а не записываются на диск. Некоторые приложения Интернета вещей (IoT) имеют последствия для здоровья и безопасности, которые требуют оценки в реальном времени и действий. Другие интеллектуальные продукты с поддержкой Интернета работают в режиме реального времени или почти в реальном времени. Например, потребительские приложения электронной коммерции стремятся объединить местоположение мобильного устройства и личные предпочтения, чтобы делать маркетинговые предложения, чувствительные ко времени. Оперативно, мобильные приложения имеют большое количество пользователей, увеличенный сетевой трафик и ожидают немедленного ответа.

Разнообразие. Новые неструктурированные типы данных. Неструктурированные и полуструктурированные типы данных, такие как текст, аудио и видео, требуют дополнительной обработки как для получения значения, так и для поддержки метаданных. После понимания неструктурированные данные предъявляют многие требования к структурированным данным, такие как суммирование, происхождение, возможность проверки и конфиденциальность. Дополнительная сложность возникает, когда данные из известного источника изменяются без уведомления. Частые изменения схемы или изменения в реальном времени являются огромным бременем как для транзакций, так и для аналитических сред. Значение. Данные имеют внутреннюю ценность, но они должны быть обнаружены. Существует ряд количественных и исследовательских методов, позволяющих извлекать пользу из данных – от выявления предпочтений или настроений потребителя, до вынесения соответствующего предложения по месту нахождения или определения оборудования, которое может выйти из строя.

Технологический прорыв заключается в том, что стоимость хранения и вычислений данных экспоненциально уменьшилась, что обеспечивает обилие данных, из которых статистический анализ всего набора данных по сравнению с ранее только выборкой. Технологический прорыв делает возможным гораздо более точные и точные решения. Однако поиск ценности также требует новых процессов обнаружения, в которых участвуют умные и проницательные аналитики, бизнес-пользователи и руководители. Реальная проблема с большими данными – это человеческая задача, которая учится задавать правильные вопросы, распознавать закономерности, делать обоснованные предположения и прогнозировать поведение.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.