Сочинение на тему Информационные и информационные системы

Опубликовано: 14.10.2020
Предмет: Информационная наука
Темы: Информационные системы

Большие данные используются для обозначения огромного количества как структурированных, так и неструктурированных данных, которые настолько велики, что с ними трудно работать, используя обычные базы данных и программные методы. На большинстве предприятий объем данных слишком велик, или он перемещается слишком быстро, или превышает текущую вычислительную мощность. Большие данные могут быть проанализированы для понимания, которые приводят к лучшим решениям и стратегическим деловым движениям. Хотя термин «большие данные» является относительно новым, сам процесс хранения больших объемов информации для последующего изучения довольно стар. Большие данные связаны с тремя V: объем. Мы собираем данные о бизнес-транзакциях, социальных сетях и информацию с датчиков или с компьютера на компьютер. В прошлом его хранение было бы проблемой, но новые технологии, такие как Hadoop, сделали это легко. Скорость. Потоки данных передаются с высокой скоростью и должны обрабатываться своевременно. RFID-метки, датчики и интеллектуальные измерения приводят к необходимости обрабатывать потоки данных практически в реальном времени. Разнообразие. Данные поступают во всех типах структурированных форм, числовые данные в традиционных базах данных в неструктурированные текстовые документы, электронную почту, видео, аудио, данные биржевых расписок и финансовые транзакции. И еще два фактора: изменчивость.

В дополнение к высоким скоростям и различным типам данных потоки данных могут быть очень несовместимыми с периодами роста. Что-то становится вирусным в Интернете? С высокими нагрузками на данные может быть сложно справиться, а с неструктурированными – сложнее. Сложность. В настоящее время данные имеют несколько источников, что затрудняет связывание, сопоставление, очистку и преобразование данных в разных системах. Но необходимо связывать и коррелировать отношения, иерархии и связи данных, иначе ваши данные могут выйти из-под контроля. Большие данные могут помочь компаниям улучшить работу и принимать более быстрые и разумные решения. Данные поступают из ряда источников, включая электронную почту, мобильные устройства, приложения, базы данных, серверы, данные биржевых расписок и финансовые транзакции. Эти данные, когда они собираются, форматируются, обрабатываются, хранятся и затем анализируются, могут помочь компании получить полезную информацию для увеличения доходов, получения или удержания клиентов и улучшения операций.

Важность больших данных не в том, сколько у вас данных, а в том, что вы с ними делаете. Вы можете взять данные из любого источника и проанализировать их, чтобы найти ответы, которые позволяют: 1) сократить расходы 2) сократить время 3) разработать новый продукт и оптимизировать предложения 4) принимать разумные решения. Аналитика больших данных – это способ изучения больших и разнообразных наборов данных. большие данные – для выявления скрытых закономерностей, неизвестных взаимосвязей, тенденций на рынке, предпочтений клиентов и информации, которая может помочь организациям принимать более обоснованные бизнес-решения. Когда вы объединяете большие данные с мощной аналитикой, вы можете выполнять такие задачи, как: Поиск причин сбоев, проблем и дефектов практически в реальном времени. Изготовление купонов в точках продаж на основе покупательских привычек покупателя. Перерасчет полных портфелей рисков в кратчайшие сроки.

Поиск мошеннического поведения до того, как оно повлияет на вашу организацию. В широком масштабе технологии и методы анализа данных предоставляют средства для анализа наборов данных и получения выводов о них, чтобы помочь организациям принимать обоснованные бизнес-решения. BI-запросы отвечают на основные вопросы о бизнес-операциях и производительности. Аналитика больших данных – это одна из форм расширенной аналитики, которая включает в себя сложные приложения с такими элементами, как прогнозирующие модели, статистические алгоритмы и анализ «что если» на основе высокопроизводительных аналитических систем. В результате многие организации, которые собирают, обрабатывают и анализируют большие данные, обращаются к базам данных NoSQL, а также к Hadoop и его сопутствующим инструментам, в том числе: YARN: технология управления кластером и одна из ключевых функций Hadoop второго поколения.

MapReduce: программная среда, которая позволяет разработчикам писать программы, которые параллельно обрабатывают огромные объемы неструктурированных данных на распределенном кластере процессоров или автономных компьютерах. Spark: платформа параллельной обработки с открытым исходным кодом, которая позволяет пользователям запускать крупномасштабные приложения для анализа данных в кластерных системах. HBase: ориентированное на столбцы хранилище данных ключ / значение, созданное для работы поверх распределенной файловой системы Hadoop (HDFS). Hive: система хранилища данных с открытым исходным кодом для запросов и анализа больших наборов данных, хранящихся в файлах Hadoop. Kafka: распределенная система обмена сообщениями с публикацией и подпиской, предназначенная для замены традиционных брокеров сообщений. Pig: технология с открытым исходным кодом, которая предлагает высокоуровневый механизм для параллельного программирования заданий MapReduce, выполняемых на кластерах Hadoop.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Концепции информационного и контент-майнинга, плохое качество информации

29.09.2020 Комментариев нет

Каковы коммерческие расходы или риски, связанные с качеством информации? Самая серьезная проблема в бизнесе – это плохое качество информации (Брюс Роджерс), так как многие предприятия

Читать полностью »

Как написать назначение информационных систем

08.09.2020 Комментариев нет

Три важных этапа подготовки к назначению информационных систем. Создайте точку Основная задача заключается в том, чтобы понять вашу точку зрения и степень вашего исследования, прежде

Читать полностью »

Кафедра компьютерных наук и информационных систем

05.09.2020 Комментариев нет

Аннотация: Голограмма – это новая технология для представления и отображения визуальной информации с высокими ожиданиями с точки зрения пользовательского опыта. Голограмма – это

Читать полностью »