Обработка в реальном времени и потоковая обработка больших данных сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Обработка в реальном времени и потоковая обработка больших данных

В последнее время парадигма «больших данных» становится все более популярной. Термин «большие данные» широко признан как наборы данных, обладающих такой важностью, из-за их сложности, которую нельзя компилировать и манипулировать с помощью устаревших технологий, таких как реляционные базы данных (RDBMS). Помимо размера, скорости и разнообразия существуют и другие ключевые ограничения данных. Есть много источников, которые генерируют большие объемы данных. В частности, Интернет, социальные сети в Интернете, электронные изображения и появляющиеся технологии, такие как биоинформатика, космология и физика, – это лишь несколько примеров важных источников данных, которые следует упомянуть. Появление облачных вычислений также облегчило обработку данных и майнинг.

В настоящее время большое количество данных производится из разных источников, с высокой потребностью в хранении, управлении, манипулировании и запросе больших объемов данных. Несмотря на то, что Hadoop очень хорошо подходит для пакетных заданий, с другой стороны, все больше и больше людей ищут не пакетные приложения, такие как: многоканальная работа, онлайн-запросы и большие объемы данных. С Hadoop, не подходящим для таких не пакетных рабочих процессов, эти новые проблемы решаются с помощью новых решений. Обсуждались два типа решений: обработка в реальном времени и потоковая обработка больших данных.

Например, как обрабатывать высокоскоростные динамические запросы в системах хранения данных в режиме реального времени таким образом, чтобы пользователь мог получить свои результаты всего за несколько секунд, а не за несколько часов. Для обработки в реальном времени основное внимание уделяется предоставлению решений, которые могут обрабатывать большие объемы данных высокоскоростным и интуитивно понятным способом. Обработка потока обрабатывает проблемы с входящими данными, которые не сохраняются полностью. Оператор соединения, который используется для объединения потока с основными данными. Одна из проблем здесь заключается в том, почему такие объединения на основе потоков следует считать важными, поскольку традиционные объединения уже существуют и хорошо поняты. С другой стороны, в шаблоне потока кортежи поступают непрерывно и должны обрабатываться идентичным образом. Другими словами, поскольку вы не можете сохранить весь поток в памяти, вы также не можете использовать функцию индексации для извлечения кортежей. Поэтому обычный оператор соединения постоянно обрабатывает данные. Обычно такие объединения являются полностью функциональными операторами состояния. В качестве альтернативы необходимо извлечь все кортежи предыдущих сегментов и, в конечном итоге, переполнить оставшуюся память.

При соединении на диске каждый кортеж потока s S должен быть соединен с основным кортежем дискового отношения r R. Обычно отношение R хранится на диске. Наиболее важная вещь против такого рода объединений – это доступ к дисковой базе данных, основанной на стоимости ввода-вывода, которая считается основным фактором при объединении этих отношений. Это происходит из-за разницы между скоростью поступления потока и дисковым отношением R. Поэтому необходимо амортизировать стоимость затрат на восходящий ввод-вывод в сравнении с высокоскоростным потоком. Целью данного тезиса является анализ этих типов операторов соединения на основе потоков. В этом тезисе различные алгоритмы объединения обрабатываются как один вход в виде потока, а другой ввод – из основных данных на диске. Совместно обрабатывать такую ​​конфигурацию, где оба входа имеют разные скорости, сложнее, чем обрабатывать все входы с одинаковыми скоростями поступления. В следующем разделе обсуждаются некоторые известные алгоритмы объединения, а также их ограничения.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.