Сочинение на тему История Hadoop

Опубликовано: 09.09.2020
Предмет: Информационная наука
Темы: Информационные технологии, компьютер, Компьютерное программирование

Hadoop – это среда программирования на основе Java с открытым исходным кодом, которая поддерживает вычисления и хранение чрезвычайно больших наборов данных в распределенной вычислительной среде. Это раздел проекта Apache, созданный Apache Software Foundation.

История Hadoop

По мере роста Всемирной паутины в конце 1910-х и 2010-х гг. были созданы поисковые системы и индексы, которые помогают находить релевантную информацию среди видео контента. В первые годы результаты поиска были объявлены людьми. Но поскольку сеть выросла с десятков до миллионов страниц, автоматизация была необходима. Были созданы веб-сканеры, многие из которых были научными проектами, проводимыми университетами, и запуск поисковых систем (Yahoo, AltaVista и т. Д.).

Одним из таких проектов был поисковый движок с открытым исходным кодом Nutch – детище Doug Cutting и Mike Cafarella. Они хотели быстрее возвращать результаты веб-поиска, распределяя данные и расчеты по разным компьютерам, чтобы одновременно можно было выполнять несколько задач. В это время еще один проект поисковой системы под названием Google находился в процессе. Он основывался на той же концепции – хранение и обработка данных распределенным, автоматическим способом, чтобы соответствующие результаты веб-поиска могли быть возвращены быстрее.

В 2006 году Каттинг присоединился к Yahoo и взял с собой проект Nutch, а также идеи, основанные на ранней работе Google по автоматизации распределенного хранения и обработки данных. Проект Nutch был разделен – часть поискового робота осталась за Nutch, а часть распределенных вычислений и обработки стала Hadoop (названной в честь игрушечного слона сына Каттинга). В 2008 году Yahoo выпустила Hadoop как проект с открытым исходным кодом. Сегодня структура и экосистема технологий Hadoop управляются и поддерживаются некоммерческим Apache Software Foundation (ASF), глобальным сообществом разработчиков и разработчиков программного обеспечения.

Приложения Hadoop

Сектор здравоохранения: – Большие данные в здравоохранении используются для сокращения накладных расходов, лечения заболеваний, повышения прибыли, прогнозирования эпидемий и повышения качества жизни людей путем предотвращения смерти. Научно-исследовательские лаборатории, больницы и другие медицинские учреждения используют аналитику больших данных для сокращения расходов на здравоохранение путем изменения моделей предоставления лечения. Здесь начинается путешествие по большим данным в здравоохранении, выделяя известные приложения больших данных в сфере здравоохранения.

Объем данных на предприятии будет расти в 50 раз по сравнению с прошлым годом до 2020 года.

Объем бизнес-данных по всему миру во всех компаниях удваивается каждые 1,2 года.

Еще в 2010 году Эрик Шмидт сказал, что каждые 2 дня мы создаем столько информации, сколько и с зари цивилизации до 2003 года.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Краткая история кибербезопасности

30.10.2020 Комментариев нет

Кибербезопасность или защита информационных технологий – это методы защиты компьютеров, сетей, программ и данных от несанкционированного доступа или атак, направленных на эксплуатацию. Существует четыре типа

Читать полностью »

Сравнение двух языков программирования

30.10.2020 Комментариев нет

Поскольку теперь доступно несколько вариантов языка программирования, весьма обычно программистам сложно сделать выбор. Вот почему мы собрали информацию о двух наиболее известных языках и представили

Читать полностью »

Несколько советов от команды реагирования на инциденты компьютерной безопасности

30.10.2020 Комментариев нет

Группа реагирования на инциденты в области компьютерной безопасности (CSIRT, пояснено «see-sirt») – это подразделение, которое получает отчеты о взрывах безопасности, проводит проверки отчетов и отвечает

Читать полностью »