История Hadoop сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Hadoop – это среда программирования на основе Java с открытым исходным кодом, которая поддерживает вычисления и хранение чрезвычайно больших наборов данных в распределенной вычислительной среде. Это раздел проекта Apache, созданный Apache Software Foundation.

История Hadoop

По мере роста Всемирной паутины в конце 1910-х и 2010-х гг. были созданы поисковые системы и индексы, которые помогают находить релевантную информацию среди видео контента. В первые годы результаты поиска были объявлены людьми. Но поскольку сеть выросла с десятков до миллионов страниц, автоматизация была необходима. Были созданы веб-сканеры, многие из которых были научными проектами, проводимыми университетами, и запуск поисковых систем (Yahoo, AltaVista и т. Д.).

Одним из таких проектов был поисковый движок с открытым исходным кодом Nutch – детище Doug Cutting и Mike Cafarella. Они хотели быстрее возвращать результаты веб-поиска, распределяя данные и расчеты по разным компьютерам, чтобы одновременно можно было выполнять несколько задач. В это время еще один проект поисковой системы под названием Google находился в процессе. Он основывался на той же концепции – хранение и обработка данных распределенным, автоматическим способом, чтобы соответствующие результаты веб-поиска могли быть возвращены быстрее.

В 2006 году Каттинг присоединился к Yahoo и взял с собой проект Nutch, а также идеи, основанные на ранней работе Google по автоматизации распределенного хранения и обработки данных. Проект Nutch был разделен – часть поискового робота осталась за Nutch, а часть распределенных вычислений и обработки стала Hadoop (названной в честь игрушечного слона сына Каттинга). В 2008 году Yahoo выпустила Hadoop как проект с открытым исходным кодом. Сегодня структура и экосистема технологий Hadoop управляются и поддерживаются некоммерческим Apache Software Foundation (ASF), глобальным сообществом разработчиков и разработчиков программного обеспечения.

Приложения Hadoop

     

  1. Сектор здравоохранения: – Большие данные в здравоохранении используются для сокращения накладных расходов, лечения заболеваний, повышения прибыли, прогнозирования эпидемий и повышения качества жизни людей путем предотвращения смерти. Научно-исследовательские лаборатории, больницы и другие медицинские учреждения используют аналитику больших данных для сокращения расходов на здравоохранение путем изменения моделей предоставления лечения. Здесь начинается путешествие по большим данным в здравоохранении, выделяя известные приложения больших данных в сфере здравоохранения.

 

  • Объем данных на предприятии будет расти в 50 раз по сравнению с прошлым годом до 2020 года.
  •  

  • Объем бизнес-данных по всему миру во всех компаниях удваивается каждые 1,2 года.
  •  

  • Еще в 2010 году Эрик Шмидт сказал, что каждые 2 дня мы создаем столько информации, сколько и с зари цивилизации до 2003 года.
  • Зарегистрируйся, чтобы продолжить изучение работы

      Поделиться сочинением
      Ещё сочинения
      Нет времени делать работу? Закажите!

      Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.