Сочинение на тему 3 причины, по которым Apache Kafka поддерживает бизнес, управляемый данными
- Опубликовано: 21.07.2020
- Предмет: Литература
- Темы: Кафка, книги, Книжное обозрение, писатели
Компании всех размеров стремятся исследовать ценность своих собственных данных для поддержания конкурентоспособности. Так называемые организации, управляемые данными, принимают лучшие решения, собирая и делая все виды данных незамедлительно и безопасно доступными, чтобы их можно было обрабатывать и анализировать по всему предприятию. До недавнего времени сбор больших объемов данных (порядка нескольких миллионов сообщений в секунду) в режиме реального времени на одной платформе был невозможен. Apache Kafka – это общедоступная, облачная, горизонтально масштабируемая потоковая платформа реального времени для предприятия с открытым исходным кодом, которая решает эту проблему. В то время как разработчики любят его элегантный дизайн, API, набор инструментов и поддержку, бизнес ценит возможности, открываемые возможностью собирать и анализировать большие объемы данных в режиме реального времени. В этой статье блога мы выделяем три причины, по которым предприятия используют Kafka в качестве потоковой платформы на пути к большей управляемости данными.
- Kafka (также) является высоко масштабируемой и безопасной системой обмена сообщениями
- Разбивайте бункеры и интегрируйте (унаследованные и современные) системы с Kafka
По своей сути Kafka – это система обмена сообщениями в пабах и подсабах, которая хорошо масштабируется. Он постоянно масштабируется в зависимости от количества производителей и потребителей, а добавление новых серверов увеличивает емкость почти линейно. Его функции безопасности поддерживают шифрование данных как в пути, так и в состоянии покоя, а также применение политик контроля доступа. Таким образом, его можно использовать в качестве центральной платформы обмена сообщениями для всего предприятия. Эти две характеристики (масштабируемость и безопасность) позволяют Kafka заменить устаревшие системы MQ, которые являются дорогостоящими в обслуживании и не масштабируются и используются для разделения компонентов и буферизации сообщений. Две системы, интегрированные с Kafka. Тогда три или четыре. Тогда действительно сложно.
По мере роста бизнеса, развития технологий и таких событий, как приобретения, предприятия должны адаптироваться быстро и с низкими затратами. Таким образом, они нуждаются в способе восстановления данных из накопленных хранилищ, включая устаревшие системы, облачным способом на основе микросервисов. Kafka Connect позволяет передавать данные из самых разных систем из и в Kafka. Поддерживаемые системы варьируются от реляционных баз данных, систем обмена сообщениями до облачных и мобильных приложений, поддерживая режимы интеграции данных как в пакетном режиме, так и в режиме реального времени. Это можно использовать для того, чтобы сделать существующие ресурсы доступными для новых облачных микросервисов без изменения существующих базовых систем. Это важно в процессе измельчения больших монолитных приложений на более мелкие и гибкие части. Хотя потоковая передача данных в Kafka во многих случаях может быть достигнута просто с помощью конфигурации с помощью Kafka Connect, можно разрабатывать новые соединители, поскольку это относительно легко благодаря современной архитектуре, документации и доступности соединителей с открытым исходным кодом. Примеры: потоковая передача данных из устаревшей системы реляционных БД в облачную. Затем опубликуйте API с некоторыми данными. Отслеживание активности сайта: публикация активности сайта (просмотров страниц, поисков и т. Д.) В виде потоков событий для подачи в системы мониторинга и хранилища данных. Агрегатор журналов: отправляйте журналы приложений из многих исходных систем в инструменты анализа журналов, такие как Splunk, Elastic / Kibana. IoT: собирать события с самых разных устройств.
Бизнес, управляемый данными, возможен только тогда, когда данные не только собираются и распространяются через предприятие, но и анализируются. Данные, которые проходят через Kafka, могут анализироваться как инструментами Kafka, так и внешними. Kafka Streams API – это библиотека Java, предназначенная для опытных разработчиков. KSQL – это инструмент Kafka, предназначенный для аналитиков данных, которые могут использовать язык выражений для создания потоков. Напишите об одномоментных и других преимуществах родных инструментов Kafka. Поскольку Kafka является платформой интеграции, также очень просто передавать данные в другую систему, которая может быть уже установлена на предприятии или способна решать конкретные проблемы, например, Spark, Hadoop, Elastic, Splunk, Mongodb, Cassandra и другие. .
Заключение
Kafka является важным компонентом в компании, управляемой данными, потому что он решает проблему безопасного доступа к данным в реальном времени для всей компании. Это позволяет бизнес-командам иметь доступ к данным, ранее находившимся в бункерах, и анализировать их, чтобы генерировать управляемые данными данные. Кроме того, программные компоненты могут быть в меньшей степени связаны для увеличения скорости инноваций, не влияя на современные проверенные и работающие системы, которые трудно изменить.
«Как слушатель средневековья, так и читатель XXI века могут не знать, как реагировать на повествовательный голос Жены Бани» Обсудить со ссылкой на Пролог Жены Бата
Как подзаголовок «Современный Прометей» помогает Шелли указать на основополагающее значение ее истории? Работа Мэри Шелли «Франкенштейн» является символическим отражением сомнений и страхов, которые она и
Социальный анализ: искусство войны Может ли война быть в твоей жизни? Может ли это быть в современном обществе? Это должно быть убийство? Ну, война, безусловно,