Сочинение на тему Роль больших данных в науке о данных
- Опубликовано: 12.09.2020
- Предмет: Информационная наука
- Темы: Большое количество данных
Краткое изложение важности больших данных:
Важность больших данных для науки о данных абсолютно важна. В последние несколько лет использование таких инструментов, как R и Stata, позволило анализировать несколько терабайт данных одновременно, что позволило ранее невозможно провести широкомасштабный анализ данных и обнаружить скрытые «связи» между точками данных, которые были ранее скрытый.
Краткая справка о компании:
- · Palantir Technologies: оценка в 15 миллиардов долларов, частная собственность
- · Назван в честь «видимого камня», используемого в фильмах «Властелин колец»
- · Основана в 2003 году Питером Тилом из Paypal
- · Создание программного обеспечения для крупномасштабного, количественного и качественного исследования точек данных
Использование больших данных:
Palantir – это прежде всего компания «больших данных». Хотя ей удается оставаться относительно незаметной, в некоторой степени намеренно благодаря частной собственности и правительственным связям, фирма является одним из наиболее важных разработчиков широкомасштабного географического и транзакционного картирования. Например, программное обеспечение фирмы «Gotham», ориентированное на количественный анализ, прежде всего в финансовом мире, оказалось полезным для анализа огромных объемов транзакционных данных для ритейлеров. Например, инструмент может объединять номера кредитных карт с адресами, используемыми при покупках, даже у таких розничных продавцов, как Walmart; Таким образом, одной онлайн-покупки достаточно, чтобы связать всю предыдущую историю транзакций клиента.
Работа Палантира не обошлась без споров. Само название компании имеет несколько темных оттенков, так как оно названо по имени Палантир, «камень наблюдения», который в конечном итоге использовал злой волшебник Саруман в «Властелине колец» для наблюдения за всеми событиями в его королевстве. После скандала с Wikileaks различные правительственные и частные следственные фирмы предложили использовать технологию Palantir для отслеживания потенциальных доноров WikiLeaks, а также для выявления возможных лидеров. Инструменты, которые Палантир создал, чрезвычайно мощны; как и его тезка, нужно позаботиться о том, чтобы обеспечить его конституционное, эффективное использование.
Hadoop может быть страстно привлекательным, потому что он отлично масштабируется, может быть настроен на переключение широкого ассортимента и очень дорогой по сравнению со старыми. Hadoop
Существует четыре типа аналитических решений для больших данных, которые действительно помогают бизнесу: Prescriptive . Этот тип анализа показывает, какие действия следует предпринять. Это наиболее
Самая большая угроза для ваших данных – это внутренние и внешние источники, которые хотят украсть эти данные. Правильная защита – единственный способ защитить ее, а