Сочинение на тему Когнитивные вычисления и аналитика больших данных

Опубликовано: 08.09.2020
Предмет: Информационная наука
Темы: Большое количество данных, компьютер, Компьютерная наука

В больших данных есть проблема. Проблема в том, что слишком много информации и недостаточно таланта, чтобы управлять ею. Поставки аналитиков и специалистов по данным не могут удовлетворить постоянно растущий спрос на этот тип талантов. Эта нехватка представляет проблему, потому что даже самые передовые платформы данных бесполезны без опытных профессионалов, чтобы управлять ими. Как мы решаем это? Больше обучения и лучших академических программ? Возможно, но что, если бы было другое решение. Что если вместо этого мы обучим компьютеры выполнять работу за нас или, по крайней мере, упростить управление инструментами данных? Улучшения в когнитивных вычислениях делают это приближающейся реальностью.

Введение

Технологии зондирования и крупномасштабная вычислительная инфраструктура позволяют создавать разнообразные большие данные в городских пространствах (например, мобильность людей, качество воздуха, схемы движения и географические данные). Большие данные подразумевают богатые знания о населении любой организации и могут помочь решить эти проблемы при правильном использовании. Воодушевленные возможностями построения более интеллектуальных городов, мы можем предложить концепцию вычислительной техники, которая нацелена на то, чтобы разблокировать мощь знаний от больших и разнородных данных, собранных в городских пространствах, и использовать эту мощную информацию для решения основных проблем, с которыми сталкиваются наши города сегодня , Короче говоря, мы стремимся решать большие проблемы в больших городах, используя большие данные.

Когнитивные вычисления принесут аналитике высокий уровень текучести. Обработка данных, которая обычно необходима для правильных аналитических функций, позволяет сотрудникам, не знакомым с языком данных, взаимодействовать с программами и платформами так, как люди взаимодействуют друг с другом.

Таким образом, платформы, созданные на основе технологии AI, могут преобразовывать обычную речь и запросы в запросы данных, предоставляя простые команды и используя обычный язык, а затем предоставляя ответы таким же образом, как они были получены. С такой функциональностью любому человеку было бы намного легче работать в поле данных.

Каркас когнитивных вычислений и больших данных

Определение

Когнитивные вычисления – это процесс сбора, интеграции и анализа больших и разнородных данных, генерируемых различными источниками в городских пространствах, такими как датчики, устройства, транспортные средства, здания и люди, для решения основных проблем, с которыми сталкиваются города ( например, загрязнение воздуха, повышенное потребление энергии и пробки на дорогах). Он объединяет технологии ненавязчивого и повсеместного зондирования, передовые модели управления данными и аналитические модели, а также новые методы визуализации для создания беспроигрышных решений, улучшающих окружающую среду, качество жизни людей и городские операционные системы. Когнитивные вычисления также помогают нам понять природу городских явлений и даже предсказывать будущее. Это междисциплинарная область, объединяющая область вычислительной науки с традиционными областями, такими как транспорт, гражданское строительство, экономика, экология и социология в контексте городских пространств.

Вычисления с разнородными данными

Изучение взаимно подкрепленных знаний из разнородных данных: решение городских проблем включает в себя широкий спектр факторов (например, изучение загрязнения воздуха включает в себя одновременное изучение транспортных потоков, метеорологии и землепользования). Однако существующие методы извлечения данных и машинного обучения обычно обрабатывают один вид данных; например, компьютерное зрение имеет дело с изображениями, а обработка естественного языка основана на текстах. Равная обработка элементов, извлеченных из различных источников данных (например, простое помещение этих элементов в вектор признаков и их преобразование в модель классификации), не обеспечивает наилучшую производительность. Кроме того, использование нескольких источников данных в приложении приводит к пространству большой размерности, что обычно усугубляет проблему разреженности данных. Если не обрабатывать правильно, больше источников данных может даже поставить под угрозу производительность модели. Это требует использования современных моделей анализа данных, которые могут изучать взаимно подкрепленные знания среди множества разнородных данных, полученных из разных источников, включая датчики, людей, транспортные средства и здания.

Эффективная и действенная способность к обучению. Многие сценарии городских вычислений (например, обнаружение аномалий трафика и мониторинг качества воздуха) требуют мгновенных ответов. Помимо простого увеличения числа машин для ускорения вычислений, нам необходимо объединить алгоритмы управления данными и интеллектуального анализа данных и машинного обучения в вычислительную среду, чтобы обеспечить как эффективную, так и эффективную возможность обнаружения знаний. Кроме того, традиционные методы управления данными обычно разрабатываются для одного модального источника данных. Передовая методология управления, которая может организовать мультимодальные данные (такие как потоковые, геопространственные и текстовые данные), все еще отсутствует. Итак, вычисления с несколькими разнородными данными – это слияние данных и алгоритмов.

Визуализация. Массивные данные приносят огромное количество информации, которая нуждается в лучшем представлении. Хорошая визуализация исходных данных может вдохновить новые идеи для решения проблемы, в то время как визуализация результатов вычислений может раскрыть знания интуитивно, чтобы помочь в принятии решений. Визуализация данных также может указывать на корреляцию или причинность между различными факторами. Мультимодальные данные в сценариях городских вычислений приводят к большим измерениям, таким как пространственные, временные и социальные, для визуализации. Как соотнести разные виды данных в разных представлениях и выявить закономерности и тренды, непросто. Кроме того, когда сталкиваются с несколькими типами и огромными объемами данных, увидеть, как исследовательская визуализация может предоставить людям интерактивный способ генерировать новые гипотезы, становится еще труднее. Это требует интеграции технологий мгновенного извлечения данных в среду визуализации, которая до сих пор отсутствует в городских вычислениях.

Приложения в когнитивных вычислениях, состоящие из больших данных

Для транспортных систем

Улучшение водительского опыта. Поиск маршрутов быстрой езды экономит как время водителя, так и потребление энергии, поскольку заторы на дорогах расходуют много газа. Были проведены интенсивные исследования для изучения исторических моделей движения, оценки транспортных потоков в режиме реального времени и прогнозирования будущих условий движения на отдельных участках дороги с точки зрения данных о плавающих автомобилях, таких как траектории GPS транспортных средств, сигналы WiFi и GSM. Однако работа по моделированию общегородских моделей трафика все еще редка. Улучшение услуг такси. Такси являются важным средством передвижения между общественным и частным транспортом, обеспечивая почти сквозные транспортные услуги. В крупных городах, таких как Нью-Йорк и Пекин, люди обычно ждут нетривиального времени, прежде чем воспользоваться свободным такси, в то время как таксисты стремятся найти пассажиров. Эффективное соединение пассажиров с вакантными такси имеет большое значение для экономии времени ожидания людей, увеличения прибыли водителей такси и сокращения ненужного трафика и потребления энергии. Совершенствование систем общественного транспорта. Ожидается, что к 2050 году 70% населения мира будет проживать в городах. Муниципальные планировщики столкнутся со все более урбанизированным и загрязненным миром, причем города повсюду страдают от чрезмерно загруженной сети автомобильных перевозок. Таким образом, создание более эффективных систем общественного транспорта в качестве альтернативы личным транспортным средствам стало неотложным приоритетом как для обеспечения хорошего качества жизни и более чистой окружающей среды, так и для сохранения экономической привлекательности для потенциальных инвесторов и сотрудников. Системы общественного общественного транспорта в сочетании с интегрированным управлением тарифами и передовыми информационными системами для путешественников считаются ключевыми факторами, способствующими более эффективному управлению мобильностью.

Для окружающей среды

Без эффективного и адаптивного планирования быстрый прогресс урбанизации станет потенциальной угрозой для окружающей среды городов. В последнее время во всем мире мы наблюдаем растущую тенденцию загрязнения в различных аспектах окружающей среды, таких как качество воздуха, шум и мусор. Защита окружающей среды при модернизации жизни людей имеет первостепенное значение в городских вычислительных системах.

Городские вычисления для городского потребления энергии

Быстрый прогресс урбанизации потребляет все больше и больше энергии, требуя технологий, которые могут ощутить затраты на энергию в масштабах города, улучшить энергетическую инфраструктуру и, наконец, сократить потребление энергии.

Городские вычисления для экономики

Динамика города (например, мобильность людей и количество изменений в категории POI) может указывать на тенденцию развития экономики города. Например, количество кинотеатров в Пекине продолжало увеличиваться с 2008 по 2012 год, достигая 260. Это может означать, что все больше людей, живущих в Пекине, хотели бы посмотреть фильм в кинотеатре. Напротив, некоторая категория POI собирается исчезнуть в городе, что указывает на спад бизнеса. Аналогичным образом, мобильность людей может указывать на уровень безработицы в некоторых крупных городах, что помогает прогнозировать динамику фондового рынка.

Городские вычисления для общественной безопасности

Крупные события, пандемии, тяжелые аварии, экологические катастрофы и террористические акты создают дополнительные угрозы для общественной безопасности и порядка. Широкая доступность различных видов городских данных позволяет нам, с одной стороны, извлекать уроки из истории о том, как правильно обрабатывать вышеупомянутые угрозы, а с другой стороны, своевременно обнаруживать их или даже прогнозировать их заранее. ,

Типичная технология

Методы управления городскими данными

Данные, генерируемые в городских пространствах, обычно связаны с пространственным или пространственно-временным свойством. Например, дорожные сети и POI являются часто используемыми пространственными данными в городских пространствах; метеорологические данные, видео наблюдения и потребление электроэнергии являются временными данными (также называемыми временными рядами или потоком). Другие источники данных, такие как транспортные потоки и мобильность людей, одновременно обладают пространственно-временными свойствами. Иногда временные данные также могут быть связаны с местоположением, а затем становятся своего рода пространственно-временными данными (например, температура региона и потребление электроэнергии в здании). Следовательно, хорошие методы управления городскими данными должны иметь возможность эффективно работать с пространственными и пространственно-временными данными. Кроме того, городская вычислительная система обычно должна использовать различные гетерогенные данные. Во многих случаях эти системы необходимы для быстрого ответа на мгновенные запросы пользователей (например, прогнозирование условий движения и прогнозирование загрязнения воздуха). Без методов управления данными, которые могут организовать несколько разнородных источников данных, для следующего процесса интеллектуального анализа данных становится невозможным быстрое получение знаний из этих источников данных. Например, без эффективной структуры пространственно-временной индексации, которая заранее хорошо организует POI, дорожные сети, данные о дорожном движении и мобильности людей, процесс извлечения единственной функции проекта U-Air продлится несколько часов. Задержка не поможет этому приложению, сообщая людям о качестве воздуха в городе каждый час.

Методы работы с разреженностью данных

Есть много причин, которые приводят к проблеме отсутствия данных. Например, пользователь будет регистрироваться только в нескольких местах в службе социальных сетей на основе местоположения, а в некоторых местах люди могут вообще их не посещать. Если мы поместим user-location в матрицу, где каждая запись обозначает количество посещений пользователями какого-либо места, матрица будет очень разреженной; то есть многие записи не имеют значения. Если мы дополнительно рассмотрим действия (такие как покупки, питание и спорт), которые пользователь может выполнять в каком-либо месте, в качестве третьего измерения, можно сформулировать тензор. Конечно, тензор еще более редок. Разреженность данных – это общая проблема, которая годами изучалась во многих вычислительных задачах.

Визуализация больших данных

Говоря о визуализации данных, многие думают только о (1) визуализации необработанных данных и (2) представлении результатов, полученных процессами интеллектуального анализа данных. Первый может выявить корреляцию между различными факторами, предлагая особенности для модели машинного обучения. Как упоминалось ранее, пространственно-временные данные широко используются в городских вычислениях. Для всестороннего анализа данные должны рассматриваться с двух дополнительных точек зрения: (1) как пространственные распределения, изменяющиеся во времени (то есть пространства во времени) и (2) как профили локальных временных изменений, распределенных по пространству. Однако визуализация данных – это не только отображение необработанных данных и представление результатов. Исследовательская визуализация становится еще более важной в городских вычислениях.

Полу-контролируемое обучение и трансферное обучение. Полу-контролируемое обучение – это класс контролируемых учебных задач и методик, которые также используют немеченые данные для обучения – как правило, небольшое количество помеченных данных с большим количеством немеченых данных. Многие исследователи в области машинного обучения обнаружили, что немаркированные данные при использовании в сочетании с небольшим количеством помеченных данных могут значительно повысить точность обучения. Существует несколько методов обучения под непосредственным наблюдением, таких как генеративные модели, методы на основе графов и совместное обучение. В частности, совместное обучение представляет собой методику обучения с полууправлением, которая требует двух представлений данных. Предполагается, что каждый пример описывается двумя разными наборами функций, которые предоставляют разную и дополнительную информацию об экземпляре. В идеале, два набора признаков каждого экземпляра являются условно независимыми, учитывая класс, и класс экземпляра можно точно предсказать только из каждого представления. Совместное обучение может генерировать лучший результат вывода, поскольку один из классификаторов правильно помечает данные, которые другой классификатор ранее неправильно классифицировал.

Трансферное обучение: основное допущение во многих машинном обучении …

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Несколько советов от команды реагирования на инциденты компьютерной безопасности

30.10.2020 Комментариев нет

Группа реагирования на инциденты в области компьютерной безопасности (CSIRT, пояснено «see-sirt») – это подразделение, которое получает отчеты о взрывах безопасности, проводит проверки отчетов и отвечает

Читать полностью »

Позвоните в полицию. На моем компьютере преступник!

30.10.2020 Комментариев нет

Обычным сюжетом голливудских триллеров является устройство «Не отвечай на телефон». В этом фильме няня знает, что придет маньяк, чтобы убить ее или детей. Важный момент

Читать полностью »

Как общаться с диалогами Microsoft Dynamics помогает пользователям CRM достичь дохода и успеха в обслуживании

29.10.2020 Комментариев нет

Миллионы пользователей полагаются на Microsoft Dynamics CRM в качестве основного центра всей своей клиентской информации. Конфронтные группы клиентов используют его для суммирования и разбивки информации

Читать полностью »