Сочинение на тему Обзор литературы по устройству управления умными домами с помощью распознавания речи через мобильный телефон

Опубликовано: 16.09.2020
Предмет: Информационная наука, Литература
Темы: Литературный обзор, Мобильный телефон, Современные технологии

Введение

В нашей повседневной жизни есть несколько приборов, которые управляются устройствами с дистанционным управлением. Есть проблема для пожилых людей и людей с ограниченными возможностями, чтобы распознать пульты для различных устройств, так как большинство из них имеют одинаковую форму и размер. Если сначала взять пример людей с нарушениями зрения, то им трудно распознать, какой пульт дистанционного управления принадлежит к каким бытовым приборам, а после этого распознать целевое устройство, которое собрано вместе с бытовыми приборами. Просмотрев много работ, я обнаружил, что решение этой проблемы можно получить с помощью устройств, которые управляются с помощью жестов и распознавания голоса. Умный дом – это решение, которое приходит в голову каждому. Да, это отличная концепция для реализации, но вы можете себе представить, какова будет стоимость этого? Это отличное новшество, но оно будет каким-то образом ограничено Элитной Группой. Поэтому, если мы хотим реального преобразования, мы должны сделать его доступным и доступным для каждой экономической группы.

Есть много возможных решений этой проблемы. Но все же эти типы домов не очень популярны? Причина очень простая стоимость! Вместо того, чтобы делать новый продукт, мы можем сделать его намного дешевле, используя существующие ресурсы. В наше время мобильные устройства – это обычные гаджеты, которые есть у нас дома. Может эффективно использовать этот ресурс, так как он уже поставляется вместе с микрофоном.

Обзор литературы

Персонализированное распознавание речи на мобильных устройствах, Ян Макгроу, Рохит Прабхавалкар, Разиэль Альварес, Монтсе Гонсалес Аренас, Канишка Рао, Дэвид Рыбач, Уаи Альшариф, Хасим Сак, Александр Грюнштейн, Франсуаза Бьюфэйс, Каролина Парада.

В этой статье авторы провели исследовательскую работу по созданию такой системы распознавания, которая была бы точной, с малой задержкой и малой памятью, а также с вычислительной площадью, которая поможет быстрее работать на устройствах Android. Квантование было выполнено в долговременной кратковременной памяти (LSTM) с помощью временной классификации соединений (CTC), которая может непосредственно анализировать и прогнозировать цели фонемы. Здесь его объем памяти был уменьшен схемой сжатия на основе SVD. Здесь основной концепцией являются квантованные глубокие нейронные сети (DNN) и модель языка «на лету», восстанавливаемая для достижения производительности в реальном времени на современных смартфонах. В статье небольшой размер памяти и вычислительные ограничения, результат производительности и задержки слова (WER) за счет использования рекуррентных нейронных сетей (RNN) с кратковременной памятью (RNN), обученных с использованием временной классификации (CTC) и состояния соединения. Уровни минимального байесовского риска очень заметны и очень точны. LSTM делаются небольшими и достаточно быстрыми благодаря квантованию параметров до 8 бит, с использованием контекстно-независимых (CI) телефонных выходов вместо более многочисленных контекстно-зависимых (CD) телефонных выходов и с помощью сжатия разложения по сингулярным значениям (SVD).

Акустические модели проходят обучение по 3М рукописным анонимным высказываниям, извлеченным из трафика голосового поиска Google (примерно 2000 часов). Все модели обучаются с использованием распределенного асинхронного стохастического градиентного спуска (ASGD). Чтобы улучшить устойчивость к шуму, они генерировали «мультистильные» обучающие данные путем искажения каждого обучающего высказывания, используя симулятор комнаты с виртуальным источником шума, для генерации 20 искаженных версий каждого высказывания. Они извлекли из видео YouTube и экологических записей ежедневных событий для образцов шума.

Для дальнейшего сокращения потребления памяти они сжимали акустические модели, используя проекционные слои, которые расположены между выходами слоя LSTM и как рекуррентными, так и однократными входами в один и тот же и последующие слои. Адаптация акустических моделей для создания многостильного обучения, как описано выше, приводит к еще одному относительному улучшению на 12,8% по сравнению с моделью сжатия SVD.

Поскольку акустическая модель нейронной сети с плавающей запятой объемом 11,9 МБ потребляет значительную часть памяти и время обработки, после квантования параметров модели в 8-разрядное целочисленное представление оказали непосредственное влияние на использование памяти, уменьшив площадь акустической модели до четверти от первоначального размера. Окончательный размер акустической модели составил 3 МБ. Для моделирования языка устройства основное внимание уделяется созданию компактной языковой модели для диктовки и голосовых команд. Сохраняя небольшой системный след, они обучили одну модель для обоих доменов. Они также ограничили размер словаря до 64K. Модели языка обучаются с использованием неконтролируемых речевых журналов из области диктовки (M100M высказываний) и области голосовых команд (M2M высказывания). Эта конструкция компактной системы распознавания речи с большим словарным запасом может эффективно работать на мобильных устройствах, точно и с низкой задержкой. Это было сделано с использованием акустической модели LSTM на основе CTC, которая предсказывает независимые от контекста телефоны и сжимается до одной десятой своего первоначального размера с использованием комбинации сжатия и квантования на основе SVD. Для эффективного декодирования мы используем оперативную стратегию восстановления с последующей дополнительной оптимизацией для моделей CTC, которая сокращает объем вычислений и использование памяти. Комбинация этих методов позволяет построить систему, которая работает в 7 раз быстрее, чем в режиме реального времени на Nexus 5, с общей занимаемой системой 20. 3 МБ.

Система дистанционного управления бытовыми электроприборами с использованием распознавания речи, Noriyuki Kawarazaki и Tadashi Yoshidome.

В данной работе в основном разработана система дистанционного управления электрическими приборами с помощью распознавания речи. Система дистанционного управления состоит из PMRC, ПК, микрофона и динамика. PMRC – это программируемый мульти пульт дистанционного управления, который используется здесь, чтобы запомнить функции многих пультов дистанционного управления. PMRC – это устройство, которое может выполнять задачи нескольких пультов одновременно. Вокруг него установлены инфракрасные светодиоды. Эти инфракрасные светодиоды посылают инфракрасные сигналы в любом направлении. Таким образом, пользователю не нужно беспокоиться о положении PMRC.

Когда пользователь дает речевую команду системе, PMRC отправляет сигнал инфракрасного луча на бытовой электроприбор. Затем система передает сообщение синтеза речи оператору, и многие речевые команды для операций дистанционного управления зависят от предложений, чтобы иметь дружественный для человека интерфейс в системе. При этом используйте программное обеспечение для распознавания речи и программное обеспечение для морфологического анализа, чтобы распознавать речевые команды на основе предложения. «Юлиус» является известным бесплатным программным обеспечением для распознавания речи для исследователей «Mecab» разбивает японские предложения на морфемы и анализирует их по части речи.

Средний уровень распознавания речи составляет 60%. Ошибка возникла из-за непонимания команд, основанных на предложениях. В будущем проведите множество тестов для людей с нарушениями зрения и пожилых людей, а также определите несколько видов речевых команд для практического применения системы.

Бытовые приборы, управляемые с помощью распознавания речи в среде беспроводной сети, Мардиана Б., Хазура Х., Фаузия С., Захария М., Ханим А. Р., Нур Шахида М. К., Международная конференция по компьютерным технологиям и развитию, 2009 г. < / р>

Предлагаемая система состоит из клиентской системы, серверной системы и беспроводного интерфейса. Интерфейс позволяет клиентской системе принимать речь пользователя как ввод и затем передавать эту захваченную голосовую команду на сервер распознавания голоса. Интерфейс позволяет клиентской системе принимать речь пользователя в качестве входных данных, а затем передавать эту захваченную голосовую команду на сервер распознавания голоса, после чего сервер распознавания преобразует голос в файл символьных данных, который отправляется как пользователю-отправителю, так и в интерфейсную схему через параллельные портыUser должен говорить так же, как это может быть обнаружено сервером распознавания голоса.

Эта система очень хорошо распознает входные команды и дает хороший ответ, если зона покрытия беспроводной связи имеет сильный сигнал, чтобы получить хороший результат сопряжения, но радиус действия беспроводной сети также может варьировать производительность системы.

Беспроводная система домашней автоматизации, основанная на распознавании голоса, Хумаид АльШуэйли, Гураб Сен Гупта, Субхас Мухопадхяй, 4-я Международная конференция по мехатронике (ICOM), 2011 г.

В этой статье, чтобы разработать беспроводную систему домашней автоматизации с использованием распознавания голоса. Основной целью системы является оказание помощи пожилым людям и инвалидам. Электрические устройства обычно в офисах или в домах могут быть связаны и управляться разработанным прототипом. Технология под названием ASR используется для реализации системой в сочетании с речевым API Microsoft. Самая известная на рынке система домашней автоматизации – это Home Automation Living (HAL). Мощность существующего ПК используется программным обеспечением для управления домом. Речевой командный интерфейс обеспечен этим. Одним из основных преимуществ этой системы является то, что с помощью существующего шоссе стены в стенах, система может отправлять команды в любом месте дома. Поскольку большинство продуктов, продаваемых на рынке, являются дорогостоящими, а также требуют значительного ремонта, чтобы сделать дом автоматизированным, тогда как HAL легко и недорого установить.

Внедрение беспроводной сети сокращает энергопотребление и повышает эффективность благодаря использованию радиочастотных (RF) модулей Zigbee. При этом используется скорость передачи 115200 бит / с, которая является максимальной скоростью передачи композиции, которую обеспечивает zigbee. в этом использовать VB. Сетевое приложение для распознавания речи и использования Microsoft речь API, который очень эффективен для распознавания речи. Всего в качестве выборочной команды было выбрано 35 различных речевых команд, и мужские, и женские, поэтому тесты, проведенные по 1225 командам, имеют точность 79,8%. Независимо от того, что система не смогла правильно распознать, она игнорирует команду и не отправляет сигнал на модуль контроллера устройства.

В этой статье основной задачей является эффективность и низкое энергопотребление, которое достигается с помощью радиочастотного модуля Zigbee. С помощью алгоритма дифференциального сжатия импульсной кодовой модуляции, реализованного для потоковой передачи мультимедиа по сети, алгоритм сжатия дифференциальной импульсной кодовой модуляции потребления позволяет сгладить речевые данные до половины его фактического размера данных. Будущей работой может стать интеграция GSM или мобильного сервера для работы на расстоянии. В этом мы можем добавить команду подтверждения в систему распознавания речи.

Беспроводная система автоматизации помещений с распознаванием голоса, Авишек Пол, Мадхурима Панджа, Моналиса Багк, Наирит Дас, Рудрабрата Митра Мазумдер, Соумярши Гош, 2016 Международная конференция по интеллектуальному управлению питанием и контрольно-измерительными приборами (ICICPI) IEEE.

В этой статье основная задача – разработать и внедрить систему автоматизации помещений с распознаванием голоса по беспроводной сети. Система автоматизации помещений на основе распознавания голоса использует ИС HM2007L для идентификации речевой речи или команд конкретного пользователя. После этого микроконтроллер отправляет сигналы на энкодер для обработки.

HM2007 – это интегральная схема распознавания голоса CMOS, которая поддерживает функции анализа голоса, процесса распознавания и управления системой. Это система распознавания голоса с 40 изолированными словами, которая имеет внешний микрофон, клавиатуру, 8K X 8 Static RAM. Система распознавания речи обучается со словами, которые пользователь хочет, чтобы схема распознала. Система может принимать голосовые образцы от нескольких пользователей на любом языке и может идентифицировать пользователя, а также команду, сопоставляя ее с обученными голосовыми образцами.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Обзор литературы

30.10.2020 Комментариев нет

Несмотря на то, что понятия «миротворчество» и «коллективная безопасность» были опубликованы в различных научных исследованиях в рамках Организации Объединенных Наций в Корейской войне с ее

Читать полностью »

Распознавание рукописных символов с использованием изображения

30.10.2020 Комментариев нет

РАСПОЗНАВАНИЕ ПИСЬМЕННОГО ХАРАКТЕРА С ИСПОЛЬЗОВАНИЕМ ИЗОБРАЖЕНИЯ АВТОРЕФЕРАТ В современном мире наблюдается огромный рост пробок на дорогах, и скорость, с которой люди покупают автомобили, значительно возрастает

Читать полностью »

Эссе Литературного анализа: Литературные устройства в Рыбных щеках Эми Тэн

29.10.2020 Комментариев нет

Каждый должен гордиться своим происхождением и не должен смущаться своей национальности. Многие люди сегодня не воспринимают свое прошлое, потому что считают, что они не вписываются.

Читать полностью »