Пикирование нейронной сети и распознавание выражений лица сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Пикирование нейронной сети и распознавание выражений лица

Пикающая нейронная сеть в настоящее время считается одной из лучших нейронных сетей с ее вычислительной моделью, предназначенной для понимания и воспроизведения человеческих способностей. Исследователи полагают, что этот метод является копией особого класса искусственных нейронных сетей, в которых модели нейронов взаимодействуют друг с другом с помощью последовательностей пиков. Он является лучшим для распознавания лица, распознавания выражения лица или выявления эмоций. Работа К. Ду, Ю. Нан, Р. Яна (2017) доказала это. В их документе была предложена сетевая архитектура с заостренной нейронной сетью для распознавания лиц, эта сеть состоит из трех частей: выделения признаков, кодирования и классификации. Для извлечения признаков они использовали модель HMAX с четырьмя слоями для извлечения черт лица, а затем для кодирования использовали все функции в подходящих поездах с шипами, а правило обучения Tempotron использовалось для меньшего количества вычислений. В эксперименте они использовали четыре базы данных: Yale, Extend yale B, ORL и FERET.

В исследовании A. Taherkhani (2018) была решена сложная задача подготовки популяции всплывших нейронов в многослойной сети в течение точного времени, и задержка изучения SNN не была проведена полностью. В документе предложен биологически вероятный контролируемый алгоритм обучения для обучения более точным синхронизированным множественным всплескам в многослойной всплесковой нейронной сети. Он обучает SNN через синергию между задержкой обучения и весом. Предложенный метод показывает, что он может достичь более высокой точности по сравнению с однослойной пиковой нейронной сетью. Результат показывает, что большое количество желаемых пиков может снизить точность метода. Он также сказал, что возможно расширить алгоритм до нескольких уровней. Тем не менее, большинство слоев может уменьшить эффект обучения более ранних слоев на выходе. Исследователь хочет улучшить алгоритм с точки зрения производительности и вычислений.

Статья Q. Fu et.al (2017), в которой улучшена производительность алгоритма обучения нейронной сети Spiking. Он предлагает три метода для улучшения алгоритма обучения нейронной сети Spiking, включая обратное распространение термина инерции, адаптивное обучение и метод изменения функции измерения. Во всех четырех методах, включая оригинальный алгоритм, который также использовался, результат показывает, что адаптивное обучение имеет более высокий уровень точности, который имел 90%, он также показывает, что исходный алгоритм имеет самый низкий уровень точности, поэтому три метода, которые были предложены в бумага достигла лучшей производительности, чем оригинальный алгоритм.

Распознавание выражений лица

Когда мы говорим «выражение лица» в области исследований, великие исследователи думают о П. Экмане и его книгах об эмоциях, основанных на выражении лица человека. В своей книге «Разоблачение лица» вместе с В.В. Friesen, они изучают выражение лица и то, как идентифицировать эмоции на основе выражения лица. Они показывают фотографические фотографии каждой из шести эмоций: счастье, грусть, удивление, страх, гнев и отвращение. Вопрос: есть ли универсальные выражения эмоций? Когда кто-то злится, будем ли мы выражать то же самое независимо от его культуры, расы или языка?

Пакникар (2008) определяет лицо человека как зеркало нашего разума. Выражение лица и его изменения дают нам важную информацию о состоянии, правдивости темперамента и личности человека. Он также добавил, что в настоящее время террористическая деятельность растет во всем мире, и выявление потенциальных нарушителей спокойствия является серьезной проблемой, поэтому язык тела, выражение лица и тон речи являются наилучшими способами узнать личность человека. Согласно Husak (2017), выражение лица является важным фактором при наблюдении за поведением человека, он также представил быстрое движение лица, возникающее в стрессовых ситуациях, которые обычно возникают, когда человек пытается скрыть свои эмоции, называемые «микро-выражениями». .

В исследовании Kabani S., Khan O., Khan и Tadvi (2015) они классифицировали выражения лица по 5 различным типам: радость, гнев, грусть, удивление и волнение. Они также использовали модель эмоций, которая идентифицирует песню на основе любых 7 типов эмоций; радость-удивление, радость-волнение, радость-гнев, а именно грусть, гнев, радость и грусть-гнев. Ху (2017) сказал, что эффективность и точность – две главные проблемы в распознавании выражений лица. Временная сложность, вычислительная сложность и пространственная сложность используются для измерения эффективности, однако при измерении точности существует высокая пространственная сложность или вычислительная сложность. Они также добавили, что есть несколько других факторов, которые могут повлиять на точность, таких как поза, низкое разрешение, субъективность, масштаб и идентификация базового кадра.

Еще один указатель на выявление эмоций, что Noroozi et. Все (2018) изучали язык тела, который может влиять на эмоциональное состояние человека. Они включают выражение лица, позу тела, жесты и движения глаз на языке тела. Это важный маркер для выявления эмоций. Группа Yaofu, Yang и Kuai (2012) использовала модель Spiking Neuron для распознавания выражений лица, которая использует информацию, которая представляет собой последовательность шипов. Они также добавили, что основным преимуществом этой модели является вычислительно недорогая. У них также был эксперимент, в котором они показали графическое представление шести универсальных выражений; радость, гнев, грусть, удивление и волнение плюс одно нейтральное выражение. Обратите внимание, что предметы имеют похожее выражение лица, но все они в расовом отношении разные, и у каждого из них есть вариант интенсивности выражения. После эксперимента они обнаружили, что во всех шести выражениях выражение радости и удивления легче распознать, а выражение страха является наиболее сложным.

В исследовании Wi kiat, Tay (2017) они использовали решение для анализа эмоций через компьютерное зрение, чтобы автоматически распознавать выражение лица с помощью живого видео. Они также изучали тревогу и депрессию, учитывая, что эти двое включены в эмоции. У них есть свои собственные гипотезы о том, что «беспокойство» является подмножеством эмоции «Страх». По словам С.В. Чу (сентябрь 2013 г.) и его исследование о распознавании выражений лица, сказал, что автоматическая система распознавания выражений лица содержит три основных компонента; Обнаружение лица и отслеживание, отображение сигналов для более четких особенностей и классификация уникальных образцов функций.

Бумага N. Sarode и S. Bhatia (2010), которая называется «Распознавание выражений лица». В своих исследованиях они изучают выражение лица как лучший способ обнаружения эмоций. Они также использовали метод, который основан на двумерном локальном подходе для извлечения черт лица, преобразование радиальной симметрии для основы алгоритма, а также создает динамическое пространственно-временное представление лица. В целом алгоритм достигает 81,0% надежности.

Что касается изображений лица и баз данных, то в работе JL Kiruba и AD Andrushia (2013), которая называется «Анализ эффективности алгоритма обучения с различным выражением лица при всплеске нейронной сети». При использовании Spiking Neural Network для своих исследований они также используют и сравните две базы данных изображений лиц: первая – это база данных JAFFE, которая содержит 213 изображений 7 выражений лица, представленных 10 японскими женщинами, а другая – это база данных MPI, которая содержит различные эмоциональные и разговорные выражения. База данных содержит 55 различных выражений лица.

Наконец, в результате база данных JAFFE имеет самый высокий уровень распознавания по сравнению с базой данных MPI. Исследования Y. Liu и Y. Chen (2012) показали, что автоматическое распознавание выражений лица является интересной и сложной задачей. Получение черт из необработанного образа лица является жизненно важным шагом успешного подхода. В своей системе они предложили объединить функции, которые представляют собой сверточную нейронную сеть и централизованный двоичный шаблон, а затем классифицировали все это, используя вектор вспомогательных машин. Они также практиковали два набора данных: расширенный набор данных Cohn-Kanade, который достиг 97,6% точности, и базу данных JAFFE с точностью 88,7% с помощью CNN-CBP. М.Б. Мариаппан, М. Сук и Б. Прабхакаран (декабрь 2012 г.) создали систему рекомендаций по мультимедийному контенту на основе выражения лица пользователя. Система под названием «FaceFetch», которая распознает текущее эмоциональное состояние пользователя (счастье, гнев, грусть, отвращение, страх и удивление) посредством распознавания выражений лица и генерирует или рекомендует пользователю мультимедийный контент, такой как музыка, фильмы и другое видео, которое может заинтересовать пользователя из облака почти в режиме реального времени. Они использовали экстрактор функций ProASM, что позволило повысить точность, скорость и надежность. Приложение получает очень хороший ответ от всех пользователей, которые тестировали систему.

Техника, которая была предложена и использовалась Т. Матловичем, П. Гаспаром, Р. Моро, Дж. Симко и М. Беликовой (октябрь 2016 г.), использовала выражение лица и электроэнцефалографию для выявления эмоций. Первое, что они сделали, – это анализировать существующие инструменты, которые используют распознавание выражений лица для выявления эмоций. Во-вторых, они предложили метод обнаружения эмоций с помощью электроэнцефалографии (ЭЭГ), который использует существующие подходы машинного обучения. Они собрали эксперимент, в котором мы приглашаем участников посмотреть вызывающие эмоции музыкальные клипы. Их Эмоциональная Эпоха состоит в том, чтобы получить мозговую активность участников, которая достигла 53% точности в классификации эмоций. Он также сказал, что потенциал музыки на основе автоматических эмоций является далеко идущим, поскольку он обеспечивает более глубокое понимание человеческих эмоций.

Patel et. Эл (2012) описал музыку как «язык эмоций», они также приводят пример, когда есть 80-летний мужчина и 12-летняя девушка, разные поколения, разный вкус музыки, но тот же результат эмоций после прослушивания музыки как будто они оба могут быть счастливы после прослушивания, но они слушают музыку разного поколения. Их система была направлена ​​на удовлетворение потребностей меломанов за счет использования распознавания лиц и экономии времени на просмотр и поиск в музыкальном проигрывателе. П. Оливейра (2013) изучает музыкальную систему для выражения эмоций. Его цель состоит в том, чтобы найти вычислительную систему для управления эмоциональным содержанием музыки, чтобы она давала определенные эмоции. Он также добавил, что он должен быть гибким, масштабируемым и независимым от музыкального стиля. Он определяет гибкость на разных уровнях: сегментация, отбор, классификация и преобразование. Он также добавил, что масштабируемость системы должна позволять создавать уникальную музыку.

Jha et. Аль (2015) создал систему музыкального проигрывателя на основе выражения лица, предоставляя интерактивный способ создания и воспроизведения списка эмоций пользователя. Система также использовала определение лица, где она обрабатывает выражение лица пользователя, затем классифицирует ввод, который является чертами лица, и генерирует вывод, который является эмоцией, на основе выражения лица, извлеченного из графического события в реальном времени. Затем они классифицируют эмоцию на вход и обрабатывают соответствующую музыку или список воспроизведения, который является выходом. Музыкальная рекомендация на основе настроения автомобиля, изученная Cano (2015), фокусируется на настроении, музыке и безопасности вождения пользователя. Он также указал на три определения настроения, основанные на психиатрической работе: «Аффект», «Эмоциональный эпизод» и «Настроение». Эффект, описанный как нейрофизиологическое состояние, которое доступно как примитивное неотражающее поведение, но всегда доступно для сознания. Эмоциональный эпизод определяется как совокупность взаимосвязанных суб-событий, особенно с объектом. И настроение описывается как обозначение аффективных состояний о мире в целом.

В исследовании M.Rumiantcev (2017), которое изучает систему рекомендаций, управляемых эмоциями, говорится, что люди сталкивались с проблемой выбора музыки. Он также изучает демонстрацию осуществимости эмоциональной рекомендации, основанной на музыке, где управляет человеческими эмоциями, предоставляя музыкальный плейлист на основе вашего последнего личного опыта прослушивания. K.Monteith (2012) представляет систему, которая будет генерировать уникальную музыку на основе эмоций пользователя, используя n-граммовые модели и скрытые марковские модели. Они также создали отдельные наборы музыки, основанные на желаемой эмоции, соответствующей шести основным эмоциям: любви, радости, гневу, грусти, удивлению и страху, создавая набор данных, представляющий каждую из них.

В работе R. Madhok, S.Goel и S.Garg (2018) была предложена структура, которая должна генерировать музыку на основе эмоций пользователя, предсказанных их моделью, которая делится на две: модель классификации изображений и генерация музыки модель. Музыка будет генерироваться LSTM или долгосрочной структурой модели. Используемые входные данные – это 7 основных эмоций: гнев, грусть, отвращение, удивление, страх, счастье и нейтральность при использовании сверточной нейронной сети. Наконец, они использовали средний балл мнения (MOS) для оценки производительности.

Статья К.С. Натан, М.Арун и М.С. Каннан (2017) предложил разработать точный алгоритм генерации списка песен на основе эмоционального состояния пользователя. Они практиковали четыре алгоритма; SVM, Случайный лес, K-Ближайшие соседи и Нейронная сеть. Четыре алгоритма, применяемые в среднеквадратичной ошибке и R2. Результат показывает, что среди четырех алгоритмов SVM имеет наименьшую среднеквадратичную ошибку и наивысшую оценку R2, что делает его лучшим алгоритмом с точки зрения производительности и регрессии.

В работах S. Gilda, H. Zafar, C. Soni и K. Waghurdekar (2017) была предложена система рекомендаций по музыке, основанная на ваших эмоциях на лице. Музыкальный проигрыватель содержит три модуля: модуль эмоций, классификация музыки и рекомендации. Модуль Emotion принимает фотографию пользователя в качестве входных данных и использует алгоритм глубокого обучения для определения настроения с точностью до 90,23%. Модуль классификации музыки достиг замечательного результата в 97,69% при классификации песен по 4 различным настроениям …

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.