Сочинение на тему Распознавание рукописных символов с использованием изображения

Опубликовано: 30.10.2020
Предмет: Информационная наука, Правительство
Темы: Инфраструктура, Современные технологии, Транспорт

РАСПОЗНАВАНИЕ ПИСЬМЕННОГО ХАРАКТЕРА С ИСПОЛЬЗОВАНИЕМ ИЗОБРАЖЕНИЯ

АВТОРЕФЕРАТ

В современном мире наблюдается огромный рост пробок на дорогах, и скорость, с которой люди покупают автомобили, значительно возрастает с каждым годом. Дорожные сигналы используются для контроля потока движения и являются наиболее важным компонентом безопасности дорожного движения и управления движением. Основная цель этой статьи – предложить решение для автоматического управления сигналами трафика на основе плотности трафика. Это будет сделано путем анализа плотности трафика через инфракрасный датчик. Будет установлено пороговое значение, выше которого плотность трафика будет считаться «высокой», а ниже – «низкой».

Также будет установлено максимальное значение, выше которого сигнал не может оставаться открытым. Когда конкретная дорога имеет высокую плотность движения, у нее будет больше времени на зеленый сигнал по сравнению с дорогами с более низкой плотностью движения. Как только желаемая операция выбрана, она отправляется непосредственно на сигнал светофора, который меняет таймер и светится соответствующим образом. Кодирование для обработки изображений выполняется в MATLAB, и основными используемыми концепциями являются Обработка изображений, Обрезка изображений и Преобразование.

Введение

Концепция распознавания текста существует с начала 20-го века. Распознавание текста широко известно как OCR (Оптическое распознавание символов). Раннее оптическое распознавание символов можно проследить еще в 1914 году. Эти устройства в основном использовались для помощи слепым. С течением времени и большими достижениями в области технологий эти устройства тоже претерпели значительные улучшения. Теперь устройства можно использовать для перевода печатного текста на разные языки.

Система, предложенная в этой статье, распознает рукописный текст и преобразует его в печатный формат, который затем можно просмотреть на экране. Несмотря на различные достижения в области распознавания символов, исследования, связанные с преобразованием рукописного текста, были довольно редкими. Это происходит главным образом потому, что, в отличие от преобразования печатного текста, почерк варьируется от человека к человеку и, следовательно, программное обеспечение должно идентифицировать и распознавать рукописный символ каждого человека в отдельности. Поскольку символы, которые необходимо преобразовать, являются рукописными текстами, практически невозможно создать базу данных, которая содержит рукописные символы, потому что, как упоминалось ранее, почерк варьируется от человека к человеку.

Система, которая была предложена в статье, использует алгоритм выпуклой оболочки для идентификации и преобразования рукописного текста. Этот метод чрезвычайно эффективен, поскольку он значительно сокращает время вычислений, и он также может распознавать рукописный текст каждого человека в отдельности. Предложенная система использует Convex Hull Matching (CHM) для индивидуальной дифференциации каждой буквы. В документе также освещаются различные этапы, используемые при распознавании и преобразовании рукописного текста в формат печатного текста.

СУЩЕСТВУЮЩАЯ СИСТЕМА

Развитие и прогресс в различных аспектах извлечения текстовой информации из изображения были примерно с 20-го века. Эти разработки были использованы для конкретных приложений, таких как извлечение из печатных страниц. Несмотря на то, что были проведены обширные исследования, создать серию универсальной системы непросто. Это потому, что существует множество возможных источников вариаций и результатов при извлечении текста из источника. Затененное содержимое на текстурированном фоне или из низкоконтрастных, сложных изображений или изображений с изменениями размера шрифта, стиля, цвета, ориентации и выравнивания. Эти вариации делают проблему очень сложной, что, в свою очередь, делает автоматическое рисование очень трудным.

Обычно используемые методы обнаружения текста можно разделить на три категории. Первая категория состоит из методов на основе связанных компонентов, которые предполагают, что текстовые области имеют однородные цвета и удовлетворяют определенным ограничениям размера, формы и пространственного выравнивания. Эти методы не эффективны, когда текст имеет сходные цвета с фоном, поэтому это, скорее всего, приведет к неправильному обнаружению.

Вторая категория состоит из методов на основе текстуры, которые предполагают, что текстовые области имеют специальную текстуру. Все эти методы менее чувствительны к фоновым цветам, поэтому они могут быть не в состоянии различать тексты и текстоподобные фоны.

Третья категория состоит из основанных на ребре методов. При этом области текста обнаруживаются в предположении, что края фона и области объекта более разрежены, чем области областей текста. Подобные подходы не очень эффективны и подходят для обнаружения текстов с большим размером шрифта. По сравнению с методом на основе векторной машины поддержки (SVM) с многослойным восприятием (MLP) для проверки текста на основе четырех независимых признаков, которые включают в себя функцию карты расстояний, функцию пространственной производной шкалы яркости, функцию постоянной дисперсии градиента и функцию коэффициентов DCT. Лучшие результаты в обнаружении достигаются при использовании SVM, а не MLP. Методы обнаружения текста на основе нескольких разрешений часто используются для обнаружения текстов в разных масштабах. Тексты с разными масштабами будут иметь разные Итак, в этой статье мы представляем и эффективный и альтернативный способ распознавания рукописного текста.

ПРЕДЛАГАЕМАЯ СИСТЕМА

Система, которую мы предложили в этой статье, является усовершенствованной версией существующей системы с улучшенными возможностями обнаружения и распознавания текста. Предлагаемые структурные улучшения: -Текстовое обнаружение: этот этап принимает ввод изображения и решает, содержит ли он текст или нет , Он также идентифицирует текстовые области на изображении, используя метод выпуклой оболочки. Локализация текста. Локализация текста объединяет текстовые области для формулирования текстового содержимого и определения границы вокруг текстового содержимого.

Бинаризация текста: этот шаг используется для сегментирования текстового содержимого от фона в ограниченном текстовом содержимом. Путем преобразования данного изображения в изображение в градациях серого определяется двоичное значение. Результатом бинаризации текста является двоичное изображение, в котором текстовые пиксели и пиксели фона появляются на двух разных двоичных уровнях. Распознавание символов: последний модуль процесса извлечения текста – это распознавание символов. Этот модуль преобразует двоичный текстовый объект в изображение выпуклой оболочки, для которого определяется значение.

Целью оптического распознавания символов является классификация оптических шаблонов для рукописного текста, соответствующего буквенно-цифровым или другим символам. Это делается с использованием процесса OCR, который включает в себя несколько этапов, таких как сегментация, извлечение признаков и классификация. В принципе, любое стандартное программное обеспечение OCR теперь можно использовать для распознавания текста в сегментированных кадрах. Тщательный анализ свойств областей символов-кандидатов в сегментированных кадрах или изображениях показывает, что большинству пакетов программного обеспечения для оптического распознавания символов будет значительно или трудно распознавать рукописный текст. Документированные изображения отличаются от естественных изображений, потому что они содержат в основном текст с небольшим количеством графики и изображений.

Определение образцов в выпуклой оболочке множества больших размеров является сложной во времени задачей. Чтобы упростить это, используется простой алгоритм для вычисления приближенного выпуклого корпуса. Используемый алгоритм имеет следующие преимущества: он использует только один порог, что делает его детерминированным алгоритмом, независимым от первоначально рассмотренных вершин; это также гарантирует, что образцы, которые соответствуют максимальным и минимальным точкам для каждого измерения, присутствуют в сгенерированном выпуклом корпусе. Надежный подход, называемый методом согласования выпуклого корпуса (CHM), используется для регистрации изображений, содержащих текст, которые отличаются друг от друга евклидовым преобразованием , Этот метод состоит из двух этапов, на первом этапе извлекаются наборы точек на поверхности текстового изображения, а затем из наборов точек строится трехмерная выпуклая оболочка, а треугольные пятна на поверхности выпуклых оболочек задаются с помощью предопределения их нормальные векторы.

На втором этапе каждое ребро ссылочного треугольника сравнивается со всеми ребрами треугольника в другом наборе точек, чтобы найти набор равных пар, а также получить коэффициент масштабирования. Параметры преобразования каждой пары треугольников, включая вращение и перемещение, оптимизируются путем минимизации евклидова расстояния между соответствующей парой вершин. Используя эти значения, рукописный текст преобразуется в текст машинного формата.

АЛГОРИТМ

<Ол>

Начало

Сканирование рукописного текста

Преобразование цветного изображения в оттенки серого

Делайте сегментацию, отделяя строки от текстового изображения

Применить выпуклую оболочку к отсканированному тексту

Сравните результаты с ближайшим совпадением в базе данных

Загрузите сопоставленные данные в базу данных.

АРХИТЕКТУРА

Процесс обнаружения и распознавания рукописного текста представляет собой последовательность упорядоченных шагов:

ВХОД ТЕКСТА

Рукописный текст обнаруживается с помощью устройства ввода изображений (камера / видеокамера). Это проверяет, присутствует ли разборчивый текст или нет. Если текст не понятен, процесс останавливается.

СЕРЫЙ ВЕС

Цветное изображение преобразуется в соответствующее серое изображение, что облегчает его обработку.

ТЕКСТОВАЯ СЕГМЕНТАЦИЯ

Записанное изображение текста затем отделяется буквами от пробелов. Пробелы удаляются, и только текстовая часть отправляется на распознавание.

Выпуклый корпус

Алгоритм выпуклой оболочки применяется к сегментированному результату. Размерные значения генерируются и отправляются для классификации.

КЛАССИФИКАЦИЯ

Буквенно-цифровые символы классифицируются в своей области в соответствии со значениями, полученными в процедуре выпуклой оболочки. CONVEX HULLВыпуклая оболочка – это геометрическая задача, которая может быть решена вычислительным путем. Алгоритм заключается в том, чтобы описать множество точек многоугольником, называемым выпуклым многоугольником. Другими словами, выпуклый многоугольник – это многоугольник, который может содержать все точки в данной плоскости. Выпуклость многоугольника – это измеримая черта, поддающаяся анализу его формы. В процедуре распознавания текста все буквы связаны с определенными точками, которые действуют как ориентиры, затем они образуют выпуклый многоугольник. База данных состоит из отдельных уникальных значений, соответствующих каждому буквенно-цифровому значению. Выпуклый многоугольник обрабатывается и получается значение отношения, соответствующее его размерам, эти соотношения размеров сравниваются со значениями, которые хранятся в базе данных, и выбирается и отображается наиболее близкое совпадение.

Заключение

Процесс обработки изображений позволяет обнаруживать рукописный текст. Теперь рукописные документы могут быть отсканированы и превращены в компьютерный документ. В конечном итоге это имеет огромное значение, поскольку теперь людям не нужно вводить весь текст, чтобы загрузить его в облако. Концепция обработки изображений имеет много достоинств и может иметь много будущих приложений

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Заторы – тяжелый кризис в городах и как его решить

29.10.2020 Комментариев нет

Аннотация На централизованное решение для маршрутизации автомобильного трафика для увеличения перегрузок влияют две неотъемлемые проблемы: масштабируемость: главный сервер должен обеспечивать широкие вычисления и связь по

Читать полностью »

Ландшафтный урбанизм: анализ Mappae Mundi

29.10.2020 Комментариев нет

Mappae mundi, образная форма карты мира, созданная в средние века, пыталась сформировать визуальную энциклопедию знаний о мире, основанную на разнообразных и иногда противоречивых источниках. Картографы

Читать полностью »

Проблемы и перспективы автоматического распознавания речи

29.10.2020 Комментариев нет

Распознавание речи – это способность слушать произносимые слова и различать в них различные звуки, распознавать их как слова некоторого известного языка. В компьютерной области распознавание

Читать полностью »