Сочинение на тему Машинный перевод в современном мире

Опубликовано: 28.08.2020
Предмет: Информационная наука, Литература
Темы: криптография, Перевод, Современные технологии

Машинный перевод (MT) – это область перевода с одного исходного языка на любой другой целевой язык. Машинный перевод – одна из самых доминирующих областей современного мира. Машинный перевод появился в начале 40-х годов во время холодной войны, когда возникла острая необходимость расшифровать или расшифровать тайно закодированный обмен сообщениями между английским и русским языками. Технология в то время называлась «Наука криптографии». MT является ключом к успеху для любых новых услуг. В настоящее время многие ИТ и другие частные сектора переходят на технологии MT, чтобы улучшить свои существующие сервисы. Это способствовало разработке многих новых моделей и привело к разработке системы статистического машинного перевода (SMT) с открытым исходным кодом Moses, которая используется в различных институтах, исследовательском проекте и т. Д. Существуют различные подходы к машинному переводу.

Нет автора. Машинный перевод на основе правил (RBSMT) – это один из самых базовых и самых ранних подходов к машинному переводу. В RBSMT мы должны разрабатывать и обрабатывать правила, используя различные грамматические соглашения, лексику, и нам нужно обрабатывать правила [1]. Как правило, правила кодируются Linguistic Expert, который обладает большим опытом в этой области. Преимущества RBMT в том, что он очень прост и может быть легко расширен для любой ситуации. Существуют разные подходы RBMT. Это RBMT на основе передачи, RBMT на основе языка Interlingua и RBMT на основе словаря. Одним из ограничений RBMT является то, что мы, люди, должны создавать правила для каждого этапа анализа и генерации, что является очень громоздкой и иногда утомительной задачей. Нам нужно создавать и разрабатывать правила, чтобы адаптироваться к новой изменяющейся среде. Таким образом, мы использовали корпусный подход из-за провала основанных на правилах подходов. Это может быть связано с увеличением доступности машиночитаемого текста и увеличением возможностей оборудования. Существуют разные подходы, в которых используется корпусное МП. Они упоминаются следующим образом: 1.2.3.4.5.

Примеры:

Машинный перевод на основе

Статистический машинный перевод

Статистический машинный перевод на основе фраз

Статистический машинный перевод на основе дерева

Нейронный машинный перевод

Пример машинного перевода (EBMT) – это один из подходов SMT, основанный на аналогии. Он также основан на двуязычном корпусе в качестве основной базы знаний [1]. Учитывая новый тест Source Sentence и соответствующие ему ссылочные предложения, он переводится с использованием примеров или аналогий из базы знаний. Переведенные предложения сохраняются в базе знаний. Это экономит усилия по переводу на каждое новое тестовое предложение. Одно из ограничений этого подхода заключается в том, что если существует непревзойденное тестовое предложение, то его необходимо восстановить с нуля. Он не может использовать близкие фразы или слова для предсказания перевода [1, 10].

Статистическая машина

Перевод (SMT) – это управляемый данными или основанный на корпусе подход к MT. Он использовал контролируемую и неконтролируемую технику алгоритма машинного обучения для обучения модели перевода. Целью системы SMT является создание целевого переведенного предложения из заданного исходного предложения. Среди всех возможных предложений-кандидатов на перевод для данного входного предложения, SMT-декодер пытается найти наилучший возможный перевод. Этот подход называется моделью канала Шуза в теореме Байеса. Операция argmax в этой модели пытается найти лучший перевод из пространства всех возможных переводов для входных тестовых предложений. Техника начальной загрузки может использоваться в SMT для изучения двуязычных данных. Это может быть повторено многократно для получения лучших результатов.

Декодер Моисея может принимать входные данные в форме тестовых предложений, путаницы или решетчатых сетей. В нашей работе мы использовали концепцию основанной на фразе модели статистического машинного перевода. Это более совершенная модель статистического машинного перевода. При таком подходе входные предложения и выходные предложения делятся на сегменты фраз. Таким образом, одно из преимуществ этой модели состоит в том, что она не переводила название, подавленное из-за чрезмерной длины, слово за словом. Когда есть несоответствие для слова, мы использовали предыдущий n-граммовый подход, чтобы предсказать новые слова, но со штрафом слова. В этом контексте назначается стоимость переупорядочения или искажения в зависимости от количества пропущенных слов вперед или назад.

Основанная на фразе модель является одним из наиболее успешных подходов статистического машинного перевода, но она не может обрабатывать информацию о синтаксисе и семантике целевого языка [1, 5]. Таким образом, основной задачей этой документации является создание системы SMT на основе фразеологической модели и, следовательно, перевод любого доступного текста или документов с английского языка на пару языков манипури. Для этого нам потребовалось огромное количество параллельного корпуса или кусочка выровненных предложений на уровне текста. Если корпус содержит сформированный ввод, он не будет переведен правильно и, следовательно, это повлияет на модель перевода. Мало того, что главная цель этой статьи – повысить беглость переведенного языка вывода. Существует очень ограниченное количество доступных в электронном виде параллельных текстовых корпусов.

Наши работы ясно показывают, что, хотя у нас не так много обучающих параллельных текстовых корпусов, мы все же пытаемся улучшить беглость переведенного вывода. Это было достигнуто за счет включения одноязычного корпуса на целевой стороне языковой пары во время обучения языковой модели. Мы также доказываем, что включение в состав одноязычного корпуса значительно повышает уровень билингвальной оценки (BlEU Score), что является одним из отличных результатов наших исследований и экспериментов. В следующем разделе мы обсудим методологию и системную архитектуру системы PBSMT. Затем мы оцениваем и сравниваем производительность нашей улучшенной системы PBSMT и базовой системы PBSMT, используя различные метрики автоматической и человеческой оценки, а затем анализируем различные типы ошибок, генерируемых системой PBSMT. В разделе 5 мы завершаем обсуждение результатов и наблюдений, полученных на основе результатов наших исследований.

Зарегистрируйся, чтобы продолжить изучение работы

Поделиться сочинением

Ещё сочинения

Распознавание рукописных символов с использованием изображения

30.10.2020 Комментариев нет

РАСПОЗНАВАНИЕ ПИСЬМЕННОГО ХАРАКТЕРА С ИСПОЛЬЗОВАНИЕМ ИЗОБРАЖЕНИЯ АВТОРЕФЕРАТ В современном мире наблюдается огромный рост пробок на дорогах, и скорость, с которой люди покупают автомобили, значительно возрастает

Читать полностью »

The Guardian Review

29.10.2020 Комментариев нет

Переводы Когда переводы Брайана Фрила впервые появились на публике, они стали мгновенным достижением и скоро станут классикой. Теперь его разбудил режиссер Ян Риксон с безупречным

Читать полностью »

Создание технологии для облегчения жизни

29.10.2020 Комментариев нет

В 2013 году до 5 лет было произведено нововведение. И становятся более успешными и мощными усовершенствованиями технологических изменений. Я хотел бы поделиться с вами удивительным

Читать полностью »