Семантический анализ сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Семантический анализ

В последнее время возник большой интерес к тому, чтобы сделать качественное образование более доступным для студентов во всем мире с помощью информационных технологий [1]. Автоматизированные системы маркировки (AMS) и компьютерная оценка (CBA) являются быстро растущими областями исследований, касающихся ученых, занимающихся преподаванием на всех уровнях в широком спектре дисциплин. Автоматическая маркировка может снизить затраты на обучение, помочь в дистанционном обучении, обеспечить мгновенную обратную связь с учащимися и повысить последовательность (и, следовательно, академическую целостность) оценки.

Оценка является неотъемлемой частью процесса обучения, особенно в информативных условиях обучения. В нынешних условиях массовых открытых онлайн-курсов (MOOC) оценка является сложной задачей, поскольку она направлена ​​на обеспечение последовательности, надежности и не ставит одного человека перед другим. Информативная оценка проблемы рабочей нагрузки и своевременных результатов еще больше, поскольку задача выполняется чаще, в то время как интерпретация одного человеческого маркера отличается от другого [2].

Эссе рассматриваются многими исследователями как наиболее полезный инструмент для оценки результатов обучения, подразумевающих a) способность вспоминать, систематизировать и интегрировать идеи, b) способность как выразить себя в письменной форме, так и c) предоставить больше, чем идентифицировать интерпретацию. и применение данных [3]. Однако оценка эссе и открытых вопросов – трудоемкий и утомительный процесс. Мы предполагаем, что машинное обучение может помочь учителям в этой области с помощью автоматизированных систем оценки эссе.

Автоматическая оценка эссе (AEE) – это процесс оценки и оценки написанных эссе с помощью компьютерных программ. Для преподавателей и учебных заведений AEE представляет собой не только инструмент для оценки результатов обучения, но также помогает сэкономить время, усилия и деньги без снижения качества. Системы AEE могут также использоваться во всех других прикладных областях интеллектуального анализа текста, где содержание текста должно быть классифицировано или расставлено по приоритетам, таких как письменные заявления, сопроводительные письма, научные статьи, классификация электронной почты и т. Д. [4]

Несколько систем AEG были разработаны в рамках академической и коммерческой инициативы с использованием статистических [5], обработки естественного языка (NLP) [6], байесовской классификации текста [7], метода поиска информации (IR) [8] и многих других. , Латентный семантический анализ (LSA) – это мощный метод ИК, который использует статистику и линейную алгебру для обнаружения скрытого «смысла» текста и успешно используется при оценке и поиске текста на английском языке [8], [9], [10] , LSA применяет разложение по сингулярным значениям (SVD) к матрице большого термина по контексту, созданной из корпуса, и использует результаты для построения семантического пространства, представляющего темы, содержащиеся в корпусе. Векторы, представляющие текстовые отрывки, могут затем быть преобразованы и помещены в семантическое пространство, где их семантическое сходство может быть определено путем измерения их близости друг от друга.

Основным аспектом измерения производительности AEG является то, насколько система точна в соответствии с человеческим рейтингом. Существующие методы AEG, использующие LSA, не учитывают последовательность слов в документах.

В существующих методах LSA создание слова по матрице документа несколько произвольно [8]. Автоматическая оценка эссе с использованием этих методов не является копией человеческого оценивания [5].

2 – скрытый семантический анализ

Учебный комплект готовится путем выбора сочинений по конкретному предмету любого уровня. Эссе рецензируются сначала более чем одним специалистом по этой теме. Количество людей-грейдеров может расходоваться на односторонние рамки. Нормальная оценка оценок человека рассматривается как подготовительный балл конкретного подготовительного эссе. Предварительная обработка выполняется на тренировочном наборе. На этапах предварительной обработки стоп-слова в статье опускаются, а слова происходят от их корней [11] [12].

N-граммы, то есть униграммы, биграммы, триграммы,… .., n-граммы используются для создания матрицы документа. Каждая ячейка матрицы заполнена частотой n-грамм в документе. Матрица n-грамм по документам затем разлагается с помощью разложения по сингулярным числам (SVD) матрицы. Deerwester et. al., опишите процесс следующим образом: [13]

Пусть t = количество членов или строк

d = количество документов или столбцов

X = при матрице d

Затем, после применения SVD, X = TSD, где

M = количество измерений, m <= min (t, d)

T = матрица t t

S = диагональная матрица размером m на m, то есть только диагональные элементы имеют ненулевые значения

D = матрица размером m на d.

Теперь и ответ ученика, и ответ модели готовы для сравнения. Числовые представления эссе необходимы для сравнения. Сравнение между текстами осуществляется на основе математических моделей [14].

Чтобы оценить оценку человека и системы, необходимо учитывать особенности поверхности. Таким образом, штраф за контент адаптируется к итоговой оценке [15] [16]. Это сводит к минимуму смещение системы в сторону коротких эссе по сравнению с модельным ответом и эссе, которые длиннее модельного ответа. Последний этап сводится к оценке системы. Во-первых, это делается на основе обучающего набора, а не на основе нового набора данных [14]. Рисунок 1 [17] иллюстрирует этот процесс.

Но латентный семантический анализ имеет большой недостаток в том, что он не способен к слову, если имеет несколько значений. Каждый вектор представляет слово независимо от его значения [18]. Вся обработка, основанная на этом частичном просмотре документов, не будет эффективной, так как они не используют весь контент при обработке. В результате логическое представление документов должно включать семантику слов, чтобы передать весь контент [19]. Для решения этой проблемы онтология интегрирована с латентным семантическим анализом для формирования корпуса документа.

Онтология

Онтология стала большим интересом для сообществ, которые имеют дело с семантическим сходством. Это объясняется тем, что оно обеспечивает структурированное представление знаний в форме концептуализации, связанной посредством семантических отношений [20].

В онтологии понятия располагаются в иерархической структуре, которая также является ориентированным ациклическим графом с корневым узлом (рассматривается как таксономическая структура или таксономическое дерево). Понятия с меньшей глубиной, расположенные ближе к корню, имеют более широкий смысл; Понятия с большей глубиной, расположенные дальше от корня, являются гипонимами с более конкретными значениями. [21] [22] [23]. Онтология объединяет представление каждого понятия, связывая его с соответствующими терминами, а также с другими понятиями, с которыми оно разделяет семантическое отношение. Онтологический компонент позволяет производить расчеты семантического сходства понятий. Семантическое сходство дает возможность создавать объяснения для разъяснения пользователю концепции на основе сходных концепций, тем самым повышая коммуникативную эффективность. Наиболее выгодным является то, что мы можем заменить одну концепцию другой [24]. Онтологии всегда связаны с определенной областью интересов, например, туризм, биология или право [25]. На рисунке 2 приведен пример онтологии [26]. Онтология состоит из четырех основных компонентов для представления домена [27]. Это:

• Концепция представляет собой набор объектов в домене.

• Отношение определяет взаимодействие между понятиями

• Экземпляр указывает конкретный пример концепций в домене

• Аксиомы обозначают утверждение, которое всегда верно.

Онтологии позволяют выражать семантику домена на языке, понятном компьютерам, что позволяет автоматически обрабатывать смысл разделяемой информации [28]. Онтологии являются ключевым элементом в семантической паутине – попыткой сделать информацию в Интернете более доступной для агентов и другого программного обеспечения [29].

Тем не менее существуют некоторые ограничения в использовании онтологий. Один из них заключается в том, что существует трудность в переносе знаний из текста в абстрактные и эффективные концепции. Это затрудняет выявление взаимосвязей между понятиями и терминами [30]. Во-вторых, иногда семантические отношения между понятиями расплывчаты, и онтология может разобраться с ними или понять их. Это делает использование нечеткой онтологии очень полезным.

Нечеткая онтология

Нечеткая онтология является расширением предметной онтологии с четкими концепциями. Для решения проблем аргументации неопределенности более подходящим является описание предметной области знаний, чем предметной онтологии. Нечеткая онтология терминов используется, когда термины связи «меньше, чем» и «более обширный, чем» могут быть нечеткими, то есть иметь степень принадлежности, следовательно, определяемую из данных, непосредственно полученных из корпуса. Нечеткая онтология используется для определения запроса клиента и консолидируется в конкретной поисковой системе области [31].

Нечеткая онтология акцентирует внимание на неопределенности компонентов онтологии. Его важной характеристикой является то, что он делает неточную нечеткую онтологию явной. Это делает приобретение знаний проще и эффективнее. Это также позволяет определить семантическую меру, которая делает поиск информации более эффективным [32].

Почему нечеткая онтология?

Нечеткая онтология имеет преимущество в расширении информационных запросов, позволяя поиску охватывать все связанные результаты. Это делает результаты основанными на родстве, основанном на знании смоделированной области, вместо того, чтобы просто предлагать точные соответствия. Поиск также может быть расширен, чтобы охватить все связанные понятия, так что точная формулировка не нужна для получения полезного хита (так как контекст документа не должен быть точно таким же, чтобы пользователь мог извлечь из него выгоду) [33] , Это приводит к более эффективному поиску. Аналогичным образом, другим преимуществом нечетких онтологий является нечеткая семантика, поскольку они более гибки в отображении между различными онтологиями [33] [34].

Постановка проблемы:

Существующие слабые стороны систем автоматической оценки эссе заключаются в том, что они неопределенным образом учитывают семантику текста и фокусируются на синтаксисе. Мы все еще можем рассуждать, что они в основном выполняют синтаксическое и поверхностное измерение содержимого (вычисляя сходство между текстами) и игнорируют семантику. Однако детали большинства систем никогда не были объявлены публично. Существует много способов, которые современные системы используют для анализа семантики. Некоторыми из них являются скрытый семантический анализ (LSA) [35], контент-векторный анализ (CVA) [35] и скрытое распределение Дирихле (LDA) [36]. Для измерения согласованности содержания эссе использовались LSA [35, 37], случайная индексация [38] и основанный на объектах подход [39]. Но есть только две системы [40, 41], которые используют подходы, которые проверяют непротиворечивость утверждений в эссе. Много усилий было сделано, и все же последние системы не являются автоматическими. Они нуждаются в ручном вмешательстве пользователя, по крайней мере, на предыдущих этапах.

Задача системы оценки:

Есть некоторые проблемы, которые необходимо учитывать при работе над оценкой эссе, которая обсуждается следующим образом:

1 – Языковые неоднозначности и отсутствие одного «правильного» ответа на задание с заданным эссе затрудняют процесс оценки [42].

2 – коммуникационные инфраструктуры различаются между объектами контента электронного обучения и платформами электронного обучения. Чтобы быть успешной системой оценки эссе, она должна получать информацию о знаниях учащегося [43].

3 – Многие основанные на словах и статистические подходы поддерживают системы поиска информации, интеллектуального анализа данных и обработки естественного языка, но более глубокое понимание текста все еще является насущной проблемой: концепции, семантические отношения между ними, контекстная информация, необходимая для Понятие неоднозначности требует дальнейшего прогресса в управлении текстовой информацией.

4 – Система должна быть надежной как учителя и более полезной.

Предлагаемая система включает в себя новые атрибуты для измерения согласованности (семантического развития) и согласованности фактов (по сравнению со знанием здравого смысла и другими фактами в эссе). Пространственные шаблоны, измерение расстояния и пространственная автокорреляция между частями эссе являются атрибутами когерентности. Определение количества семантических ошибок в эссе студента с использованием извлечения информации, представление его с использованием нечеткой онтологии и последующая передача его логическому рассуждению являются атрибутами согласованности. Предлагаемая система также предоставляет обратную связь об эссе. Во многих работах говорится, что, как обсуждалось во многих статьях [44] [45], цель систем AEE больше не состоит в том, чтобы точно воспроизводить оценки человека-грейдера, но она направлена ​​на проверку оценок и предоставление точной и информативной обратной связи.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.