Выбор функций в машинном обучении сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Выбор функций в машинном обучении

Классификация – одна из важнейших задач машинного обучения, цель которой – классифицировать каждый экземпляр набора данных на различные классы на основе его характеристик. Часто трудно определить, какие функции полезны без предварительного знания. В результате в набор данных обычно вводится большое количество функций, которые могут быть неактуальными или избыточными. Выбор функции – это процесс выбора небольшого подмножества соответствующих функций из первоначального большого набора функций. Это небольшое подмножество функций может иметь менее избыточные или релевантные функции, делающие процесс машинного обучения простым с сокращением времени процесса обучения и повышенной производительностью. Другими преимуществами выбора функций являются улучшенная производительность прогнозирования, масштабируемость, понятность и обобщающая способность классификатора. Это также уменьшает вычислительную сложность и объем памяти, обеспечивает более быструю и экономически эффективную модель и позволяет получать знания. Кроме того, он предлагает новые идеи для определения наиболее значимых или информативных функций. Основная проблема, возникающая при выборе функции, заключается в большом пространстве поиска, где для n наборов данных решения составляют 2 ^ n. Выбор функции состоит из сложных этапов, которые обычно являются дорогостоящими. И даже оптимальные параметры модели полного набора функций, возможно, придется пересмотреть несколько раз, чтобы получить оптимальные параметры модели для выбранных подмножеств признаков. Выбор характеристик также включает две основные цели, которые заключаются в максимизации точности классификации и минимизации количества признаков, которые являются противоречивыми целями. Следовательно, выбор характеристик рассматривается как многоцелевая проблема с некоторыми компромиссными решениями, которые лежат между этими двумя целями. Некоторые примеры методов выбора функций: информационное усиление, квадрат чи, лассо и оценка Фишера. Выбор функций может использоваться для поиска ключевых генов (т. Е. Биомаркеров) из большого числа генов-кандидатов в биологических и биомедицинских задачах, для обнаружения основных индикаторов или функций для описания динамической бизнес-среды, для выбора ключевых терминов, таких как слова или фразы, в интеллектуальный анализ текста и выбор или создание важных визуальных элементов, таких как пиксель, цвет, текстура и форма, в анализе изображений. По сравнению с другими методами уменьшения размерности, такими как, например, на основе проекции, анализа главных компонентов (PCA) или сжатия, методы выбора признаков не изменяют исходное представление переменных, а просто выбирают их подмножество. Следовательно, они поддерживают оригинальную семантику переменных, предлагающих интерпретируемость.

Выбор признаков, используемый в данных о экспрессии генов, которые имеют небольшой размер выборки, называется выбором генов. Отбор генов может быть использован для поиска ключевых генов из биологических и биохимических проблем. Этот тип выбора функций важен для обнаружения и обнаружения заболеваний, таких как обнаружение опухолей и обнаружение рака, что приводит к улучшению диагностики и лечения. Данные генной экспрессии могут быть выражены как полностью меченые, немеченые или частично меченые. Это приводит к развитию поднадзорного, неконтролируемого и полуконтролируемого отбора генов для выявления биологических паттернов и классов. Существует много методов выбора функций, таких как выбор объектов с контролем, без контроля и с полувыведением. При выборе контролируемого объекта для оценки функции используются помеченные данные. Но данные велики и продолжают собирать данные все более быстрыми темпами. Кроме того, маркированные данные являются дорогостоящими для получения и могут быть ненадежными и неправильно маркированными, что может привести к перегрузке процесса обучения при выборе функций контролируемого типа путем удаления соответствующих функций или использования не относящихся к делу функций. В случае контролируемого метода, предыдущие знания принимаются во внимание. С выбором неконтролируемых функций труднее работать, чем с двумя другими подходами, потому что он не поддерживается помеченными данными. Но преимущества этого типа выбора функций беспристрастны и хорошо работают без каких-либо предварительных знаний. Выбор неконтролируемых признаков полезен при обнаружении заболеваний и классификации типов заболеваний. Недостаток неконтролируемого подхода заключается в том, что он игнорирует связь между различными функциями и зависит от некоторых математических принципов без гарантии того, что эти принципы действительны для всех данных. Выбор функций под наблюдением – это сочетание выбора функций под наблюдением и без присмотра. Полу-контролируемый выбор признаков также используется для классификации генов путем совместного использования как меченых, так и немеченых данных.

Данные по экспрессии генов могут быть оценены с использованием методов данных на микрочипах, что существенно для разных образцов. Эти методы могут быть сгруппированы в неконтролируемые, контролируемые и полуконтролируемые методы. Данные микрочипов имеют большое количество генов, которые являются избыточными. Таким образом, он должен идентифицировать некоторые важные гены для лучшего понимания фундаментальных данных, а также минимизировать время, затрачиваемое на улучшенные задачи пост-обработки, такие как классификация, выбор подгруппы генов (признаков) и так далее. Используя Выбор функций, можно выбрать поднабор соответствующих функций из исходного большого набора функций. Для поиска ключевых генов из большого числа из большого числа генов-заявителей в биологических и биомедицинских задачах используются такие функции, как гены, биомаркеры и так далее. Биомаркер – это признак, который показывает состояние здоровья, наблюдаемое у пациента снаружи, и его можно измерить, а также воспроизвести и отличить от медицинских симптомов, которые показывают только признаки болезни или состояния здоровья, которые понятны только самим пациентам. Выбор характеристик имеет несколько преимуществ для данных микрочипов.

     

  • Во-первых, уменьшение размеров для уменьшения вычислительных затрат.

 

  • Во-вторых, уменьшение шумов для повышения точности классификации.
  •  

  • Наконец, более понятные функции или характеристики, которые могут быть полезны для выявления и мониторинга целевых заболеваний.
  • Биологически только несколько генетических изменений соответствуют злокачественной трансформации клетки. Определение этих областей по данным микроматрицы может позволить проводить анализ экспрессии генов с высоким разрешением для генов в этих регионах, а также лучше обнаруживать и классифицировать биологические проблемы для лучшей диагностики, прогноза и правильного лечения соответствующих биологических проблем.

    Зарегистрируйся, чтобы продолжить изучение работы

      Поделиться сочинением
      Ещё сочинения
      Нет времени делать работу? Закажите!

      Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.