Алгоритм масштабного инвариантного преобразования объектов сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Алгоритм масштабного инвариантного преобразования объектов

Масштабируемое преобразование инвариантных объектов (SIFT) – дескриптор изображения для сопоставления и распознавания на основе изображений, разработанный Дэвидом Лоу. Как и другие дескрипторы, этот дескриптор используется для большого количества целей в темах, связанных с компьютерным зрением, которые связаны с сопоставлением точек для распознавания объектов. Дескриптор SIFT инвариантен к геометрическим преобразованиям, таким как перемещение, вращение и масштабирование в области изображения, кроме того, он устойчив для умеренных перспективных преобразований и изменений степени освещенности. Экспериментально доказано, что он полезен и эффективен на практике для распознавания объектов и сопоставления изображений в реальных условиях.

SIFT включает в себя метод обнаружения точек интереса по изображению на уровне серого, где накапливаются статистические данные о направлениях локального градиента интенсивностей изображения, чтобы дать обобщающее описание локальной структуры изображения в локальной окрестности вокруг каждой точки интерес, в котором дескриптор должен использоваться для сопоставления соответствующих точек интереса между различными изображениями. Позднее дескриптор SIFT был расширен с уровня серого до цветных изображений.

Алгоритм SIFT использует разность гауссианов (DoG), которая является приближением к лапласиану Гаусса (LoG), что немного дорого. Разность по Гауссу получается как разница по размытию по Гауссу изображения с двумя различными значениями σ, который действует как параметр масштабирования.

Как только DoG найден, в изображениях ищутся локальные экстремумы в масштабе и пространстве. Например, один пиксель в изображении сравнивается с его 8 соседями, а также с 9 пикселями в следующем масштабе и 9 пикселями в предыдущих масштабах. В случае, если это были локальные экстремумы, это потенциальный ключевой момент. Этот процесс выполняется над различными октавами изображения в гауссовой пирамиде, как показано в 2.12. Пирамида изображений – это серия изображений, каждое из которых является результатом выборки с понижением (уменьшенной на определенный коэффициент) из предыдущего элемента.

После этого мы переходим к следующему шагу, который является ключевой точкой локализации. Когда потенциальные ключевые точки найдены, они должны быть уточнены, чтобы получить более точные результаты определения местоположения экстремумов, где есть пороговое значение, и если интенсивность в этих экстремумах меньше, чем это пороговое значение, то оно отклонено Теперь необходимо принять во внимание ориентацию, и для этого необходимо назначить ориентацию каждой ключевой точке для достижения неизменности вращения изображения. Вокруг расположения ключевой точки будет определяться окрестность в зависимости от масштаба, и в этом конкретном регионе рассчитывается величина и направление градиента. Чтобы найти доминирующую ориентацию, пики обнаруживаются в этой гистограмме ориентации. В случае если имеется несколько доминирующих ориентаций вокруг точки интереса, то допускается несколько пиков, если высота вторичных пиков превышает 80% высоты самого высокого пика, и в этом случае каждый пик используется для вычисления нового изображения дескриптор для соответствующей оценки ориентации.

Теперь, когда дескриптор ключевой точки создан, берется окрестность вокруг ключевой точки. Он разделен на подблоки, и для каждого подблока создается гистограмма ориентации. Затем ключевые точки между двумя изображениями сопоставляются путем определения ближайших соседей.

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.