Анализ звука квантования сочинение пример

ООО "Сочинения-Про"

Ежедневно 8:00–20:00

Санкт-Петербург

Ленинский проспект, 140Ж

magbo system

Сочинение на тему Анализ звука квантования

Чистых тонов в природе не существует, но каждый звук в мире – это сумма нескольких чистых тонов с разными амплитудами.

Музыкальная песня исполняется несколькими инструментами и певцами. Все эти инструменты создают комбинацию синусоидальных волн на нескольких частотах, и в целом комбинация синусоидальных волн еще больше.

Спектрограмма – это очень подробное и точное изображение вашего аудио, отображаемое в 2D или 3D. Звук отображается на графике в зависимости от времени и частоты, а яркость или высота (3D) указывают на амплитуду. Принимая во внимание, что форма сигнала показывает, как амплитуда вашего сигнала изменяется со временем, спектрограмма показывает это изменение для каждого частотного компонента в сигнале.

В качестве примера вы можете видеть, как удар капельки последовательно образует большие поверхностные пузырьки и стандартный «всплывающий» шум на рис. 4. Цвет представляет амплитуду в дБ. В этой спектрограмме некоторые частоты важнее других, поэтому мы можем построить алгоритм дактилоскопии.

Аналоговые сигналы – это непрерывные сигналы, что означает, что если вы берете одну секунду аналогового сигнала, вы можете разделить эту секунду на части, которые длятся доли секунды. В цифровом мире вы не можете позволить себе хранить бесконечное количество информации. Вы должны иметь минимальную единицу, например, 1 миллисекунду. В течение этого промежутка времени звук не может измениться, поэтому этот аппарат должен быть достаточно коротким, чтобы цифровая песня звучала как аналоговая, и достаточно большой, чтобы ограничить пространство, необходимое для хранения музыки.

Теорема выборки Найквиста предоставляет рецепт для номинального интервала выборки, необходимого, чтобы избежать наложения. Это можно сформулировать просто следующим образом: частота дискретизации должна быть как минимум вдвое больше самой высокой частоты, содержащейся в сигнале. Или в математических терминах: fs = 2 fc, где fs – частота дискретизации (как часто выборки берутся за единицу времени или пространства), а fc – самая высокая частота, содержащаяся в сигнале. Теорема Найквиста и Шеннона гласит, что если вы хотите оцифровать сигнал от 0 Гц до 20 кГц, вам нужно как минимум 40 001 выборка в секунду. Стандартная частота дискретизации для цифровой музыки в музыкальной индустрии составляет 44,1 кГц, и каждой выборке назначается 16 бит. В некоторых определениях теорем этот процесс описывается как идеальное воссоздание сигнала. Основная идея заключается в том, что синусоидальному сигналу на частоте F требуется, по меньшей мере, 2 точки на цикл для идентификации. Если частота вашей выборки, по крайней мере, в два раза превышает частоту вашего сигнала, вы получите как минимум 2 точки на цикл исходного сигнала.

Выборка. Процесс преобразования сигнала в числовую последовательность также называется аналого-цифровым преобразованием. Квантование – это еще один процесс преобразования, который представляет собой точное измерение каждого образца. Аналого-цифровые преобразователи и цифро-аналоговые преобразователи кодируют и декодируют эти сигналы для записи наших голосов, отображения изображений на экране или воспроизведения аудиоклипов через динамики. Поскольку мы можем оцифровывать мультимедиа, мы можем обрабатывать, воссоздавать, изменять, производить и хранить текст, изображения и звуки. Теорема, даже если ее можно рассматривать как простую, изменила способ работы нашего современного цифрового мира. Мы можем единообразно использовать медиа в наших интересах несколькими способами. Ограничения, которые у нас есть, могут быть устранены с помощью фильтров и настройки частоты или частоты дискретизации. Хотя он не имеет одинаковую форму и амплитуду, частота дискретизированного сигнала остается неизменной.

Аналого-цифровые преобразователи выполняют функцию этого типа для создания последовательности цифровых значений из данного аналогового сигнала. На следующем рисунке представлен аналоговый сигнал. Этот сигнал для преобразования в цифровой должен пройти выборку и квантование.

Анализ квантования звука

Квантование – это процесс отображения входных значений из большого набора (часто непрерывного набора) в выходные значения в (счетном) меньшем наборе. Округление и усечение являются типичными примерами процессов квантования. Квантование в некоторой степени задействовано почти во всей цифровой обработке сигналов, поскольку процесс представления сигнала в цифровой форме обычно включает в себя округление. Квантование также составляет ядро ​​практически всех алгоритмов сжатия с потерями.

Квантование делает диапазон сигнала дискретным, так что квантованный сигнал принимает только дискретный, обычно конечный набор значений. В отличие от выборки, квантование обычно необратимо и приводит к потере информации. Следовательно, он вносит искажения в квантованный сигнал, которые невозможно устранить.

Одним из основных вариантов квантования является количество используемых дискретных уровней квантования. Основным компромиссом в этом выборе является результирующее качество сигнала по сравнению с объемом данных, необходимых для представления каждой выборки. На рис. 6 показан аналоговый сигнал и квантованные версии для нескольких разных количеств уровней квантования. С L уровнями нам нужно N = log2 L битов для представления различных уровней или, наоборот, с N битами мы можем представлять L = 2N уровней.

Импульсно-кодовая модуляция звука

Импульсно-кодовая модуляция (PCM) – это система, используемая для преобразования аналоговых сигналов в цифровые данные. Он используется компакт-дисками и большинством электронных устройств. Например, когда вы слушаете mp3-файл на своем компьютере / телефоне / планшете, mp3 автоматически преобразуется в сигнал PCM, а затем отправляется на наушники.

Поток PCM – это поток организованных битов. Он может состоять из нескольких каналов. Например, стерео музыка имеет 2 канала. В потоке амплитуда сигнала делится на выборки. Количество сэмплов в секунду соответствует частоте сэмплирования музыки. Например, сэмплированная музыка с частотой 44,1 кГц будет иметь 44100 сэмплов в секунду. Каждый образец дает (квантованную) амплитуду звука соответствующей доли секунды.

Существует несколько форматов PCM, но наиболее распространенным в аудио является (линейный) PCM 44,1 кГц, 16-битный стереофонический формат. Этот формат имеет 44 100 сэмплов на каждую секунду музыки. Каждый образец занимает 4 байта (рис. 7):

     

  • 2 байта (16 бит) для интенсивности (от -32 768 до 32 767) левого динамика
  •  

  • 2 байта (16 бит) для интенсивности (от -32 768 до 32 767) правого динамика

В стереоформате PCM 44,1 кГц с глубиной 16 бит у вас есть 44100 сэмплов, как этот, на каждую секунду музыки.

Алгоритм дискретного преобразования Фурье

ДПФ (дискретное преобразование Фурье) применяется к дискретным сигналам и дает дискретный спектр (частоты внутри сигнала).

Дискретное преобразование Фурье (ДПФ) – это метод преобразования последовательности из N комплексных чисел x0, x1,… xN-1 в новую последовательность из N комплексных чисел

В этой формуле:

     

  • N – размер окна: количество отсчетов, составляющих сигнал
  •  

  • X (n) представляет n-й набор частот
  •  

  • x (k) – это k-я выборка аудиосигнала

DFT полезен во многих приложениях, включая простой спектральный анализ сигналов. Знание того, как сигнал может быть выражен в виде комбинации волн, позволяет манипулировать этим сигналом и сравнивать различные сигналы:

     

  • Цифровые файлы (jpg, mp3 и т. д.) можно сжать, исключив вклады из наименее важных волн в комбинации.
  •  

  • Можно сравнить различные звуковые файлы, сравнив коэффициенты x (k) ДПФ.
  •  

  • Радиоволны могут быть отфильтрованы во избежание «шума» и прослушивания важных компонентов сигнала.

Другие применения ДПФ возникают потому, что он может быть очень эффективно вычислен алгоритмом быстрого преобразования Фурье (БПФ). Например, DFT используется в современных алгоритмах для умножения многочленов и больших целых чисел вместе; вместо того, чтобы работать с умножением полиномов напрямую, оказывается, что быстрее вычислить ДПФ полиномиальных функций и преобразовать задачу умножения полиномов в аналогичную задачу, включающую их ДПФ.

Оконные функции

При обработке сигналов оконная функция – это математическая функция, которая имеет нулевое значение вне некоторого выбранного интервала. Например, функция, которая постоянна внутри интервала и равна нулю в другом месте, называется прямоугольным окном, которое описывает форму своего графического представления. Когда другая функция или форма сигнала / последовательность данных умножается на оконную функцию, произведение также получает нулевое значение за пределами интервала: все, что осталось, это часть, где они перекрываются, «вид через окно».

В типичных приложениях используемые оконные функции представляют собой неотрицательные, гладкие, «колоколообразные» кривые. Прямоугольник, треугольник и другие функции также могут быть использованы. Более общее определение оконных функций не требует, чтобы они были тождественно равными нулю вне интервала, пока произведение окна, умноженное на его аргумент, является квадратично интегрируемым и, более конкретно, что функция движется достаточно быстро к нулю. / р>

Преобразование Фурье функции cos? t равно нулю, за исключением частоты ± ?. Однако многие другие функции и формы сигналов не имеют удобных преобразований в замкнутой форме. В качестве альтернативы можно интересоваться их спектральным содержанием только в течение определенного периода времени.

В любом случае преобразование Фурье (или аналогичное преобразование) может быть применено к одному или нескольким конечным интервалам формы сигнала. В общем случае преобразование применяется к произведению формы волны и оконной функции. Любое окно (включая прямоугольное) влияет на спектральную оценку, рассчитанную этим методом.

Окно простого сигнала, такого как cos? t, приводит к тому, что его преобразование Фурье развивает ненулевые значения (обычно называемые спектральной утечкой) на частотах, отличных от?. Утечка имеет тенденцию быть худшей (самой высокой) вблизи? и минимум на частотах, самых дальних от?.

Если анализируемый сигнал содержит две синусоиды с разными частотами, утечка может помешать возможности их различения спектрально. Если их частоты отличаются и один компонент слабее, то утечка из более сильного компонента может скрыть присутствие более слабого. Но если частоты одинаковы, утечка может сделать их неразрешимыми, даже если синусоиды имеют одинаковую силу. Прямоугольное окно имеет отличные характеристики разрешения для синусоид сравнимой силы, но оно является плохим выбором для синусоид с разными амплитудами. Эта характеристика иногда описывается как низкий динамический диапазон.

Другим пределом динамического диапазона являются окна с наименьшим разрешением и чувствительностью, которые позволяют обнаруживать относительно слабые синусоиды в присутствии аддитивного случайного шума. Это связано с тем, что шум создает более сильный отклик в окнах с высоким динамическим диапазоном, чем в окнах с высоким разрешением. Поэтому окна с широким динамическим диапазоном чаще всего оправданы в широкополосных приложениях, где ожидается, что анализируемый спектр будет содержать много различных компонентов с различными амплитудами.

Между крайностями находятся умеренные окна, такие как Хэмминг и Ханн. Они обычно используются в узкополосных приложениях, таких как спектр телефонного канала. Таким образом, спектральный анализ включает в себя компромисс между разрешением сопоставимых компонентов прочности с одинаковыми частотами и разрешением разнородных компонентов прочности с разными частотами. Этот компромисс происходит при выборе оконной функции.

Когда входной сигнал дискретизируется по времени, а не непрерывно, анализ обычно выполняется путем применения оконной функции, а затем дискретного преобразования Фурье (DFT). Но DFT обеспечивает только разреженную выборку фактического спектра с дискретным временем преобразования Фурье (DTFT). На рис. 8 показана часть DTFT для синусоиды с прямоугольным окном. Фактическая частота синусоиды указана как «0» на горизонтальной оси. Все остальное – утечка, преувеличенная использованием логарифмического представления. Единица измерения частоты – «бункеры DFT»; то есть целочисленные значения на оси частот соответствуют частотам, выбранным с помощью ДПФ. Таким образом, на рисунке изображен случай, когда фактическая частота синусоиды совпадает с образцом ДПФ, и максимальное значение спектра точно измеряется этим образцом. Когда он пропускает максимальное значение на некоторую величину (до ½ бина), ошибка измерения называется потерями при скальпировании (на основе формы пика). Для известной частоты, такой как музыкальная нота или синусоидальный тестовый сигнал, сопоставление частоты с ячейкой DFT может быть предварительно организовано путем выбора частоты дискретизации и длины окна, что приводит к целому числу циклов в пределах окна.

При обработке сигнала операции выбираются для улучшения некоторых аспектов качества сигнала путем использования различий между сигналом и влиянием искажения. Когда сигнал представляет собой синусоиду, поврежденную аддитивным случайным шумом, спектральный анализ по-разному распределяет компоненты сигнала и шума, часто облегчая обнаружение присутствия сигнала или измерение определенных характеристик, таких как амплитуда и частота. Фактически отношение сигнал / шум (ОСШ) улучшается за счет равномерного распределения шума, при этом большая часть энергии синусоиды концентрируется вокруг одной частоты. Выигрыш при обработке – это термин, часто используемый для описания улучшения ОСШ. Выигрыш при обработке спектрального анализа зависит от оконной функции, как от ее ширины полосы шума, так и от ее потенциальных потерь при скальпировании. Эти эффекты частично компенсируются, поскольку окна с наименьшим гребешком …

Зарегистрируйся, чтобы продолжить изучение работы

    Поделиться сочинением
    Ещё сочинения
    Нет времени делать работу? Закажите!

    Отправляя форму, вы соглашаетесь с политикой конфиденциальности и обработкой ваших персональных данных.