Как мы можем объяснить широкие черты этой гитарной спектрограммы?

Это вдохновлено этим вопросом music.SE , на который я пытался дать ответ , но чем больше я об этом думаю, тем больше я в нем не уверен.

введите описание изображения здесь

Как физики, мы часто пытаемся описать особенности экспериментальных данных, используя минимальные модели, чтобы зафиксировать основные детали системы. Я надеюсь получить некоторое представление о том, какие минимальные физические механизмы можно использовать для объяснения основных особенностей этого графика. Автор этого вопроса говорит, что они щипали струну ми гитары (82 Гц), и на спектрограмме мы видим пики на всех целых кратных этой частоте. Вот что я думаю, что могу объяснить:

  1. Красная линия показывает эвристическое соответствие амплитуд пиков, уменьшающихся по мере ф 4 , что имеет смысл: как показано в этом ответе physics.SE, ожидается, что пиковые амплитуды компонентов Фурье будут уменьшаться по мере ф 2 , таким образом, мощность (квадрат амплитуды) выглядит как ф 4 . Это показано красной линией и дает достаточно разумное соответствие амплитудам третьей и более высоких гармоник.

  2. Уширение спектральных линий является обычным явлением из-за любых нелинейных дисперсионных эффектов, таких как учет того, что натяжение струны является функцией амплитуды и частоты.

  3. Второстепенные пики, которые появляются между большими пиками, вероятно, являются резонансами других струн гитары, например, сразу после второй гармоники первый пик кажется струной G (196 Гц).

Особенности, которые я не понимаю

  1. Должны ли эти пики быть лоренцевскими или гауссовыми? Пытаясь создать похожий игрушечный график, я обнаружил, что мне нужны как гауссовы, так и лоренцевы части каждого пика, чтобы получить примерно похожий график. Какая физика могла бы способствовать этим двум различным каналам? Пики кажутся гауссовскими (лоренцевы слишком острые, тогда как они закруглены ближе к вершине), в то время как фон может быть своего рода лоренцевским хвостом, но теперь я думаю, что, возможно, это имеет другое объяснение.

  2. Как объяснить «широкий континуум» на низких частотах? Почему этот широкий континуум распадается по мере того, как 1 / ф 2 (см. черную линию)? Моя игрушечная модель с лоренцевыми хвостами не воспроизводит такое поведение.

  3. Наконец, исходный вопрос из поста music.SE: почему интенсивность первой и второй гармоник снижена? В моем ответе на этот вопрос вы можете найти мои предположения. Теперь, после некоторого размышления, я чувствую, что меня больше всего убедила идея о том, что струна была смещена от центра, наряду с возможными резонансами, которые могли бы усилить некоторые из более высоких пиков, например, 2-й и 3-й.

В качестве примера того, что я имею в виду под лоренцевым и гауссовским, это выглядит так:

введите описание изображения здесь

слева я показываю профили Гаусса и Лоренца, а справа я показываю их сумму. Это немного трудно увидеть, но лоренцианы имеют резкий изгиб вблизи максимума, в то время как гуассианы дают красивый округлый пик, как мы видим на спектрограмме. Очевидно, 1 / ф 2 поведение низкоамплитудного фона не воспроизводится суммой лоренцевских хвостов (черная линия).

Бонусные баллы, если у кого-то есть хорошая аналогия с квазичастицами.

Ответы (1)

Все ваши интерпретации делают две основные ошибки. Вы предполагаете, что записанные данные были математически точными, а используемый алгоритм БПФ каким-то образом дает «точные» результаты.

Часть «широкого спектра» на низких частотах, скорее всего, является просто фоновым шумом окружающей среды. Соотношение сигнал/шум по сравнению с пиковой амплитудой составляет около 40 дБ, что вполне возможно, если только вы не делаете запись с помощью оборудования профессионального качества и/или в безэховой камере.

Аналого-цифровое преобразование также вносит шум квантования. Тот факт, что сигнал «качества компакт-диска» представляет собой 16-битные данные, не означает, что все 16 бит точны для каждого семпла.

Алгоритм БПФ будет использовать окно данных конечного размера (вероятно, с числом точек, равным степени 2, например, 8192) и будет использовать «функцию окна» для устранения сбоя, вызванного тем фактом, что частоты в записанных данных не являются точными кратными длине окна данных. Это размывает ширину пиков БПФ и заполняет промежутки между пиками ненулевыми данными, даже если сам сигнал был синтезирован из «идеальных» синусоидальных волн.

Звук гитары со временем затухает, но алгоритм БПФ предполагает, что это не так, и сэмпл конечной длины можно повторять бесконечно. Поэтому выполнение БПФ является компромиссом: если окно данных короткое, количество затухания мало, но разрешение БПФ низкое, а если окно данных длинное, разрешение БПФ высокое, но затухающие данные не содержат «резкие» спектральные линии из-за затухающей амплитуды сигнала.

Вероятно, есть еще несколько подобных факторов, о которых я забыл упомянуть, но поскольку мы точно не знаем, как был записан звук, невозможно выйти за рамки общих идей и в конкретные детали, чтобы объяснить все показанное на сюжете.

Имеет смысл дать физическое объяснение скорости затухания 4 дБ/декада. Если вы считаете, что начальная деформированная форма струны представляет собой треугольник с пиковым смещением в точке защипывания, вы можете объяснить это, рассмотрев БПФ треугольной смещенной формы.

Затухание «шума» на 2 дБ/декаду, вероятно, является просто артефактом алгоритма БПФ. Для конкретного выбора длины окна данных и алгоритма оконного управления артефакты по обе стороны от пика находятся на постоянном уровне ниже пика (обычно около 40 дБ). Полоса пропускания артефактов вокруг пика представляет собой фиксированное отношение пиковой частоты, но, поскольку пиковые частоты представляют собой постоянную разность частот, артефакты перекрываются и суммируются больше для более высоких частот, чем для более низких. Конечным результатом является кажущийся «наклон» шума, составляющий примерно половину наклона пиков.

Удивительно, я не думал об этом, конечно, для правильного анализа потребуется высококачественное записывающее оборудование, низкий уровень фонового шума и правильное вычитание фона. Любое понимание того, можем ли мы ожидать гауссово/лоренцево поведение пиков или почему фундаментальный пик оказывается значительно уменьшенным?
Коэффициент демпфирования различен для разных режимов. (Если бы не было демпфирования, не было бы звука, создаваемого струной или, точнее, вибрацией всего корпуса гитары для акустической гитары!) Кстати, если вы хотите получить данные более высокого качества для частотных пиков (и демпфирования отношения) Анализ Фурье — неправильный инструмент. Методы, основанные на автокорреляционных функциях, не нуждаются в оконной функции, могут измерять как частоту, так и затухание для каждой моды и могут отслеживать такие вещи, как изменение модальной частоты с амплитудой для реальной вибрирующей системы.
Чтобы узнать о «гауссовском/лоренцевском поведении пиков», вам нужно прочитать книгу по практической обработке сигналов и таким темам, как «идентификация системы» в теории управления или экспериментальный модальный анализ, которые сильно отличаются от «теоретического использования преобразований Фурье в физика».