Как отличить инструменты по тембровым характеристикам?

Чего я пытаюсь добиться, так это различать инструменты по их тембру. То, что я прочитал до сих пор, заставило меня задуматься о том, что разные инструменты имеют разное количество обертонов.

Можно ли выделить инструмент из списка обертонов/гармоник для каждого (или хотя бы какого-то) инструмента, представленного, например, частотами? Или это зависит от физического состояния инструмента?

Или я иду совсем не в ту сторону и тембр не формируется в том числе и количеством обертонов?

Комментарии не для расширенного обсуждения; этот разговор был перемещен в чат .
Связанный: довольно сложно ориентироваться только по тембру на слух, мы во многом зависим от атаки и затухания инструмента youtube.com/watch?v=thD6TNUoyIk
@ViktorMellgren лучший ответ дал Тодд Уилкокс. Он объяснил это более подробно, чем Эндрю Хуан.

Ответы (3)

Простой список обертонов мало что вам скажет. Что вам действительно нужно, так это относительные уровни/интенсивность каждого обертона. Список обертонов с относительной интенсивностью для инструмента называется спектром инструмента . Вы можете попробовать поискать «спектр» для тех, которые вас больше всего интересуют. Вот пример для скрипки:введите описание изображения здесь

Многие инструменты имеют практически одинаковые обертоны и часто с очень похожими относительными амплитудами. Что отличается от них, так это относительные амплитуды во времени . Изменение амплитуды обертона во времени является его временной огибающей . Комбинированные временные огибающие различных обертонов (для простоты будем называть их просто «огибающими») также являются важным аспектом распознавания инструментов.

Обертоны, относительно устойчивые в течение определенного периода времени, называются парциальными . Обертоны, которые слышны только в течение коротких периодов времени, обычно называют переходными процессами , а начальные переходные процессы важны для распознавания инструментов.

Важными аспектами распознавания тембра тонального инструмента являются огибающая и полный спектр обертонов, включая частичные и переходные.

Обратите внимание, что второстепенные компоненты звука инструмента (включая шумы , такие как шум дыхания) также представлены в спектре, в основном в виде переходных процессов.

Также обратите внимание, что инструменты без высоты тона, такие как многие ударные инструменты (например, тарелки) или более «шумные» инструменты, имеют несколько частот, которые не связаны гармонически и иногда называются негармоническими компонентами . Частоты и амплитуды этих менее или несвязанных обертонов создают спектр для бестонального звука, а также определяют, является ли звук немного тональным (как у малого барабана). Огибающие и транзиенты также важны для распознавания инструментов без тона.

Как вы сказали, начальные переходные процессы являются действительно важной частью воспринимаемого тембра, и они часто имеют энгармонические/шумовые характеристики. Просто быстрая проверка терминологии - я не думал, что «частичный» сам по себе подразумевает отсутствие гармонических отношений, если вы не указали «энгармонический частичный»? например, см. таблицу на en.wikipedia.org/wiki/Overtone#Musical_usage_term
Точное определение частичного сигнала — это периодическая и стабильная составляющая сигнала, которую можно смоделировать как медленно меняющуюся во времени синусоиду. Партии могут быть гармоническими и негармоническими. Частотный спектр состоит из частичных (как гармонических, так и негармонических) и переходных процессов.
@joseem «Формант» используется с тем же значением при анализе звука музыкальных инструментов, чтобы описать, как резонансы самого инструмента (которые не зависят от высоты тона играемой ноты) влияют на амплитуды различных гармоник. Например, существование формант объясняет, почему некоторые инструменты имеют очень разные тембральные качества в нижнем и верхнем регистрах. Например, см. music.columbia.edu/cmc/MusicAndComputers/chapter4/04_04.php .
Довольно интересная статья @alephzero, на первый взгляд, я согласен с тем, что сужение применения концепции формант только к звукам голоса (исходное применение концепции) слишком ограничительно. Все-таки важно отметить, что формантами является не спектр, а лишь определенные специфические (резонансные, как вы говорите) частоты.

Для человеческого уха отношение обертона к основному тону, возможно, не так важно, как область высоты тона, в которой звучит обертон. Наши уши эволюционировали, чтобы различать резонансные пики и впадины (см . различение гласных. Звук «ах», например, имеет качество «ах» независимо от основного тона, используемого при разговоре, или определенного ранга обертонов, которые лежат в пределах формантных областей.

Инструменты имеют характерные волновые профили в зависимости от того, как формируются звуки: например, кларнет, по крайней мере, начинает с гармоник с нечетными номерами, струна создает звуковую волну с пилообразными волновыми качествами, когда струна соскальзывает и захватывается смычком. , духовой инструмент будет иметь некоторые свойства пульсовой волны, поскольку воздух периодически проходит через губы. Но что еще больше отличает эти инструменты друг от друга, так это резонансные пики и впадины, возникающие из-за формы или конструкции, которые неизменны независимо от играемой высоты звука. Звук является результатом комбинации «возбудителя» и «резонатора» для исходных вибраций, подобно модели источника/фильтра, используемой для распознавания и синтеза речи.

И да, есть также характеристики огибающей, особенно в отношении начала нот, которые могут помочь нам различать разные звуки.

Сейчас существует невероятная технология, позволяющая выбирать инструменты из микса. Я просто делюсь тем, что знаю из акустической теории. Я еще не научился проводить анализ для быстрого определения гармонического профиля. Я, наконец, изучил базовую математику, лежащую в основе анализа DFT, с помощью «Руководства для ученых и инженеров по цифровой обработке сигналов» , но я думаю, что пройдет много времени, прежде чем я начну программировать и математику для действительной идентификации инструментов.

С практической/инженерной точки зрения, когда у нас есть спектральный анализ (т. е. характеристика частотного спектра во времени с точки зрения переходных процессов, а также гармонических и негармонических составляющих, как объясняется в ответе Тодда Уилкокса), нам нужно сравнить наш инструмент с справочная база данных ранее каталогизированных инструментов.

Это делается с помощью довольно большого количества спектральных свойств, оцениваемых по базовому спектру, например, лишь некоторые из них (их десятки):

  • спектральный контраст - сравнение спектральной огибающей с эталонной базой данных
  • негармоничность - относительный вес негармонических составляющих
  • диссонанс - сравнение спектральной оболочки с эталоном перцептивного диссонанса

Сравнение баз данных выполняется статистическими средствами, поскольку, конечно, нет двух абсолютно одинаковых образцов одного и того же типа инструмента (или даже одного и того же точного инструмента).

Обычно используются алгоритмы кластеризации: несколько образцов одного и того же типа инструмента классифицируются в «кластер» в базе данных. Затем анализируемая выборка сравнивается с каждым кластером, чтобы определить, где она лучше подходит. Вот пример результата такого процесса (процесс необходимо повторить для нескольких комбинаций разных параметров, чтобы получить хорошие результаты сопоставления):введите описание изображения здесь

Эта картина была получена с помощью sms-tools (набор ресурсов, разработанный университетом Pompeu Fabra в Барселоне), Essentia (очень мощное программное средство для анализа звука) и коллекций сэмплов, собранных с Freesound . Это бесценные ресурсы для всех, кто занимается звуковым анализом.