Чего я пытаюсь добиться, так это различать инструменты по их тембру. То, что я прочитал до сих пор, заставило меня задуматься о том, что разные инструменты имеют разное количество обертонов.
Можно ли выделить инструмент из списка обертонов/гармоник для каждого (или хотя бы какого-то) инструмента, представленного, например, частотами? Или это зависит от физического состояния инструмента?
Или я иду совсем не в ту сторону и тембр не формируется в том числе и количеством обертонов?
Простой список обертонов мало что вам скажет. Что вам действительно нужно, так это относительные уровни/интенсивность каждого обертона. Список обертонов с относительной интенсивностью для инструмента называется спектром инструмента . Вы можете попробовать поискать «спектр» для тех, которые вас больше всего интересуют. Вот пример для скрипки:
Многие инструменты имеют практически одинаковые обертоны и часто с очень похожими относительными амплитудами. Что отличается от них, так это относительные амплитуды во времени . Изменение амплитуды обертона во времени является его временной огибающей . Комбинированные временные огибающие различных обертонов (для простоты будем называть их просто «огибающими») также являются важным аспектом распознавания инструментов.
Обертоны, относительно устойчивые в течение определенного периода времени, называются парциальными . Обертоны, которые слышны только в течение коротких периодов времени, обычно называют переходными процессами , а начальные переходные процессы важны для распознавания инструментов.
Важными аспектами распознавания тембра тонального инструмента являются огибающая и полный спектр обертонов, включая частичные и переходные.
Обратите внимание, что второстепенные компоненты звука инструмента (включая шумы , такие как шум дыхания) также представлены в спектре, в основном в виде переходных процессов.
Также обратите внимание, что инструменты без высоты тона, такие как многие ударные инструменты (например, тарелки) или более «шумные» инструменты, имеют несколько частот, которые не связаны гармонически и иногда называются негармоническими компонентами . Частоты и амплитуды этих менее или несвязанных обертонов создают спектр для бестонального звука, а также определяют, является ли звук немного тональным (как у малого барабана). Огибающие и транзиенты также важны для распознавания инструментов без тона.
Для человеческого уха отношение обертона к основному тону, возможно, не так важно, как область высоты тона, в которой звучит обертон. Наши уши эволюционировали, чтобы различать резонансные пики и впадины (см . различение гласных. Звук «ах», например, имеет качество «ах» независимо от основного тона, используемого при разговоре, или определенного ранга обертонов, которые лежат в пределах формантных областей.
Инструменты имеют характерные волновые профили в зависимости от того, как формируются звуки: например, кларнет, по крайней мере, начинает с гармоник с нечетными номерами, струна создает звуковую волну с пилообразными волновыми качествами, когда струна соскальзывает и захватывается смычком. , духовой инструмент будет иметь некоторые свойства пульсовой волны, поскольку воздух периодически проходит через губы. Но что еще больше отличает эти инструменты друг от друга, так это резонансные пики и впадины, возникающие из-за формы или конструкции, которые неизменны независимо от играемой высоты звука. Звук является результатом комбинации «возбудителя» и «резонатора» для исходных вибраций, подобно модели источника/фильтра, используемой для распознавания и синтеза речи.
И да, есть также характеристики огибающей, особенно в отношении начала нот, которые могут помочь нам различать разные звуки.
Сейчас существует невероятная технология, позволяющая выбирать инструменты из микса. Я просто делюсь тем, что знаю из акустической теории. Я еще не научился проводить анализ для быстрого определения гармонического профиля. Я, наконец, изучил базовую математику, лежащую в основе анализа DFT, с помощью «Руководства для ученых и инженеров по цифровой обработке сигналов» , но я думаю, что пройдет много времени, прежде чем я начну программировать и математику для действительной идентификации инструментов.
С практической/инженерной точки зрения, когда у нас есть спектральный анализ (т. е. характеристика частотного спектра во времени с точки зрения переходных процессов, а также гармонических и негармонических составляющих, как объясняется в ответе Тодда Уилкокса), нам нужно сравнить наш инструмент с справочная база данных ранее каталогизированных инструментов.
Это делается с помощью довольно большого количества спектральных свойств, оцениваемых по базовому спектру, например, лишь некоторые из них (их десятки):
Сравнение баз данных выполняется статистическими средствами, поскольку, конечно, нет двух абсолютно одинаковых образцов одного и того же типа инструмента (или даже одного и того же точного инструмента).
Обычно используются алгоритмы кластеризации: несколько образцов одного и того же типа инструмента классифицируются в «кластер» в базе данных. Затем анализируемая выборка сравнивается с каждым кластером, чтобы определить, где она лучше подходит. Вот пример результата такого процесса (процесс необходимо повторить для нескольких комбинаций разных параметров, чтобы получить хорошие результаты сопоставления):
Эта картина была получена с помощью sms-tools (набор ресурсов, разработанный университетом Pompeu Fabra в Барселоне), Essentia (очень мощное программное средство для анализа звука) и коллекций сэмплов, собранных с Freesound . Это бесценные ресурсы для всех, кто занимается звуковым анализом.
пользователь 28
Дэйв
Виктор Меллгрен
Юрий Кравец