Почему активные наушники не выровнены до ровной АЧХ?

Некоторые наушники являются «активными», со встроенными в чашки усилителями и требуют источника питания (обычно батарейки ААА).

Затем я вижу, как многие аудиофилы обсуждают частотную характеристику как показатель того, насколько хороши наушники, и они категорически отвергают большинство «активных» наушников, таких как Dre Beats Studio.

Тем не менее, с некоторыми операционными усилителями, казалось бы, довольно легко выровнять входной сигнал, предварительно усиленный, чтобы он мог полностью скорректировать частотную характеристику драйвера и, таким образом, при желании получить чрезвычайно ровную частотную характеристику (или нет, например, басы). увеличить или уменьшить).

Есть ли что-то особенно сложное в этом?

График частотной характеристики http://graphs.headphone.com/graphCompare.php?graphType=0&graphID[]=1383&graphID[]=193&graphID[]=1263&graphID[]=853&scale=20

Например, для Dre Beats Studio (синяя линия), возможно, схема эквалайзера может обеспечить +3 дБ при 750 Гц, -5 дБ при 1100 Гц, +6,5 дБ при 1300 Гц, +5 дБ при 1550 Гц, -4,5 дБ при 8,5 кГц и +14 дБ. @ 15 кГц, с наклоном, настроенным для наилучшего выравнивания частотной характеристики до 0 дБ от 500 Гц до 20 кГц.

Ответы (3)

Когда вы подносите к уху что-то, воспроизводящее стандартные стереозаписи, вам не нужна плоская частотная характеристика, потому что передаточная функция, связанная с головой , которая обычно вступает в игру для источника звука, расположенного намного дальше, выглядит совсем по-другому, когда источник находится напротив вашего уха. .

Позвольте мне процитировать вам пару абзацев из книги :

Из всех компонентов в цепи электроакустической передачи наушники вызывают наибольшие споры. Высокая точность в ее истинном смысле, предполагающая не только тембровую, но и пространственную локализацию, связана скорее с громкоговорящей стереофонией в силу известной внутриголовной локализации наушников. И все же бинауральные записи с муляжом головы, наиболее перспективные для реалистичной высокой точности, предназначены для воспроизведения в наушниках. Даже в период своего расцвета им не нашлось места в рутинной записи и трансляции. В то время причинами были ненадежная фронтальная локализация, несовместимость с воспроизведением громкоговорителей, а также их склонность к неэстетичности. Поскольку цифровая обработка сигналов (DSP) может регулярно фильтровать с использованием бинауральных передаточных функций, связанных с головой, HRTF, фиктивные головы больше не нужны.

Тем не менее наиболее распространенным применением наушников является подача на них стереосигналов, изначально предназначенных для громкоговорителей. Это ставит вопрос об идеальной частотной характеристике. Для других устройств в цепочке передачи (рис. 14.1), таких как микрофоны, усилители и громкоговорители, целью проектирования обычно является плоская характеристика с легко определяемыми отклонениями от этой характеристики в особых случаях. Громкоговоритель должен воспроизводить плоскую характеристику SPL на расстоянии обычно 1 м. SPL в свободном поле в этот момент воспроизводит SPL в месте расположения микрофона в звуковом поле, скажем, записываемого концерта. При прослушивании записи перед ЛС голова слушателя линейно искажает УЗД за счет дифракции. Его ушные сигналы больше не показывают плоскую реакцию. Однако это не должно касаться производителя громкоговорителей. поскольку это также произошло бы, если бы слушатель присутствовал на живом исполнении. С другой стороны, производитель наушников непосредственно занимается созданием этих ушных сигналов. Требования, изложенные в стандартах, привели к созданию наушников с калибровкой в ​​свободном поле, частотная характеристика которых повторяет сигналы уха для громкоговорителя впереди, а также калибровки диффузного поля, целью которой является воспроизведение звукового давления в ухе слушателя. слушатель звука, исходящего со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоскую характеристику напряжения. Требования, изложенные в стандартах, привели к созданию наушников с калибровкой в ​​свободном поле, частотная характеристика которых повторяет сигналы уха для громкоговорителя впереди, а также калибровки диффузного поля, целью которой является воспроизведение звукового давления в ухе слушателя. слушатель звука, исходящего со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоскую характеристику напряжения. Требования, изложенные в стандартах, привели к созданию наушников с калибровкой в ​​свободном поле, частотная характеристика которых повторяет сигналы уха для громкоговорителя впереди, а также калибровки диффузного поля, целью которой является воспроизведение звукового давления в ухе слушателя. слушатель звука, исходящего со всех сторон. Предполагается, что многие громкоговорители имеют некогерентные источники, каждый из которых имеет плоскую характеристику напряжения.

введите описание изображения здесь

(a) АЧХ в свободном поле: за неимением лучшей ссылки различные международные и другие стандарты установили следующее требование к высококачественным наушникам: частотная характеристика и воспринимаемая громкость для входного моносигнала с постоянным напряжением должны приблизительно соответствовать громкоговорителя с плоским откликом перед слушателем в безэховых условиях. Передаточная функция наушников в свободном поле (FF) на заданной частоте (1000 Гц выбрана в качестве эталона 0 дБ) равна величине в дБ, на которую должен быть усилен сигнал наушников, чтобы обеспечить равную громкость. Требуется усреднение по минимальному количеству субъектов (обычно восемь). [...] На рисунке 14.76 показано типичное поле допуска.

введите описание изображения здесь

(b) Реакция диффузного поля: в 1980-х годах началось движение за замену стандартных требований в свободном поле другим, в котором диффузное поле (DF) является эталоном. Как оказалось, он пробился в стандарты, но без замены старого. Теперь они стоят рядом. Неудовлетворенность эталоном FF возникла в основном из-за величины пика 2 кГц. На него возлагалась ответственность за окраску изображения, так как фронтальная локализация не достигается даже для монофонического сигнала. То, как слуховой аппарат воспринимает окраску, описывается ассоциативной моделью Тейля (рис. 14.62). Сравнение откликов уха для диффузного поля и свободного поля показано на рис. 14.77. [...] Поскольку важен субъективный тест на прослушивание, Наушники FF до сих пор были скорее исключением, чем правилом. Доступен набор различных частотных характеристик для удовлетворения индивидуальных предпочтений, и у каждого производителя есть своя собственная философия наушников с частотными характеристиками в диапазоне от плоского до свободного поля и выше.

введите описание изображения здесь

Эта проблема различия HRTF также является причиной того, почему наклонные драйверы (в наушниках) звучат лучше для достаточного количества людей, которые такие компании, как Sennheiser, продают такие. Однако излучатели, расположенные под углом, не полностью заставляют наушники звучать как динамики.

На заводе или в лаборатории при измерении АЧХ используется искусственное ухо. Тот, что ниже, относится к лабораторному уровню; заводские немного проще.

введите описание изображения здесь

Я также нашел методологию, используемую этим сайтом HeadRoom :

Как мы проверяем частотную характеристику: Для выполнения этого теста мы запускаем наушники серией из 200 тонов при том же напряжении и постоянно увеличивающейся частоте. Затем мы измеряем выходной сигнал на каждой частоте через уши узкоспециализированного (и дорогого!) микрофона Head Acoustics. После этого мы применяем кривую коррекции звука, которая устраняет передаточную функцию, связанную с головой, и точно воспроизводит данные для отображения.

Используемый микрофон , вероятно , этот . Кажется, они на самом деле инвертируют передаточную функцию фиктивной головы/ушей с помощью программного обеспечения, потому что прямо перед этим они говорят, что «теоретически этот график должен быть плоской линией при 0 дБ»… но я не совсем уверен, что они делают. ... потому что после этого говорят: «Наушники с естественным звучанием должны быть немного выше в басах (примерно на 3 или 4 дБ) между 40 Гц и 500 Гц». и «Наушники также должны быть занижены на высоких частотах, чтобы компенсировать расположение динамиков так близко к уху; пологая плоская линия от 1 кГц до примерно 8-10 дБ вниз на частоте 20 кГц является примерно правильной». Что не совсем компилируется для меня в связи с их предыдущим заявлением об инвертировании/удалении HRTF.

Глядя на некоторые сертификаты , которые люди получили от производителя (Sennheiser) для модели наушников (HD800), используемой в этом примере HeadRoom, кажется, что HeadRoom отображает данные без какой-либо предполагаемой модели коррекции для самих наушников (что объясняет, почему они дают свои данные). более поздние предложения интерпретации, поэтому их первоначальное «плоское» предположение вводит в заблуждение), тогда как Sennheiser использует коррекцию DF (диффузное поле), поэтому их графики выглядят почти плоскими.

введите описание изображения здесь

введите описание изображения здесь

Это всего лишь предположение, различия в измерительном оборудовании (и/или между образцами наушников) вполне могут объяснить эти различия, поскольку они не так уж велики.


В любом случае, это область активных и продолжающихся исследований (как вы, наверное, догадались из последних приведенных выше предложений о DF). Некоторыми исследователями из Гонконга сделано довольно много; У меня нет (бесплатного) доступа к их документам AES, но некоторые довольно обширные резюме можно прочитать в блоге innerfidelity 2013 , 2014 , а также по ссылкам из основного блога автора Гонконга, Sean Olive ; в качестве ярлыка, вот несколько бесплатных слайдов из их последней (ноябрь 2015 г.) презентации, найденной там. Это довольно много материала... Я только бегло просмотрел его, но тема, похоже, в том, что DF недостаточно хорош.

Вот пара интересных слайдов из одной из их предыдущих презентаций . Во-первых, полная АЧХ (не урезанная до 12КГц) HD800 и на более четко раскрытом оборудовании:

введите описание изображения здесь

И, пожалуй, самый интересный для OP, басовый звук Beats не так уж и привлекателен, если сравнивать с наушниками, которые стоят в четыре-шесть раз дороже.

введите описание изображения здесь

Я не согласен с вашей книгой, где говорится: «И все же бинауральные записи с муляжной головкой, наиболее перспективные для реалистичной высокой точности, предназначены для воспроизведения в наушниках. Даже в период своего расцвета они не нашли места в рутинной записи и вещание». Каждое спортивное мероприятие, транслируемое по телевидению в прямом эфире, над которым мне доводилось работать, использует массив микрофонов «голофон» для захвата окружающего звука для использования в звуковом миксе с объемным звуком. www.holophone.com
@DwayneReid: Интересно. Является ли конечная цель этих записывающих наушников или это объемный звук 5.1 или 7.1 с динамиками? Существует также технология микширования 5.1/7.1 для наушников, но я не вдавался в нее здесь.
Что ж, продукт, рекламируемый на их главной странице, гласит: «Это единственный запатентованный микрофон, специально разработанный для захвата дискретных каналов объемного звука 7.1», поэтому «невероятно реалистичное воспроизведение трехмерного звука через динамики или стереонаушники», вероятно, использует метод понижающего микширования ( из 7.1) для наушников.
Спасибо, этот ответ был действительно информативным. Правильно ли я резюмирую: частотная характеристика наушников пытается эмулировать искажение, которое будет создаваться фронтальным источником звука, распространяющимся вокруг вашего лица и попадающим в ваши слуховые проходы, а идеально ровная частотная характеристика будет звучать «неестественно»?
Все еще немного неясно, что если они применяют обратное преобразование, то целью снова будет ровная линия 0 дБ по всему частотному спектру, которую теоретически можно ввести через эквалайзер (в идеале предварительное усиление). Любые мысли о том, почему активные производители наушников не делают этого, чтобы иметь плоскую кривую 0 дБ после коррекции искажений головы, или, возможно, продают с ними специальные усилители для наушников, которые применяют этот эквалайзер, как Sennheiser Orpheus, но, возможно, менее чем за 30 тысяч долларов. ? Казалось бы , тогда они были бы идеальными наушниками...
@Ehryk: Re: «частотная характеристика наушников пытается имитировать искажение, которое будет создано фронтальным источником звука, распространяющимся вокруг вашего лица и попадающим в ваши слуховые проходы». Модель FF делает это. Модель DF также предполагает наличие комнаты. Обычно вместо этого они используют 8 динамиков в безэховой камере в качестве «стандарта». Ребята из HK утверждают, что ни один из этих вариантов не очень хорош, и что он должен быть где-то посередине, поэтому они пытаются соответствовать тому, что делают колонки, выровненные по комнате. Я думаю, что у них еще нет продуктов, основанных на этой последней философии. Как видите, Sennheiser использует DF.
Это отличный ответ. Есть о чем подумать, и это искусственное ухо — это кайф (бакенбарды и все такое).

Простой ответ заключается в том, что система с плоской частотной характеристикой, построенная с операционными усилителями для коррекции характеристики драйвера, обязательно будет иметь очень неплоскую фазовую характеристику в полосе пропускания. Эта неравномерность означает, что частоты компонентов переходных звуков задерживаются неравномерно, что приводит к тонкому переходному искажению, которое препятствует правильному распознаванию звуковых компонентов, что означает, что можно различить меньше отдельных звуков.

Следовательно, это звучит ужасно. Как будто весь звук исходит от пушистого шара, расположенного точно между ушами.

Проблема HRTF в приведенном выше ответе является лишь частью этого, а другая заключается в том, что реализуемая схема аналогового домена может иметь только причинную временную характеристику, и для правильной коррекции драйвера требуется акаузальный фильтр.

Это можно аппроксимировать в цифровом виде с помощью фильтра с конечной импульсной характеристикой, согласованного с драйвером, но для этого требуется небольшая временная задержка, которой достаточно, чтобы фильмы сильно рассинхронизировались.

И это по-прежнему звучит так, как будто это исходит из вашей головы, если только HRTF не добавлен обратно.

Так ведь не все так просто.

Чтобы сделать «прозрачную» систему, вам не нужна просто плоская полоса пропускания в диапазоне человеческого слуха, вам также нужна линейная фаза — плоский график групповой задержки — и есть некоторые свидетельства того, что эта линейная фаза нуждается продолжать до удивительно высокой частоты, чтобы не потерять ориентиры.

Это легко проверить экспериментально: откройте файл .wav с какой-нибудь знакомой вам музыкой в ​​редакторе звуковых файлов, таком как Audacity или snd, и удалите один-единственный сэмпл 44 100 Гц только из одного канала и перенастройте другой канал так, чтобы первый Сэмпл теперь происходит со вторым редактируемым каналом, и воспроизведите его.

Вы услышите очень заметную разницу, даже несмотря на то, что разница во времени составляет всего 1/44100 секунды.

Учтите это: звук идет около 340 мм/мс, так что на 20 кГц это временная ошибка плюс минус одна задержка отсчета, или 50 микросекунд. Это 17 мм пути звука, но вы можете услышать разницу с недостающими 22,67 микросекундами, что составляет всего 7,7 мм пути звука.

Обычно считается, что абсолютная отсечка человеческого слуха составляет около 20 кГц, так что же происходит?

Ответ заключается в том, что тесты слуха проводятся с тестовыми тонами, которые в основном состоят только из одной частоты за раз, в течение довольно длительного времени в каждой части теста. Но наше внутреннее ухо состоит из физической структуры, которая выполняет своего рода БПФ со звуком, подвергая его воздействию нейроны, так что нейроны в разных положениях коррелируют с разными частотами.

Отдельные нейроны могут перезапускаться только очень быстро, поэтому в некоторых случаях некоторые нейроны используются один за другим, чтобы не отставать... но это работает только до 4 кГц или около того... восприятие тона заканчивается. Тем не менее, в мозгу нет ничего, что могло бы помешать возбуждению нейрона в любой момент, когда он почувствовал бы такое желание, так какая же самая высокая частота имеет значение?

Дело в том, что крошечная разница фаз между ушами ощутима, но вместо того, чтобы изменить то, как мы идентифицируем звуки (по их спектрографической структуре), она влияет на то, как мы воспринимаем их направление. (который также меняет HRTF!) Хотя кажется, что он должен быть «свернут» из нашего диапазона слышимости.

Ответ заключается в том, что точка -3 дБ или даже -10 дБ все еще слишком низкая - вам нужно перейти к точке примерно -80 дБ, чтобы получить все это. И если вы хотите справляться с громким звуком так же хорошо, как с тихим, то вам нужно быть хорошим до -100 дБ. Что маловероятно, когда тест на прослушивание одного тона когда-либо увидит, в основном потому, что такие частоты «учитываются» только тогда, когда они приходят в фазе с другими своими гармониками как часть резкого переходного звука - их энергия в этом случае суммируется, достигая достаточной концентрации чтобы вызвать нейронный ответ, даже если отдельные частотные компоненты по отдельности могут быть слишком малы для подсчета.

Другая проблема заключается в том, что в любом случае мы постоянно подвергаемся бомбардировке многими источниками ультразвукового шума, вероятно, большей частью из-за сломанных нейронов в наших собственных внутренних ушах, поврежденных чрезмерным уровнем звука в какой-то предыдущий момент нашей жизни. Было бы трудно различить изолированный выходной тон теста на прослушивание среди такого громкого «местного» шума!

Следовательно, это требует «прозрачной» конструкции системы, чтобы использовать гораздо более высокую частоту нижних частот, чтобы было пространство для затухания человеческих нижних частот (с его собственной фазовой модуляцией, на которую ваш мозг уже «откалиброван») до того, как система фазовая модуляция начинает изменять форму переходных процессов и сдвигать их во времени, так что мозг больше не может распознавать, какому звуку они принадлежат.

С наушниками гораздо проще просто сконструировать их, чтобы они имели один широкополосный драйвер с достаточной полосой пропускания и полагаться на очень высокую собственную частотную характеристику «нескорректированного» драйвера для предотвращения временных искажений. Это работает гораздо лучше с наушниками, так как небольшая масса драйвера хорошо подходит для этого условия.

Причина необходимости фазовой линейности глубоко укоренена в двойственности частотной и временной областей, как и причина, по которой вы не можете построить фильтр с нулевой задержкой, который может «идеально исправить» любую реальную физическую систему.

Причина, по которой важна «линейность фазы», ​​а не «равномерность фазы», ​​заключается в том, что общий наклон фазовой кривой не имеет значения - из-за двойственности любой наклон фазы просто эквивалентен постоянной временной задержке.

Наружное ухо каждого человека имеет разную форму и, следовательно, разную передаточную функцию, возникающую на немного разных частотах. Ваш мозг привык к тому, что у него есть, со своими отчетливыми резонансами. Если вы воспользуетесь не тем, то на самом деле он просто будет звучать хуже, так как поправки, к которым привык ваш мозг, перестанут соответствовать поправкам в передаточной функции наушника, и у вас будет кое-что похуже, чем отсутствие подавления резонанса - у вас будет в два раза больше несбалансированных полюсов / нулей, загромождающих вашу фазовую задержку и полностью искажающих ваши групповые задержки и отношения времени прибытия компонентов.

Это будет звучать очень нечетко, и вы не сможете разобрать пространственный образ, закодированный записью.

Если вы проведете слепой A/B-тест прослушивания, все выберут неисправленные наушники, которые, по крайней мере, не так сильно искажают групповые задержки, чтобы их мозг мог перенастроиться на них.

И именно поэтому активные наушники не пытаются уравнять звук. Это слишком сложно сделать правильно.

Это также объясняет, почему цифровая коррекция помещения является нишей, которой она является: потому что ее правильное использование требует частых измерений, которые сложно/невозможно выполнить вживую и о которых потребители обычно не хотят знать.

В основном из-за того, что акустические резонансы в корректируемой комнате, которые в основном являются частью басового отклика, продолжают слегка смещаться по мере изменения давления воздуха, температуры и влажности, таким образом слегка изменяя скорость звука, тем самым изменяя резонансы от того, что они были, когда производилось измерение.

Фильтрация в F-доминальной области действительно вызывает искажение фазы. Для компенсации этого можно использовать выравнивание фазы всех проходов. Теоретически цифровая или аналоговая сигнализация может иметь хорошую фазу. В наши дни цифровые технологии обеспечивают большую гибкость.
Ах, спасибо. Отсюда понятно, почему это не сделано в активных наушниках, через которые передается аналоговый сигнал (проводные наушники). Это, по-видимому, оставляет открытой возможность регулировки уровней в реальном времени без фазовых искажений либо в цифровом виде на источнике (например, на компьютере или телефоне), либо в цифровом виде на беспроводных наушниках без какой-либо задержки; это все еще открыто как возможность для «идеально плоского» (после HRTF) ответа?
Нет. Должна быть некоторая задержка. В противном случае вам буквально понадобится машина времени, поскольку единственный способ скорректировать фазу реальной (каузальной) системы без добавления какой-либо задержки — это использовать фильтр с точно обращенной антикаузальной временной характеристикой. И это означает, что ему обязательно нужно знать «будущее» сигнала до того, как он приземлится в момент времени = 0.

Интересная статья и обсуждение. Мы склонны думать, что теорема Найквиста — правило, применимое везде, а потом обнаруживаем, что это не так. Вы измеряете предел человеческого слуха до 20 кГц, используя синусоидальные волны, а затем сэмплируете на частоте 44,1 или 48 кГц с уверенностью, что вы захватили все, что может слышать ухо. Тем не менее, смещение одного канала на один сэмпл вызывает значительное изменение evwn, хотя временная разница превышает 20 кГц.

Мы думаем, что в движущихся изображениях глаз объединяет изображения с частотой кадров выше 20 кадров в секунду. Таким образом, фильм снимается со скоростью 24 кадра в секунду и воспроизводится с двукратным затвором для уменьшения мерцания (48 кадров в секунду); ТВ имеет частоту кадров 50 или 60 Гц в зависимости от региона. Некоторые из нас могут видеть мерцание частоты кадров 50 Гц, особенно если мы выросли с 60 Гц. Но вот где это становится интересно. На конференциях Hollywood Professional Association Tech Retreat и SMPTE за последние несколько лет было показано, что среднестатистический зритель видит значительное улучшение качества при увеличении исходной частоты кадров с 60 Гц до 120 Гц. Еще более удивительно, что те же зрители увидели аналогичное улучшение при увеличении частоты кадров со 120 до 240 Гц. Найквист сказал бы нам, что если мы не сможем увидеть частоту кадров на уровне 24, нам нужно только удвоить частоту кадров, чтобы гарантировать захват всего, что может разрешить глаз; тем не менее здесь мы имеем 10-кратную частоту кадров и все еще наблюдаем заметные различия.

Ясно, что здесь происходит нечто большее. В случае визуализации движения движение в изображении влияет на требуемую частоту кадров. Что касается звука, я ожидаю, что сложность и плотность звукового ландшафта определяют необходимое разрешение звука. Все эти звуки гораздо больше зависят от их фазовой когерентности, чем от частотной характеристики, чтобы обеспечить артикуляцию, необходимую для визуализации.

Я не могу найти здесь ничего, что отвечает на вопрос. Какое отношение частота дискретизации и теорема выборки Найквиста имеют к эквалайзеру в наушниках?
АЦП у человека отсутствует. Человеческий слух/зрение ничего не «сэмплирует», он использует нейроны, которые представляют собой нечто среднее между аналоговым и цифровым и практически непрерывны. Ухо имеет физическую отсечку. Зрительное восприятие также ограничено тем, насколько быстро мозг может обрабатывать информацию.