Почему люди не воспринимают звуковые волны с удвоенной частотой?

Я читал о том, как работают акустические биты.

Если мы объединим две волны с частотами ф 1 и ф 2 и единичной амплитуды, их комбинация равна

А "=" потому что ( 2 π ф 1 Икс ) + потому что ( 2 π ф 2 Икс ) "=" 2 потому что ( 2 π ф 1 ф 2 2 Икс ) потому что ( 2 π ф 1 + ф 2 2 Икс ) .

Согласно "Бит (акустика)" , Википедия:

Потому что человеческое ухо не чувствительно к фазе звука, слышно только его амплитуду или интенсивность, только величину огибающей.

Таким образом, очевидно, что частота биений в два раза превышает огибающую (поскольку вы возводите ее в квадрат), и вы получаете

ф бить "=" ф 1 ф 2
и не половина того.

Теперь рассмотрим обычную косинусоидальную волну А "=" потому что ( 2 π ф Т ) с частотой ф Т . Взяв величину (как говорит Википедия, т.е. возведя в квадрат А ) дает вам слышимую частоту 2 ф Т ... так люди слышат частоты, в два раза превышающие их амплитуду волны?

РЕДАКТИРОВАТЬ: Ответ заключается в том, что мы ДЕЙСТВИТЕЛЬНО воспринимаем удвоенную частоту - звуковая волна, которую мы определяем как имеющую частоту f, будет стимулировать наши уши с удвоенной частотой.

Эта частота f — просто удобное название, которое мы даем волнам, создаваемым нашими машинами. Это никого не беспокоит, так как люди не слышат в замедленном темпе, т.е. не могут сосчитать 200 «тиков» в секунду при воспроизведении волны частотой 100 Гц.

Если да, то как вы можете это измерить?
Если люди всегда воспринимали их как двойных; они никогда не поймут, что слышат вдвое больше, чем должны слышать. Это тот же принцип, что и наши глаза работают как камера-обскура (которая по своей сути переворачивает изображение), но люди автоматически корректируют свое восприятие, чтобы мир не выглядел перевернутым.
Мы не «слышим» частоты. Мы воспринимаем что-то близкое к логарифмическому преобразованию Фурье того, что движется в наших ушах, далее обрабатывается и интерпретируется нашим мозгом.
@ThePhoton Вероятно, этот вопрос похож на вековой: «Твой синий такой же, как мой синий?»

Ответы (5)

Люди слышат правильный перцептивный сигнал для звуковой волны этой частоты.

Мы действительно не можем сказать намного больше, чем это. Психология акустики очень сложна и может заполнить тома.

Точнее сказать, у нас есть клетки, которые действуют резонансно на определенной частоте. Наш мозг определяет, какие клетки резонируют в любой момент времени, и строит сигнал на основе этого. Наш мозг получает информацию о том, что сигнализирует клетка А или клетка Б. Связь между этими нейронными сигналами и частотами — это выученная реакция, которую мы улавливаем на раннем этапе, будучи младенцем или, возможно, даже в утробе матери.

Да. Частоты отображаются на разные расстояния в улитке. Только для низких частот существует связь между потенциалами действия и фазой волны. Это играет роль в бинауральном восприятии направления.
Хорошо, теперь я понимаю, что звук действительно субъективен в зависимости от того, как его воспринимают наши клетки. Я все еще немного запутался — я знаю, что люди слышат звуковые волны, когда в наших ушах происходит сжатие и расширение, и мы не можем отличить их друг от друга. Звуковая волна с частотой 1 волна в секунду определяется как синусоида с пиком/минимумом (или сжатие, а затем расширение за секунду). Но поскольку мы не можем определить разницу между сжатием и расширением, разве наши уши не почувствуют, что эта частота «1» волны возникает два раза в секунду (т.е. фактическая частота «2» сигналов в секунду)
@MondoDuke Синусоидальная волна 100 Гц вызывает движения базилярной мембраны в другом положении, чем синусоидальная волна 200 Гц. Стимулируются разные волосковые клетки, начинают возбуждаться разные «нити» слухового нерва. (Но если вы хотите испытать что-то странное, послушайте бинауральные ритмы в наушниках.)
Мы не «ощущаем» каждый цикл так, как вы о нем думаете. Нервное волокно, используемое для обнаружения 2 кГц, не возбуждается в два раза быстрее, чем нервное волокно, используемое для обнаружения 1 кГц. Оба волокна передают что-то более похожее на «вот сколько энергии там, где находятся мои клетки», и клетки структурированы так, чтобы выполнять своего рода преобразование Фурье.
Но разве биты не отличаются от тонов? Разве это не то, о чем спрашивает ОП?
@MondoDuke Я пытаюсь понять ваше замешательство. Вы спрашиваете, если пики неотличимы от впадин, то почему мы слышим частоту как полный период волны, а не половину периода?
+1 за «психологию акустики .... можно заполнить тома»
@CortAmmon Это слишком сильное заявление, чтобы его делать. Есть еще одна теория слуха, временная теория , согласно которой нейроны действительно напрямую записывают частоту. У меня сложилось впечатление, что ни темпоральная теория, ни ваша (называемая теорией «места») не могут объяснить все наблюдения; реальный беспорядочный процесс слушания может использовать и то, и другое.
@knzhou Увлекательно. Я сказал, что теория того, как мы слышим, может занимать много места. Ты только что дал мне еще один том, чтобы я мог изучить его =D
Мне это не кажется правильным. Для волн давления, частота которых достаточно высока, чтобы мы могли слышать их как ноты постоянной громкости, да, механизм преобразования частоты в воспринимаемую высоту звука очень сложен. Но не являются ли модуляции амплитуды биений достаточно медленными, чтобы мы могли непосредственно воспринимать амплитуду огибающей (то есть громкость), изменяющуюся в течение воспринимаемых человеком периодов времени? Таким образом, это совершенно другой и, как мне кажется, гораздо более простой механизм обработки слуховых сигналов, при котором человек может напрямую измерять частоту с помощью секундомера.

Таким образом, очевидно, что слышимая частота в два раза превышает огибающую.

Извините, это неправильно. Если вы воспроизводите два тона (скажем, 440 Гц и 267 Гц), вы просто слышите два тона на двух разных частотах, и у вас есть два возбуждения в разных точках базилярной мембраны и два разных набора нервных возбуждений. Вы вообще не слышите огибающую, они просто звучат как два устойчивых тона.

«Удары» случаются только тогда, когда у вас есть две частоты, которые ОЧЕНЬ близки друг к другу, скажем, 237 Гц и 238 Гц. В этом случае ваше ухо больше не может различать разницу частот, но вы слышите одиночный тон частотой 237,5 Гц, амплитуда которого модулирована частотой 1 Гц.

Взяв величину (как говорит Википедия, т.е. возведя в квадрат А), вы получите слышимую частоту 2fT.

Нет. Вы можете возвести в квадрат амплитуду, чтобы оценить мощность или энергию, но нет механизма, который возвел бы в квадрат фактическую форму волны. Если вы играете 100 Гц, вы слышите 100 Гц, вот и все.

Хотя кажущиеся синусоидальные волны, прослеживаемые огибающей, имеют частоту 1/2 Гц. Пример
Это слишком сильное заявление, чтобы сделать его. Есть еще одна теория слуха, временная теория , согласно которой нейроны действительно напрямую записывают частоту. У меня сложилось впечатление, что ни темпоральная теория, ни ваша (называемая теорией «места») не могут объяснить все наблюдения; реальный беспорядочный процесс слушания может использовать и то, и другое.

Человеческое восприятие волны на частоте ф это человеческое восприятие волны на частоте ф . Не существует «объективных» квалиа для частоты ф кроме того, что люди воспринимают, поэтому бессмысленно спрашивать, слышат ли люди ф , воспринимать 2 ф ; нет смысла "воспринимать 2 ф "кроме как "испытывать квалиа, связанные с 2 ф ", и ясно, когда кто-то слышит ф , они испытывают эти квалиа, связанные с ф , нет 2 ф .

Человеческое ухо в основном представляет собой устройство для обнаружения компонентов преобразования Фурье звука. Причина, по которой ф 2 ф 1 доминирует с ударами в том, что если ф 2 + ф 1 достаточно высока, то ф 2 ф 1 компонента не будет существенно затронута умножением на ф 2 + ф 1 волна.

Это справедливо для восприятия высоты тона сигнала с постоянной амплитудой. Но это не так для ударов, которые действуют через совсем другой механизм. С биениями вы управляете модуляцией амплитуды огибающей, а не фазовыми колебаниями. И эта модуляция происходит в достаточно медленных временных масштабах, чтобы ее можно было непосредственно измерить, например, с помощью секундомера. Вы слышите удары как периодические колебания громкости , а не как высоту тона.

Ваша интуиция права. Кажется, вы могли пропустить это утверждение в той же статье Википедии, которая подтверждает то, о чем вы спрашиваете:

Таким образом, субъективно частота огибающей, по-видимому, в два раза превышает частоту модулирующего косинуса, что означает, что частота слышимых биений составляет:

ф бить "=" ф 1 ф 2

По сути, длина волны удара для слуха — это продолжительность между последовательными максимумами амплитуды, а не абстрактная модулирующая косинусоидальная волна, длина которой вдвое больше.

Я думаю, мы оба сказали одно и то же, лол. короче мы на одной волне

Человеческое ухо чувствительно только к амплитуде в том смысле, что вы не можете различить с я н ( т ) и с я н ( т + ф ) . Это не значит, что вы не можете отличить с я н ( т ) и с я н 2 ( т ) : последний будет слышен как удвоенная частота при половинной громкости.

@Jasper Я думаю, он имел в виду чувствительность к амплитуде и частоте, но не к фазе (как следует из остальной части предложения).