Почему разные буквы звучат по-разному?

Если кто-то поет буквы «А» и «М» с одинаковой громкостью и высотой звука, эти две буквы все равно различимы. Однако, если и высота тона, и громкость одинаковы, разве звук не должен быть точно таким же?

Вы не можете пропеть букву В, потому что это смычный согласный. Если вы имеете в виду сказать «пчела», например, удерживая гласную е, то дело в относительной силе обертонов.
Хорошая точка зрения! Я не думал об этом.
Может быть , эта страница в Википедии поможет (она касается случая гласных, например, «А» против «О»).
Слово, которое вы ищете, это timbre .
@knzhou Буква B на самом деле озвучена и, следовательно, имеет высоту звука.
На самом деле они не могут, не всегда. Рассмотрим эффект МакГерка ( пример видео ).
Буквы ни на что не похожи, потому что это просто письменные символы. Вы говорите о звуках речи (телефоны). Это не придирки. То, как зачитывается письмо, зависит от языка, речи/диалекта читателя, контекста письма и т. д.
@Szabolcs предположительно означает фонемы , а не телефоны, но это тоже очень важное различие.

Ответы (4)

Вы не поете одну ноту — вы поете частоту и ее гармоники. С помощью простого анализатора спектра я «пою» буквы А и М попеременно (на самом деле АМАМА):

введите описание изображения здесь

У буквы «А» больше гармоник (более яркие линии на более высоких частотах), у буквы «М» больше вторая гармоника. Шкала частот откалибрована неправильно (дешевое приложение для iPhone...)

Вот два других снимка, рядом (М, затем А). Вы можете видеть, что 2-я гармоника М больше, чем первая; напротив, более высокие гармоники от A затухают медленнее:введите описание изображения здесь введите описание изображения здесь

У простых гласных есть одно общее: форма вашего рта изменяет относительную интенсивность гармоник, и ваше ухо хорошо это улавливает. Между прочим, именно по этой причине иногда трудно понять, что поет сопрано — в верхней части ее диапазона частоты, которые помогают различать разные гласные, могут быть «за пределами диапазона» для ваших ушей.

С краткими («взрывными») согласными (П, Т, Б, К и т. д.) дело обстоит несколько сложнее, так как частотный состав меняется при звучании буквы. Но тогда трудно "спеть" букву П... можно было бы спеть "пиееее", но тогда именно "Е" несет высоту тона.

Я использовал для этого приложение SignalSpy — я никоим образом не связан с ним.

подождите минутку… ваш основной тон достигает 15 Гц? или на сонограмме (первое фото) неправильные цифры на шкале?
Кстати, существует бесплатное программное обеспечение, которое также может генерировать эти изображения. Смелость например.
@SargeBorsch числа логарифмической шкалы отличаются в 10 раз, я полагаю (я сказал, что «шкала частот неправильно откалибрована») - см. другие графики, частота которых в 10 раз выше. Я слышал об Audacity, но не пытался найти/использовать его.
@SargeBorsch пфф, я легко могу петь 15 Гц
@Floris, извини, не заметил эту часть
Технически спектральные компоненты А и М также меняются в процессе их пения, и они имеют другое переходное содержание. Музыкальное слово для описания различных звуков голосов и инструментов — тембр (произносится как «тамбер»).
@SargeBorsch Я считаю, что Audacity предназначен только для настольных компьютеров, поэтому не будет работать на iPhone.
@Floris на самом деле дело не в том, что частота неправильно откалибрована. Просто при разговоре вы излучаете низкочастотные гармоники. Вот моя спектрограмма AMAM, сделанная в Audacity .
@Руслан, очень интересно - но в этом случае между «спектрограммой» и «анализатором спектра» что-то отличается, что я не могу надеть свой искатель. Может быть, один из них умножает амплитуду на 1/f, делая более заметными более низкие частоты?
Да, сначала не заметил разницы. Являются ли эти анализы одной и той же записи (файла)? Или один из них был захвачен самим приложением, а другой проанализировал сохраненный сжатый с потерями файл (например, mp3)?
Оба были захвачены и проанализированы одним и тем же приложением — одно за другим. Я не думаю, что изменил высоту звука на три октавы, поэтому я подозреваю, что есть некоторая разница в обработке. Я проверю с генератором чистого тона...
@Руслан Я только триместр с генератором сигналов. Спектр выглядит нормально, но вертикальная шкала спектрограммы полностью нарушена. Это не какие-то "субгармоники" - просто плохое масштабирование. Сообщу разработчику.
@theonlygusti Ты шутишь? 15 Гц — это почти на октаву ниже самой низкой ноты на фортепиано и ниже нижнего предела человеческого слуха. Я сомневаюсь, что вы можете петь так низко, но поскольку вас все равно никто не слышит, я думаю, никто не может сказать, что вы не можете !
@pwf на самом деле, самая низкая нота, когда-либо спетая, составляет 0,189 Гц.
@theonlygusti - Я полагаю, вы имеете в виду этот мировой рекорд Гиннеса . Тем не менее, согласно этой статье NPR (которая имеет более позднюю дату), самая низкая нота, которую Тим Сторм (тот же парень) когда-либо «пел» для записи, - это низкая ми - 41 Гц. Это очень низко, но гораздо более правдоподобно. Если я произношу «ха…ха…ха» каждые 10 секунд, я бы «пел» 0,1 Гц в соответствии с оборудованием, используемым для утверждения 0,189 Гц…
@Floris Самая низкая нота, которую он пел для выступления, была низкая ми. Я не думаю, что пение «ха-ха-ха» будет считаться.

Основная частота определяется голосовыми связками. Они заставляют воздушный поток пульсировать с частотой от 100 Гц до 200 Гц. Импульсы короткие, поэтому есть обертоны до нескольких кГц.

Рот и язык делают голосовой тракт резонансным в разных частотных диапазонах. Они называются формантами. Взгляните на карту формант здесь: https://www2.warwick.ac.uk/fac/sci/physics/staff/academic/bell/sonify/ttm/sound_files/

Здесь следует отметить другое. Допустим, я бы сказал группе сыграть ноту «C3». Бас, гитара, фортепиано, голос, банджо — все они звучат по-разному, и все же мы воспринимаем их как одну и ту же сыгранную ноту.

Аналогично, подумайте о спетой «А» и спетой «Б» (как в «пчеле») как об инструменте соответственно. У них есть свой уникальный «звук», и тем не менее их обоих можно использовать для создания одной и той же «музыкальной ноты» определенной высоты и громкости.

Чем тогда нота C3 спетой «A» отличается от ноты C3 спетой «B»? (Или чем C3 фортепиано отличается от C3 гитары?)

Обратите внимание, что на самом деле означает «одинаковая высота тона и громкость». Я буду держать это просто.

Шаг: воспринимаемая частота

Объем: давление воздуха или амплитуда

Вот две картинки, чтобы проиллюстрировать, что я имею в виду:

введите описание изображения здесь введите описание изображения здесь

Оба они имеют одинаковую амплитуду или громкость.

Оба они имеют одинаковую воспринимаемую частоту или высоту тона.

Таким образом, оба они играют одну и ту же музыкальную ноту, которую мы воспринимаем.

Но, глядя на форму волны, вы, вероятно, могли бы сказать, что они будут звучать по-разному, хотя мы бы воспринимали их как одну и ту же ноту.

Эта разница аналогична фортепиано C3 и гитаре C3.

По существу: та же воспринимаемая частота и давление воздуха создают иллюзию одной и той же музыкальной ноты, воспринимаемой слушателем. Совершенно разные волновые формы (звуки) могут восприниматься как одна и та же музыкальная нота, если их волновые формы «выглядят одинаково» (две картинки выше иллюстрируют, что я имею в виду).

Таким образом, спетая «А» и спетая «Б» на самом деле сильно отличаются друг от друга. Но если их петь с одинаковой высотой звука, они будут воспроизводить одинаковый музыкальный звук (в восприятии человека).

Источник используемых изображений

Спасибо! Если подумать об этом с инструментальной точки зрения, это становится намного яснее.

Буквы, физические звуки и звуки, которые мы слышим
Позвольте мне сначала заметить, что многие языки (и особенно английский) не имеют однозначного соответствия со звуками. Другими словами, буквы являются символами, и некоторые из них или группы букв могут соответствовать нескольким звукам, а один и тот же звук иногда может быть представлен разными (сочетаниями) буквами.

Изучение того, как образуются различные звуки, называется фонетикой . Обратите внимание, что это отличается от фонологии , которая изучает системы звуков, используемых в определенных языках. Хотя все люди, в принципе, способны воспроизводить и различать одинаковый набор звуков, многие из них будут рассматриваться как один звук определенным языком ( аллофонами ). Так как звуковой строй усваивается в раннем детстве, мы быстро теряем способность различать звуки, которые наш родной язык считает одним целым.

(Мой личный опыт показывает, что грамотные люди часто даже не слышат звуки своего языка, поскольку их мышление слишком сосредоточено на том, как пишется слово. Попытка научить иностранца своему языку быстро раскрывает его.)

Звуковой спектр
Являясь акустическими волнами, звуки принципиально различаются по амплитуде и спектру. За исключением тональных языков (например, китайского), громкость звука обычно указывает на ударение, тогда как его высота (т. е. его относительное положение на частотной шкале) не меняет значения звука. Таким образом, основные различия между звуками связаны с формой их спектра , которая регулируется артикуляцией .

Гласные
Необходимо различать гласные и согласные. Гласные — это звуки, которые могут звучать непрерывно — по сути, они представляют собой модулированные частотные волны, подобные тем, которые издают духовые музыкальные инструменты. Как и в случае с музыкальными инструментами, качество гласного контролируется формой резонатора, то есть нашей ротовой полостью. Гласные обычно определяются положением языка ( высокий/низкий и передний/задний ), положением губ ( округлые/неокруглые ) и тем, проходит ли поток воздуха через нос или нет ( назальный и не носовой).

Согласные
. Согласные отличаются от гласных связанными с ними движениями органов речи — например, внезапным выпуском воздуха ( взрывные согласные ), ритмическими колебаниями языка (например, вариантами r в разных языках) и т. д. Их классификация более сложна, чем гласных, но также хорошо зарекомендовавший себя (см. статью в Википедии, процитированную в начале). Таким образом, согласные связаны с короткими импульсами или сериями импульсов (в отличие от непрерывно звучащих гласных).

Примечание:

  • Непрерывное звучание M , как предлагается в ОП, вероятно, означает непрерывное звучание носовой гласной, а не фактическое M , которое образуется внезапным выпуском воздуха при открывании губ.
  • Я еще раз подчеркиваю, что приведенное выше обсуждение не относится ко всем языкам, некоторые из которых используют тональность (например, китайский) или даже щелчки для передачи информации (некоторые африканские языки). Однако обсуждение относится ко всем индоевропейским языкам , таким как английский, французский, русский, персидский, хинди и многим другим - я полагаю, что читатели владеют хотя бы английским языком.