Что означает выражение «частота человеческого голоса»?

Термин «частота» для периодической волны может быть определен как количество раз, когда повторяющийся паттерн возникает в заданный период времени (например, количество циклов гребня и впадины в секунду для электромагнитной волны). Но что означает частота в контексте человеческого голоса? Я пытался понять Модуляцию (из интереса) и человеческий голос построен со временем Икс -ось и амплитуда на у -ось. А амплитуда/частота несущей модулируется на основе амплитуды входного сигнала. Где частотная размерность? Может кто-нибудь, пожалуйста, помогите мне здесь?

Очень извините за опечатку в предыдущей версии вопроса. Я хотел понять частотное измерение типичного человеческого голоса и не особо интересовался точными значениями. В частности, если построить график зависимости частоты голоса от времени, как будет выглядеть график? И вообще графическое изображение голоса, что отложено во времени, частоте, амплитуде?

Связано: physics.stackexchange.com/q/10707/2451 и ссылки в нем.

Ответы (3)

Человеческие голоса, как правило, имеют среднее значение около середины C - мужские голоса в среднем на октаву ниже этого значения, а женские голоса - на октаву выше. Средний C составляет 261,6 Гц.

Если у вас есть график зависимости амплитуды от времени, то способ измерения содержащихся в нем частот заключается в преобразовании Фурье . Это дает вам график зависимости амплитуды от частоты. Если вы возьмете достаточно четкий сигнал, например, певец, поющий постоянную ноту, вы должны увидеть четкую основную частоту и обертоны. Для некоторого случайного фрагмента речи вы, скорее всего, получите широкий диапазон частот.

Указание средней частоты человеческого голоса на 4 цифры абсурдно. Делать это неправильно, потому что вы утверждаете детали, которые вы не можете знать.
Олин, он указал от средней до до четырех цифр, но заявляет, что «голоса, как правило, в среднем составляют среднюю до» . Едва ли можно претендовать на четырехзначную точность для высоты человеческого голоса.

Если кто-то не подписывает длительную ноту, звуки человеческого голоса не будут регулярно повторяться. Это означает, что вы не можете объявить что-то основной частотой, а все остальное представляет собой серию гармоник.

Вместо этого имеет смысл думать о голосе в контексте непрерывного спектра. Если вы сделаете это, вы увидите, что большая часть сигнала находится в диапазоне нескольких 100 Гц. Телефонная компания давно выяснила, какую часть общего спектра им необходимо передавать, чтобы голос на другом конце звучал разумно.

Если держать только примерно от 50 Гц до 3 кГц, то голос на другом конце будет звучать неплохо и можно будет идентифицировать отдельных людей. Фрикативные звуки, такие как «с», содержат более высокие частоты, но мы вполне способны понимать голос, ограниченный 3 кГц. Вы можете уйти с более высоким отсечкой нижних частот, например, чуть ниже 100 Гц, но дополнительные 10 Гц не обременительны. Другими словами, ширина полосы пропускания 2,90 кГц или 2,95 кГц не имеет большого значения для стоимости передачи.

Если вам просто нужен понятный голос, не обязательно качественный голос, то вы можете обрезать высокие частоты еще ниже. Большая часть информации находится ниже 1 кГц, но результат не будет звучать «хорошо», если вы отфильтруете все, что выше этого. Это будет звучать «мягко» и немного похоже на то, что кто-то говорит через туннель. Если вы это сделаете, лучше использовать мужской голос, так как больше информации находится на более низких частотах.

Как указал Олин Латроп, для распознавания речи (и распознавания отдельных лиц) необходимый частотный диапазон сигнала должен простираться примерно до 3000 Гц. Например, различие между различными гласными языка заключается в высших гармониках звука речи.

Согласно статье в Википедии о частоте голоса :
«Голосовая речь типичного взрослого мужчины будет иметь основную частоту от 85 до 180 Гц, а речь типичной взрослой женщины — от 165 до 255 Гц». То есть частотные диапазоны (основной частоты) разнесены примерно на октаву для мужчин и женщин.

Как заявил Олин Латроп, в случае речи основная частота не является необходимой для хорошего распознавания.

В течение десятилетий микрофоны, используемые в телефонных аппаратах (угольные микрофоны), относились к типу, чувствительному к частоте примерно от 300 Гц и выше. То есть эти телефонные микрофоны никогда не улавливали основную частоту, только 300 Гц и выше.

Между прочим, без сомнения, динамик телефона может издавать только очень слабый низкочастотный звук, и опять же, это не влияет на распознавание речи.

Для пения, особенно для обученных певцов, полное понимание требует в значительной степени стандарта качества Hi-Fi. Для певческого голоса срез выше 3000 Гц заставит его звучать онемевшим и обедненным.

На самом деле вполне может быть опечатка в числах, указанных в этой статье Википедии о частоте голоса. Диапазон от 165 до 255 Гц для типичного взрослого женского голоса (основная частота) выглядит странно. Вполне возможно, что это от 165 до 355 Гц. В любом случае, эти цифры совершенно неактуальны, поэтому неудивительно, что для них нет источников.