«Opus обрезает звук выше 20 кГц» — это нормально для аудиокодеков с потерями?

Резюме:
1. Является ли это нормальным среди кодеков с потерями?
2. Каковы эффекты этого особенно при обработке этого аудиофайла с отсечкой?
3. Почему он все еще сохраняет файл как 48 кГц, если он больше не содержит этих данных? ++++++++++++++++++++++++++++++++++++++++++++++++++++ +++
Я читал вики для Opus. И нижние ноты бросились в глаза, в основном: https://en.wikipedia.org/wiki/Opus_(audio_format)

Opus обрезает звук выше 20 кГц, общепринятого верхнего предела диапазона человеческого слуха.

В нем перечислены очень конкретные частоты дискретизации, которые также поддерживаются для опуса на этой странице: 8 кГц, 12 кГц, 16 кГц, 24 кГц, 48 кГц.

Итак, если я собираюсь использовать opus в качестве аудиоформата, значит ли это, что мне нужно записывать только с частотой дискретизации 24 кГц? Все, что выше 20 кГц, является просто дополнительными данными для преобразования сигнала перед экспортом? Таким образом, отсутствие намерения преобразовать означает, что вы можете просто записывать на частоте 24 кГц?

Я не слишком хорошо знаком со спецификой аудиокодеков, но нормально ли, что кодеки обрезают такой большой диапазон звуков? Меня это просто беспокоит, учитывая, что все записывают с минимальной частотой ~ 44,1 кГц, а в целом 48 кГц хорошо используются. Лучше ли использовать другой кодек с потерями, чем opus, если я намерен в какой-то момент снова отредактировать / перекодировать звук? Или не будет реальной разницы между потерями при редактировании и перекодировании опуса и потерями при редактировании aac/etc?

Я также смущен, почему, когда я перекодирую из 48 кГц f32 .wav в опус, он все еще сохраняет себя как частоту дискретизации 48 кГц. Разве все данные выше 20 кГц не исчезли...? Это сбивает меня с толку. edit: ну, я думаю, когда вы объединяете разные частоты дискретизации, они звучат с разной скоростью, поэтому он сохраняет исходный формат ..?

И да, я знаю, что формат без потерь является идеальным форматом, если я собираюсь в какой-то момент перекодировать/редактировать, но ради аргумента давайте притворимся, что нам нужно выбирать между форматами с потерями (по крайней мере, для первоначального экспорта мы можем перекодировать позже в без потерь)

Ответы (1)

Вы ошибочно принимаете частоту дискретизации за частоту среза звука. Если частота дискретизации составляет 48 кГц, абсолютная максимальная частота, которая даже теоретически может быть представлена ​​низкочастотным сигналом, составляет 24 кГц (я не вдаюсь в теории полосы пропускания, поскольку дозвуковая полоса 20 Гц слишком мала, чтобы ее можно было использовать для передачи высокочастотного контента). На практике вам нужно больше свободы действий, чтобы избежать проблем с псевдонимами.

Таким образом, 48 кГц является разумной частотой дискретизации для использования при отсечке сигналов на частоте около 20 кГц. Теперь вы спрашиваете, принято ли это для аудиокодеков с потерями. Принцип кодирования звука с потерями заключается в том, чтобы отбрасывать информацию, которая с психоакустической точки зрения не должна иметь значения. Поскольку предполагается, что человеческий слух в основном ограничен диапазоном 20 Гц-20 кГц, неудивительно, что диапазон выше 20 кГц не подлежит кодированию.

Если частота дискретизации источника меньше 48 кГц, можно ли использовать ту же частоту дискретизации для цели? Может быть, вы могли бы получить файл меньшего размера? Как бы вы сказали это ffmpeg?