Преобразование сигнала FFMPEG обратно в аудио

Я пытаюсь преобразовать аудиофайл в сигнал FFMPEG, обучить его в HyperGAN и создать файл изображения для преобразования в аудиофайл. Я спрашиваю, есть ли способ преобразовать изображение формы волны обратно в аудиофайл без потери качества (в основном, если бы вы хэшировали оригинал и преобразованный, это был бы один и тот же хеш), и если FFMPEG является правильным инструментом для использования. В настоящее время у меня есть пакетный скрипт для просмотра всех моих аудиофайлов и преобразования их в изображения (ffmpeg.exe -i %1 -lavfi showwavespic=s=1024x800:colors=0971CE %1.png), но я не могу их преобразовать вернуться к аудиофайлам, что противоречит цели того, что я делаю.

РЕДАКТИРОВАТЬ: FFMPEG преобразует аудиофайл размером 5 МБ в изображение размером 32 КБ, поэтому я не думаю, что он будет конвертировать обратно. Можно ли как-то сделать его более подробным?

Ответы (2)

FFmpeg не может этого сделать.

Даже теоретически метод кажется несостоятельным (без каламбура). Аудио обычно сэмплируется с частотой 40 000 000 000 Гц в секунду. Максимальный размер изображения в ffmpeg составляет 65 КБ. Таким образом, даже при таком размере едва ли можно представить 1,5 секунды звука при полном разрешении выборки. Как только вы опуститесь ниже и полагаетесь на интерполяцию, качество вашего вывода начнет ухудшаться, поскольку ваша реконструкция становится более грубой.

Спасибо за ответ, но знаете ли вы (или кто-либо другой) программу, которая могла бы это сделать?
Похоже, что Photosounder может это сделать.
Photosounder может работать, хотя он платный и его нельзя автоматизировать.

См. документацию по фильтру SpectraSynth. Вместо этого вам нужно будет использовать фильтр showspectrum. И иметь еще и фазовое видео. Использование только showspectrumpic невозможно, так как резко сокращается временное разрешение.

Я думаю, что ОП хочет извне манипулировать графиком амплитуды во временной области и преобразовать его обратно в звук.
Ах, этот, да, вы правы. Это даже невозможно, вы теряете разрешение в обоих направлениях: во временной и амплитудной области.