У меня есть сотни часов аудиофайлов на английском языке, которые мне нужно транскрибировать на тот же язык. Знаете ли вы программу преобразования речи в текст, которую я могу использовать для автоматического преобразования ?
Я представляю это как приложение, которое я мог бы использовать следующим образом:
$ transcriber --input 001.mp4 --output 001.txt
С чем-то вроде этого будет легко написать сценарий для расшифровки всех аудиофайлов.
Спасибо,
Это прозвучит несколько странно, но вы можете загрузить его на Youtube (при условии, что это материал, не защищенный авторским правом), добавить автоматический CC и загрузить этот файл.
Далеко не идеальное, но возможное решение.
Whisper от OpenAI довольно медленный, но обладает высочайшей производительностью. В настоящее время не существует системы с более высокой точностью для транскрипции общего назначения.
Я рекомендую использовать https://transcribe.wreally.com . Ни ваш аудиофайл, ни ваша транскрипция не передаются на их веб-сайт, поэтому ваше требование конфиденциальности выполнено. Вы можете использовать его в автономном режиме, но вы должны использовать его в браузере Chrome. (К сожалению, это не удовлетворяет вашим требованиям к открытому исходному коду.)
Это похоже на процесс транскрипции YouTube, но лучше.
руп
Марио С
пользователь416
Том
ДжонДоу297
Крис Стричински
ДжонДоу297