Программное обеспечение для создания автоматических субтитров (OS X)

Вы знаете, как Youtube создает «автоматические» субтитры на основе звука в видео? (звук в текст)

У меня есть файл MP4 на моем компьютере. Как бесплатно создать «автоматические» субтитры на основе звука видео? (звук в текст) Я не хочу набирать субтитры вручную, я хочу, чтобы звук в текст создавал их автоматически.

Я не понимаю, как эта страница полезна для автоматических субтитров.

И последнее замечание: я использую Mac версии 10.9.

Для веб-видео см. вопрос: Добавление субтитров к онлайн-видео
вау, как раз то, что я имел в виду. +200
Никаких гарантий, но попробуйте следующее: загрузите видео, разбейте его на часовые сегменты, загрузите незарегистрированные или частные, создайте скрытые субтитры (автоматически), наслаждайтесь правильными частями и смейтесь над ошибками.

Ответы (4)

Это одна из мечтаний многих людей, и в настоящее время идеального решения нет в открытом доступе . Однако это все еще может быть сделано с небольшим количеством грязной работы. Один из методов, который будет работать, если а) видео может быть общедоступным в течение нескольких минут и б) автоматические субтитры на Youtube будут работать, — это загрузить на Youtube , настроить Youtube на автоматические субтитры, а затем использовать веб-приложение KeepSubs для загрузки видео. субтитры, затем удалите видео.

Тогда это просто вопрос поиска редактора субтитров с функциями, которые вам нужны / нужны. AegisSub — это высококачественный редактор/применитель субтитров, который должен работать для того, что вам нужно.

Это хороший трюк для угона. Однако YouTube не создает автоматические субтитры для всех видео.
:( -- На данный момент KeepSubs, похоже, больше нет. Могут быть и другие. Я отредактирую, если найду.

Этот скрипт Python 2 использует Google Web Speech API и FFmpeg для создания субтитров: https://github.com/agermanidis/autosub

Это звучит потрясающе!

Есть и другой вариант, но он еще более трудоемкий для вас.

Это использует механизм речи-> текст и аудиокабель с двойным штекером 3,5 мм для направления выхода динамика на вход микрофона. Качество будет основываться на качестве тексто-речевого движка. Лучший известный мне движок, который будет работать на Mac, — это Dragon Dictate (я использовал версию для Windows — Dragon Naturally Speaking — вместо версии для Mac).

Тогда это просто вопрос поиска редактора субтитров с функциями, которые вам нужны / нужны. AegisSub — это высококачественный редактор/применитель субтитров, который должен работать для того, что вам нужно.

Затем снова приходит больше работ; вы должны настроить синхронизацию (через редактор субтитров) и проверить наличие ошибок.

Таким образом, это неприятный объем работы, и он не очень автоматизирован, но немного лучше, чем обычно ввод вручную - если у него плохое качество звука, вы можете потратить меньше времени, просто выполняя все это вручную, а не редактируя ужасно неточные результаты речевого > текстового движка. .

Gaupol 0.19.2 (Python) использует GStreamer 0.10 (с плагином PocketSphinx 0.7) для распознавания речи и создания автоматического тайминга. Я не тестировал более новые версии.

https://wiki.gnome.org/Apps/Гауполь/SpeechRecognition

Я использую Linux, но, возможно, их можно запустить и на OS X.

Поддержка может быть добавлена ​​и в новой версии: bugzilla.gnome.org/show_bug.cgi?id=757743