Как обнаружить и извлечь слова из аудио/видеопотока онлайн на самой веб-странице?

У меня есть видео (или аудио, думаю, это не важно) поток/файл, который не содержит субтитров. Но у него чистая английская речь. Можно ли обнаружить и извлечь из него слова. Мне не нужна 100% точность.

Есть ли какие-то сервисы или приложения на этот случай? Может быть, какие-то сервисы дают API для этого? Любые идеи приветствуются.

Ответы (3)

Если вы регулярно работаете с «владельцем» голоса, я могу порекомендовать Nuance's Dragon , он предлагает очень точную речь в текст с очень небольшим количеством ошибок, но требует некоторой «калибровки» для определенного голоса.

Так что, если вы сможете заставить своего актера/рассказчика прочитать калибровочный текст, вам будет легко делать стенограммы и субтитры (хотя впоследствии субтитры потребуют ручного хронометража). Nuance также предлагает SDK/API для разработчиков, если вам это нужно.

Однако это не поможет вам в случае интервью со случайными людьми на улице.

Альтернативой, которая не требует калибровки и также бесплатна, является служба Google Voice to Text. Для этого на Github есть хороший неофициальный «API» .

В большинстве случаев это даст вам полезные результаты, и его довольно легко использовать, если вы немного разбираетесь в программировании и можете использовать командную строку. Хотя имейте в виду, что я не знаю юридического статуса этого, я не уверен, разрешено ли использовать этот сервис в коммерческих целях. Возможно, вы захотите прочитать Условия использования Google для этого, они объединили это около года назад, поэтому его также следует применять для службы Voice to Text. Также недостатком является то, что он принимает только 15-секундные фрагменты, но если вы все равно хотите автоматизировать это, вы можете просто разделить свой аудиофайл с помощью FFmpeg и загрузить их одновременно.

Существует также еще одна коммерческая альтернатива под названием iSpeech , которая работает по модели оплаты за использование.

Также в Adobe Premiere есть встроенное распознавание речи, которое должно быть самым простым способом создания субтитров, поскольку оно интегрируется в полный рабочий процесс видео и позволяет почти автоматически регулировать время. Хорошее руководство можно найти здесь .

Действительно спасибо за ваш ответ! Это очень полезно. Я быстро проверил сервисы, о которых вы говорите, и я считаю, что мог бы использовать некоторые из них. Я принял и проголосовал за ваш ответ. Но если вы вспомните что-нибудь еще, дайте мне знать, пожалуйста.
Я расширю ответ, если найду что-нибудь новое. Я уверен, что это очень распространенная проблема, с которой многие люди столкнутся при создании видео, особенно для международной веб-аудитории.

На YouTube есть несколько вариантов субтитров. Когда-то у них были бесплатные субтитры, созданные компьютером, которые затем можно было загрузить в виде текстового файла.

В настоящее время YouTube предоставляет этот список программного обеспечения и сервисов для субтитров .

Если вы загружаете контент без подписей, они все равно генерируются автоматически. Вы можете загрузить их со страницы редактирования>дополнительно на YT. Это бесплатный способ получить полуточные расшифровки рашей.

Мы используем онлайн-сервис для создания субтитров. Это не бесплатно, но довольно дешево, учитывая объем работы, который он экономит — это, безусловно, дешевле, чем платить за это постпродакшн-персоналу. Есть много компаний, предлагающих эту услугу, с вариациями от полностью машинного до полностью расшифрованного человеком. Обычно вам нужно какое-то вмешательство человека, потому что машины все еще не делают вещи на 100%.

Быстрый поиск в Интернете выдаст длинный список из них.