Библиотека быстрых голосовых команд на Android, с открытым исходным кодом, работает в автономном режиме

Я хочу добавить голосовое управление в свое приложение для Android с открытым исходным кодом.

Словарный запас мне нужен не большой, всего 5 простых команд: "Показать", "Еще раз", "Сложно", "Хорошо", "Легко".

Какую библиотеку я могу использовать для этого?

Требования:

  • Быстрое распознавание, менее чем за полсекунды
  • Должен быть с открытым исходным кодом
  • Он НЕ должен полагаться на закрытые библиотеки, такие как Google Play Services или другие.
  • желательно не большой
Не то чтобы я что-то имел в виду (я не Android-разработчик;) — но: должно ли это работать в автономном режиме, а не с использованием (проприетарных) Google-сервисов (или любых других облачных вещей)? Если это так, не забудьте сообщить нам подробности, когда все будет готово, так как «прослушивание Google» и «требуется сеть» — мои основные аргументы против использования таких вещей :)
@Иззи: Обновлено. Мое приложение активно используется в Китае, где на большинстве телефонов нет сервисов Google Play.
Спасибо, Николас! Это делает меня еще более любопытным, так как голосовое управление без этого было бы чем-то, что мне действительно интересно (проголосовал, пометил звездочкой;)

Ответы (2)

Так что единственная библиотека, о которой я слышал, которая может работать, это Pocket Sphinx.

Я использовал только настольную версию Sphinx, но я считаю, что она может делать то, что вам нужно. Вам нужно будет создать свой собственный файл грамматики, но я предполагаю, что это будет довольно легко, основываясь на вашем коротком списке необходимых слов.

Лицензия похожа на лицензию BSD.

Как вы думаете, на сколько вырастет мой APK после добавления всех необходимых библиотек и данных распознавания для 5 простых голосовых команд вопроса? Спасибо!

Вы можете попробовать Pocketsphinx для создания автономного распознавания речи.
Но вы можете попробовать эту библиотеку для удобства использования, не разбираясь с ассетами Pocketsphinx и конфигурацией RapidSphinx . Эта библиотека может создавать словарь и языковую модель (файл Arpa) на лету.

На сколько вырастет мой APK после добавления всех необходимых библиотек?
Я рад, что могу помочь вам. Самый большой файл из библиотеки - это файл словаря, он весит около 3,2 Мб, а общий размер моей библиотеки с кодами около 3,5 Мб. Это стандартный размер от Pocketsphinx. А также из этой библиотеки будет создана только одна аудиозапись, поэтому при повторной попытке записи старая аудиозапись будет заменена. Так что не беспокойтесь. Пожалуйста, дайте мне знать, если вам нужна новая функция из этой библиотеки с созданием задачи в GitHub.