Теггер части речи C++

Я с друзьями разрабатываю серьезную игру об исправлении орфографических ошибок.
Первая версия была разработана на Java, но мы хотим начать заново, и на этот раз решили использовать C++/Qt.

В этой игре мы берем текст, создаем ошибки, и игрок должен их исправлять, поэтому ошибки должны быть достоверными. Чтобы добиться этого с помощью Java, мы использовали LanguageTool (LT), чтобы получить тип каждого слова и вставить в него ошибку.

Проблема в том, что LT работает только на Java, а для эффективности мы хотим полностью работать с C/C++ . Нам просто нужен теггер части речи (POS), но мы не смогли найти подходящего для нас. Ближе всего к нашим потребностям, вероятно, YamCha , но он не задокументирован и заброшен с 2005 года.

Есть ли какая-нибудь библиотека, которая выполняет эту работу, имеет простую в использовании POS-тегу, легкую и полностью написанную на C++? Единственные, которые я нашел, были старыми или не написанными на C++. Он также должен работать с французским языком, но я полагаю, что каждый POS-тегер делает это, не так ли?

Ответы (1)

Следующие библиотеки C++ могут выполнить эту работу:

Остальные ссылки можно найти там .