Не знаете ли вы, где я могу получить программу проверки орфографии командной строки (если возможно, бинарную для Windows), которую я могу использовать в неинтерактивном режиме для финского языка (чтобы отфильтровать список строк, которые могут быть словами или не словами)?
Я слышал, что Hunspell не подходит для финского языка.
Я попробовал Aspell, но не удовлетворен результатом (например, "tainnuttaa" считается словом с ошибкой).
Пятиэтапный процесс:
pip install pyenchant
.Напишите простой скрипт для обработки слов, которые вы вводите, слова из командной строки или слова в файле. Учебники должны дать вам очень хорошую отправную точку. например:
import sys
import enchant
d = enchant.Dict("fi_FI")
if len(sys.argv) < 2:
print "To use this script supply the words to check on the command line"
for word in sys.argv[1:]:
print word, d.check(word)
Tmispell — это оболочка ispell , которая использует систему проверки орфографии Voikko для фактической проверки орфографии для финского языка.
Tmispell — это прозрачная оболочка для Ispell, другие программы, которые обычно используют Ispell, будут автоматически использовать Tmispell (и, следовательно, Voikko) без каких-либо изменений.
Для получения дополнительной информации посетите эту ссылку: http://manpages.ubuntu.com/manpages/hardy/man1/tmispell.1.html
Я надеюсь, что ваша проблема разрешится.
Франк Дернонкур