Проверка орфографии из командной строки для финского языка

Не знаете ли вы, где я могу получить программу проверки орфографии командной строки (если возможно, бинарную для Windows), которую я могу использовать в неинтерактивном режиме для финского языка (чтобы отфильтровать список строк, которые могут быть словами или не словами)?

Я слышал, что Hunspell не подходит для финского языка.
Я попробовал Aspell, но не удовлетворен результатом (например, "tainnuttaa" считается словом с ошибкой).

Похоже, основная проблема заключается в том, чтобы найти хороший словарь Aspell для финского языка: вы можете попросить его на opendata SE.

Ответы (2)

Пятиэтапный процесс:

  1. Установите Python для Windows .
  2. Установите pyEnchant отсюда или с помощьюpip install pyenchant .
  3. Добавьте словарь отсюда по этим инструкциям .
  4. Убедитесь, что у вас есть каталог python и его скриптов на вашем пути, если вы использовали установку по умолчанию, это будут C:\python и C:\python\scripts в Windows.
  5. Напишите простой скрипт для обработки слов, которые вы вводите, слова из командной строки или слова в файле. Учебники должны дать вам очень хорошую отправную точку. например:

    import sys
    import enchant
    
    d = enchant.Dict("fi_FI")
    
    if len(sys.argv) < 2:
        print "To use this script supply the words to check on the command line"
    for word in sys.argv[1:]:
        print word, d.check(word)
    
Большое спасибо за ваш четкий ответ! К сожалению, я сделал все вышеперечисленные шаги, и Python возвращает следующий код после «import enchant»:` Файл «c:\Python27\lib\site-packages\enchant_ init_ .py», строка 92, в <module> from enchant import _enchant как _e Файл "c:\Python27\lib\site-packages\enchant_enchant.py", строка 102, в <модуль> поднять WinError() WindowsError: [Ошибка 193] <без описания>`
Я решил проблему с Enchant. Он не работал с 64-битным Python. К сожалению, enchant не может найти финский словарь. Заглянул в архив fi_FI.zip и заметил, что файлы пустые. Я пытаюсь с этим .
Вам понадобится сборка libvokko для Windows отсюда: puimula.org/htp/testing/voikko-sdk/win-crossbuild для серверной части.

Tmispell — это оболочка ispell , которая использует систему проверки орфографии Voikko для фактической проверки орфографии для финского языка.
Tmispell — это прозрачная оболочка для Ispell, другие программы, которые обычно используют Ispell, будут автоматически использовать Tmispell (и, следовательно, Voikko) без каких-либо изменений.

Для получения дополнительной информации посетите эту ссылку: http://manpages.ubuntu.com/manpages/hardy/man1/tmispell.1.html

Я надеюсь, что ваша проблема разрешится.