Распознавание рукописного ввода

Для Интернета или Mac OS/X

Мне нужно взять табличные данные из рукописной бумажной формы и преобразовать их в цифровые данные в удобном формате, таком как CSV. В настоящее время я думаю о том, чтобы создать файл изображения формы и запустить его через программу OCR. Бонусные баллы, если это бесплатно и онлайн или автоматизируется, скажем, с интерфейсом API, в идеале.

Есть ли что-нибудь подобное? Может проект с открытым исходным кодом?

Нет хорошего распознавания рукописного текста с изображений . Известные сервисы, такие как Google OCR или OCR.space , с этим не справляются. Что действительно существует, так это решения для рукописного ввода, такие как webdemo.myscript.com, но они требуют полной последовательности штрихов в качестве ввода, а не только изображения.

Ответы (2)

Распознавание рукописного ввода является сложной проблемой, как общая проблема. Однако вы упоминаете формы, в этом случае вспомогательное распознавание может быть возможно, если форма состоит из символьных полей в группах с ограниченными возможными допустимыми входными данными. Под помощью я имею в виду каждый раз, когда он не уверен, что появляется изображение этого раздела для ручного ввода.

Вы можете разработать такую ​​систему с помощью OpenCV , как показано в блоге pyImageSearch , возможно, путем обучения экспертной системы. Вы вряд ли найдете тот, который уже написан.

Я бы посоветовал взглянуть на Microsoft Computer Vision API, особенно на рукописную часть OCR. Их документы в настоящее время гласят: «Примечание: эта технология в настоящее время находится в предварительной версии и доступна только для английского текста».

Я получил впечатляющие результаты, когда попробовал это. Вы можете протестировать его, не устанавливая ничего, просто загрузите образец изображения по адресу https://azure.microsoft.com/en-us/services/cognitive-services/computer-vision/ (прокрутите страницу вниз, чтобы найти «Предварительный просмотр: Чтение рукописного текста с изображений")

Пример кода показывает, как использовать это из python и других языков:

https://docs.microsoft.com/en-us/azure/cognitive-services/computer-vision/quickstarts/python#RecognizeText