Ищете библиотеку OCR для интеграции в веб-приложение PHP/JS/HTML5. PHP предпочтительнее , однако любой язык можно заставить работать exec
, поэтому, если вариант, отличный от PHP, быстрее или качественнее, я хотел бы услышать об этом.
Требования:
Для этого есть библиотека: TesseractOCR для PHP
https://github.com/thiagoalessio/tesseract-ocr-for-php
Использование Tesseract под капотом, который, вероятно, является лучшей библиотекой OCR с открытым исходным кодом.
Он с открытым исходным кодом и кроссплатформенный.
Нет веб-сервиса, все делается на вашем сервере.
Вы можете попробовать этот класс PHP OCR с открытым исходным кодом , который может распознавать текст в монохромных графических изображениях после этапа обучения.
Он написан на чистом PHP, поэтому является кроссплатформенным, не зависит ни от внешних программ, ни от веб-сервисов.
Он поставляется с примерами сценариев для изучения и распознавания текста. Фаза обучения состоит в передаче ему образцов изображений с текстом с заданным текстом, написанным на нем, чтобы позже класс мог распознать текст сам. Разумный набор образцов изображений обеспечивает хорошее начальное обучение,