Библиотека оптического распознавания символов PHP

Ищете библиотеку OCR для интеграции в веб-приложение PHP/JS/HTML5. PHP предпочтительнее , однако любой язык можно заставить работать exec, поэтому, если вариант, отличный от PHP, быстрее или качественнее, я хотел бы услышать об этом.

Требования:

  • «достаточно» хорошее качество оптического распознавания символов.
  • относительно быстрое преобразование (и вот еще одно требование, мягко говоря, слегка субъективное).
  • Открытый исходный код или зрелый и хорошо документированный API.
  • Кросс-платформа.
  • Не может быть веб-сервисом, даже если у него отличный API (из-за использования веб-приложения в конфиденциальных ситуациях и в сетях ethernet, для которых не гарантируется активное подключение к Интернету.

Ответы (2)

Для этого есть библиотека: TesseractOCR для PHP

https://github.com/thiagoalessio/tesseract-ocr-for-php

Использование Tesseract под капотом, который, вероятно, является лучшей библиотекой OCR с открытым исходным кодом.

Он с открытым исходным кодом и кроссплатформенный.
Нет веб-сервиса, все делается на вашем сервере.

Вы можете попробовать этот класс PHP OCR с открытым исходным кодом , который может распознавать текст в монохромных графических изображениях после этапа обучения.

Он написан на чистом PHP, поэтому является кроссплатформенным, не зависит ни от внешних программ, ни от веб-сервисов.

Он поставляется с примерами сценариев для изучения и распознавания текста. Фаза обучения состоит в передаче ему образцов изображений с текстом с заданным текстом, написанным на нем, чтобы позже класс мог распознать текст сам. Разумный набор образцов изображений обеспечивает хорошее начальное обучение,