Кто-нибудь знает какой-нибудь хороший выбор программного обеспечения, которое позволит мне сравнивать документы с набором глифов (карта символов за документами в формате PDF)?
Или, если кто-нибудь знает хорошее программное обеспечение для распознавания текста, которое может читать и сравнивать документы? Он должен работать на Windows, и у меня нет разницы в цене.
Если вы хотите работать с коммерческим OCR SDK, вы можете проверить LEADTOOLS OCR SDK . Вы можете легко распознать документ, написав всего несколько строк кода, см. ниже.
// Initialize the OCR engine
ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage,
// Startup the engine
ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime");
using (IOcrDocument ocrDocument = ocrEngine.DocumentManager.CreateDocument())
{
//Load image
RasterImage image = ocrEngine.RasterCodecsInstance.Load(file, 0, CodecsLoadByteOrder.Rgb, 1, -1);
//Add pages
ocrDocument.Pages.AddPages(image, 1, -1, null);
//Recognize Page
ocrDocument.Pages.Recognize(null);
//Save Output
ocrDocument.Save(outPut, Leadtools.Forms.DocumentWriters.DocumentFormat.Text, null);
}
Вы также можете найти интерактивную демонстрацию OCR HTML5/JavaScript , если хотите протестировать ее на своем файле. Этот SDK будет работать на Windows, Linux, Mac, Android, WinRT и iOS.
Отказ от ответственности: я являюсь сотрудником этого продукта
Николя Рауль
Николя Рауль