Просмотрщик документов

Кто-нибудь знает какой-нибудь хороший выбор программного обеспечения, которое позволит мне сравнивать документы с набором глифов (карта символов за документами в формате PDF)?

Или, если кто-нибудь знает хорошее программное обеспечение для распознавания текста, которое может читать и сравнивать документы? Он должен работать на Windows, и у меня нет разницы в цене.

" сравните документы ": Что за сравнение?
« сравнить документы с набором глифов »: вы имеете в виду проверку, содержит ли этот документ какие-либо символы из этого набора? Или содержит ли он символы, которых нет в этом наборе? Или что-то другое?

Ответы (1)

Если вы хотите работать с коммерческим OCR SDK, вы можете проверить LEADTOOLS OCR SDK . Вы можете легко распознать документ, написав всего несколько строк кода, см. ниже.

// Initialize the OCR engine
ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, 

// Startup the engine
ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS 19\Bin\Common\OcrAdvantageRuntime");

using (IOcrDocument ocrDocument = ocrEngine.DocumentManager.CreateDocument())
{
 //Load image
 RasterImage image = ocrEngine.RasterCodecsInstance.Load(file, 0, CodecsLoadByteOrder.Rgb, 1, -1);
 //Add pages
 ocrDocument.Pages.AddPages(image, 1, -1, null);

 //Recognize Page
 ocrDocument.Pages.Recognize(null);

 //Save Output 
 ocrDocument.Save(outPut, Leadtools.Forms.DocumentWriters.DocumentFormat.Text, null);
}

Вы также можете найти интерактивную демонстрацию OCR HTML5/JavaScript , если хотите протестировать ее на своем файле. Этот SDK будет работать на Windows, Linux, Mac, Android, WinRT и iOS.

Отказ от ответственности: я являюсь сотрудником этого продукта

У вас есть контактная электронная почта?
Да, конечно, свяжитесь с нами по адресу support@leadtools.com, если у вас возникнут вопросы.