Преобразователь изображения в текст

У меня есть эта книга, полная математических уравнений. Мне нужен способ взять изображение частей книги и преобразовать его в документ Word с математическими уравнениями в них. Теперь, если такое программное обеспечение не было разработано для обработки математических уравнений в Word, то оно должно по крайней мере встраивать математические уравнения в виде изображений в документ Word.

Существует ли такое бесплатное программное обеспечение? Идеально для Windows, но я рассмотрю и Linux (пожалуйста, не Mac).

Да, но это действительно ужасно. Tessact code.google.com/p/tesseract-ocr и gocr jocr.sourceforge.net После использования этих продуктов вы будете умолять Nuance взять ваши деньги, чтобы остановить боль.
makeuseof.com/tag/… Вы можете попробовать их, но когда я использовал их в прошлом, я возвращался к Omnipage так быстро, как только мог.

Ответы (2)

Существует целая область программного обеспечения, называемая OCR или оптическим распознаванием символов. Omnipage Regular или Pro от Nuance всегда хорошо работали для меня. Обычно он справляется со всем, что я ему бросаю. Если распознавание плохое, используйте более высокий DPI при сканировании, я обычно использую 600, но для крошечных шрифтов я использую 1200 dpi.

Omnipage стоит денег, но вы получаете то, за что платите.

За эти годы я попробовал много других пакетов и обнаружил, что их не хватает. Я уверен, что они были улучшены за эти годы, так что они могли бы быть лучше сейчас.

Извините, но я забыл добавить, я ищу бесплатное программное обеспечение...
code.google.com/p/tesseract-ocr Бесплатно, но будет темпераментно. Удачи вам в попытках обучить его на разных шрифтах, я так и не смог разобраться, или это было так больно, что я блокирую этот опыт из памяти.

Программное обеспечение OCR может сделать это за вас. Вы можете найти программное обеспечение для распознавания текста в Google Play. Здесь я хочу порекомендовать вам Docs Matter. Раньше я использовал Docs Matter только для управления бумажным документом.

Его основная функция заключается в сканировании документа или изображений, которые у вас есть, и использовании встроенного механизма OCR для извлечения текста из документа после сканирования. Вы можете изменить и сохранить результаты распознавания после того, как модуль OCR закончит свою работу.

Среднее время распознавания документа менее 6 секунд. Точность распознавания может достигать 99%. Он может конвертировать документы в файлы форматов PDF, Word, Text.

Я думаю, вы можете попробовать. Вы можете найти Docs Matter в Google Play.