Конвертер PDF в LaTeX

Я ищу бесплатное программное обеспечение, которое конвертирует PDF в файл LaTeX.

На самом деле мне не нужно конвертировать весь PDF, мне просто нужно «извлечь» формулы и использовать их для создания собственного файла LaTeX.

Ответы (2)

Вы можете использовать InftyReader :

  • свободно
  • генерировать LaTeX из изображений математических формул (исходные файлы изображений должны быть в форматах TIF, PNG или GIF)
  • далек от совершенства в плане точности, но лучше не знаю.

Другие идеи .

Я надеялся, что есть что-то более полное. К счастью, 5 страниц в день для меня все еще хороший предел :-), спасибо

Вы можете использовать im2markup для преобразования изображений математических уравнений в математические уравнения LaTeX:

  • Дэн, Юнтян, Ансси Канервисто и Александр М. Раш. «Что вы получаете, это то, что вы видите: декомпилятор визуальной разметки». Препринт arXiv arXiv: 1609.04938 (2016). https://arxiv.org/abs/1609.04938
  • с открытым исходным кодом: на основе ANN, Torch7

Основываясь на последних достижениях в создании подписей к изображениям и оптическом распознавании символов (OCR), мы представляем универсальную систему, основанную на глубоком обучении, для декомпиляции изображения в презентационную разметку. Хотя эта задача является хорошо изученной проблемой OCR, наш метод использует совершенно другой подход, основанный на данных. Наша модель не требует знания базового языка разметки и просто полностью обучается на реальных примерах данных. В модели используется сверточная сеть для распознавания текста и макета в тандеме с нейронной системой машинного перевода, основанной на внимании. Для обучения и оценки модели мы вводим новый набор данных реальных математических выражений в сочетании с разметкой LaTeX, а также синтетический набор данных веб-страниц в сочетании с фрагментами HTML. Экспериментальные результаты показывают, что система на удивление эффективно генерирует точную разметку для обоих наборов данных. В то время как стандартная система OCR LaTeX для конкретной области обеспечивает точность около 25%, наша модель воспроизводит точное визуализированное изображение в 75% примеров.

введите описание изображения здесь