Бесплатный инструмент сравнения PDF

Я ищу приложение для сравнения двух файлов PDF.

Приложение должно:

  • быть в состоянии выделить различия между двумя документами
  • быть совместимым с Mac, так как я буду использовать его на Mac
  • быть свободным, я не хочу тратить деньги

В основном я буду использовать это для сравнения новых версий лицензионных соглашений (поскольку мне лень читать документ на 40+ страниц каждый раз, когда вносятся незначительные изменения)

Приложение не обязательно должно быть из App Store, и при этом оно не должно быть официальным, все, что мне нужно, это чтобы оно очень хорошо делало то, для чего оно предназначено (сравните PDF-файлы).

Я не буду использовать это приложение очень часто и приму его в любом из следующих форматов:

  • Приложение магазина приложений для Mac
  • Java-приложение
  • Веб-приложение
  • Файл AppleScript (мне нужно будет увидеть исходный код)
  • Рабочий процесс автоматизатора
  • в основном все, что будет работать на Mac OS X Yosemite (не бета-версия) и эффективно выполнять намеченную задачу
Думали ли вы преобразовать PDF-файлы в обычный текст и использовать diff?
Diff — это стандартный инструмент командной строки Unix (см. en.wikipedia.org/wiki/Diff_utility ), и, поскольку Mac OS основана на Unix, я почти уверен, что он уже установлен на вашем компьютере. Варианты графического интерфейса см. на странице apple.stackexchange.com/questions/3653/…
... или посмотреть здесь git-tower.com/blog/diff-tools-mac
Я пробовал многие из этих вариантов, включая файловое слияние Apple, которое мне очень нравится, однако оно требует, чтобы файлы PDF были в формате ASCII ... знаете ли вы какие-нибудь хорошие конвертеры PDF-to-ASCII?

Ответы (6)

Вы можете использовать DiffNow :

  • это бесплатно
  • инструмент сравнения веб-приложений
  • работает через вставку текста; загрузка файлов; используя URL-адреса

Единственным ограничением является то, что файлы должны быть < 2048 КБ.

Образец на их сайте ( первый pdf против второго pdf ):

Пользовательский интерфейс DiffNow

Значит, он поддерживает PDF-файлы, отличные от ASCII?
да - вы можете использовать обычные файлы PDF
Это просто веб-приложение или загружаемое приложение?
Веб-приложение только afaik
конечный факт: похоже, что этот инструмент работает на prestosoft.com/edp_examdiffpro.asp?ref=diffreport , на котором есть ссылки для скачивания .

DiffPDF в настоящее время является платным программным обеспечением только для Windows, но ранее оно было бесплатным, а также доступно для OS X. Вы все еще можете скачать такую ​​предыдущую версию .

Это позволяет как визуальное, так и текстовое сравнение.

Скриншот взят с Lifehacker.com

Спасибо за это! Он работает нормально, но, кажется, сравнивает только страницу за страницей, поэтому, если вы добавите страницу в начале документа, сравнение будет бесполезным.
Хм, кажется, эта версия только частично работает на MacOS Mojave, она подчеркивает различия, но в остальном показывает мне только пустую страницу. Поиск продолжается, я полагаю
Для «визуального» сравнения хорошо подходит parepdf.com .

compare(команда от ImageMagick)

Если вы хотите сравнить внешний вид страницы 4 a.pdfсо страницей 6 b.pdf, вы можете использовать инструмент командной строки ImageMagick compare. Вот вариант команд, которые можно попробовать:

compare              a.pdf[3] b.pdf[5]              delta1.pdf
compare -density 300 a.pdf[3] b.pdf[5]              delta2.pdf
compare              a.pdf[3] b.pdf[5] -compose src delta3.pdf
compare              a.pdf[3] b.pdf[5] -fuzz 5%     delta4.pdf

(Подсчет кадров/страниц в ImageMagick начинается с нуля, поэтому " [3]" означает "страница 4"...) Это создаст "дельта" документы, где каждый пиксель, отличающийся между страницами, окрашен в красный цвет:

  1. Первый вариант сохраняет бледную версию a.pdfв качестве фонового изображения на странице.
  2. Второй вариант использует разрешение 300 PPI(вместо значения по умолчанию 72 PPI).
  3. Третий вариант создает только бело-красную дельту (без бледного фона).
  4. Четвертый вариант помечает как красный только те пиксели, которые имеют цветовую разницу более 5%.

Следует отметить, что сравнение работает только в том случае, если соответствующие размеры страниц для сравниваемых файлов полностью идентичны.

diffpdf(приложение с графическим интерфейсом)

DiffPDFэто приложение с графическим интерфейсом, которое может обрабатывать 2 или 3 ввода PDF и показывать различия:

  1. Существует режим, который сравнивает только текстовое содержимое, выделяя различия между словами и символами.
  2. Есть еще один режим, который сравнивает визуальные различия и выделяет их.

Домашняя страница предлагает только платную версию Windows, но более ранние версии были бесплатными. Вы можете получить исходный код, например , из Debian , он включает инструкции по компиляции для OS X.

При сравнении PDF-файлов у вас есть выбор между:

  • сравнение содержимого (т.е. фактического текста)
  • сравнение страниц в целом (визуальное сравнение).

Пока вы, возможно, ищете первый тип сравнения, я хотел предложить способ сравнения двух PDF-файлов постранично.

Поскольку в прошлом у меня регулярно возникало это требование, и я не мог найти необходимое программное обеспечение для выполнения сравнения, я написал свое собственное и разместил его на GitHub. Он называется pyPdfCompare и доступен бесплатно.

Он отлично работает на OS X и Windows, но требует установки Python 3, Ghostscript и ImageMagick. Кроме того, вам нужно будет выполнить pip installдля библиотек, которые он использует.

Это может быть слишком технично и/или не совсем то, что вы искали, но я все равно хотел предложить этот вариант для полноты картины.

В вашем случае сравнение текста и отбрасывание всех элементов форматирования и нетекстовых элементов будет работать хорошо. Вы можете запустить pdftotextутилиту для каждого файла, а затем инструмент сравнения текста для результата. В OS X вы можете установить pdftotextиз различных каналов распространения бесплатного программного обеспечения, таких как Brew или MacPorts, это часть popplerпакета.

pdfdiff.pyСценарий Cas Cremers автоматизирует запуск pdftotext(который необходимо установить отдельно) и средства просмотра различий (то же самое).

Результат аналогичен DiffNow , процитированному ᔕᖺᘎᕊ , я думаю, что они используют pdftotextвнутренне и подключают вывод в текстовое веб-приложение diff.

Я полагаю, что мне следует добавить еще одну опцию, которая не обязательно является инструментом или функцией, а скорее уловкой для сравнения небольших PDF-файлов (обычно это отдельные страницы, такие как резюме).

Если ваша операционная система делает окна полупрозрачными при перетаскивании, вы можете открыть оба PDF-файла в приложении для просмотра PDF-файлов, а затем перетащить одно окно PDF-файла поверх другого, не отпуская его. Это позволит вам видеть сквозь первое полупрозрачное окно другое окно PDF под ним. Если они правильно выровнены друг с другом, различия могут стать очевидными.

Я часто использовал это как быстрое и грязное визуальное сравнение, чтобы проверить, имеют ли два одностраничных PDF-файла одинаковое содержимое, но, поскольку для этого не требуется программное обеспечение, оно должно работать на любой ОС, которая имеет этот полупрозрачный эффект при перемещении окон.