Более быстрая альтернатива PDFcrop

Фон

В настоящее время я использую PDFcrop для обрезки ненужных полей многостраничного PDF-файла, созданного с помощью средства печати в PDF на моем ноутбуке.

Проблема в том, что PDFcrop работает очень медленно. Для 15-страничного документа мне требуется 17 минут для обработки с использованием следующего синтаксиса.

pdfcrop --margins "-1 0 -1 -2" Raw.pdf Cropped.pdf &> /dev/null

Излишне говорить, что это неприемлемо в свете того факта, что я буду выполнять аналогичную процедуру с PDF-файлами, созданными точно таким же образом, которые будут иметь длину более 150 страниц. Мне не нравится мысль о том, чтобы оставить мой компьютер включенным и без присмотра на ночь.

Вместо этого я подумал об использовании PDFjam для обрезки страниц, но это не работает должным образом. Я использовал следующую команду, и она безуспешно обрезала одну страницу из моего PDF.

pdfjam --keepinfo --trim "54 82 60 54" --clip true --suffix "cropped" page1.pdf

Как показано в приведенной выше команде, нежелательное «поле» вокруг каждой страницы составляет 54 пикселя слева и сверху, 60 пикселей справа и 82 пикселя снизу. Если вместо этого выразить в миллиметрах, это будет равно 19 мм 28,9 мм 21,2 мм 19 мм.

Запрос

Есть ли способ заставить PDFcrop не пытаться вычислить нежелательное пустое пространство (которое мои настройки уточняют до желаемого эффекта обрезки), поскольку поля, которые должны быть удалены на каждой странице, идентичны? Или способ заставить PDFjam правильно обрезать поля, не обрезая содержимое (мои упражнения в этом отношении приводят к тому, что определенные поля не удаляются)?

Я не могу распаковать и сжать рассматриваемый PDF-файл, чтобы отредактировать его в текстовом редакторе, так как это блокирует мой компьютер (и ручное редактирование нескольких страниц в любом случае является проблемой, даже если мой компьютер не блокировался в ответ на загрузку даже несжатого PDF-файла в виде текстового файла), поэтому ручное редактирование полей для меня невозможно.

Примечание. Спросил в Stack Overflow, и мне также сказали спросить здесь. Исходный пост (его копию) можно найти по следующей ссылке: https://stackoverflow.com/questions/34935258/quicker-alternative-to-pdfcrop .

  • Операционная система: Linux (XUbuntu 13.10)
  • Бюджет: ноль (с использованием бесплатных приложений, следовательно, pdfcrop и pdfjam и ничего с использованием официального Adobe)
  • Набор функций: использование командной строки, поскольку я использую рассматриваемую команду в рамках сценария bash для сборки и оптимизации многостраничного PDF.
На данный момент я полностью пропускаю фазу PDFcrop, чтобы получить черновики живого документа, поскольку я записываю его в удобочитаемую форму. Время от времени я повторно ввожу эту фазу и сижу больше часа... есть ли кто-нибудь, кто знает способ более эффективно удалить фиксированное количество пробелов?
Если вы можете написать программу самостоятельно, вы, вероятно, можете реализовать это с помощью itext на Java, вероятно, будет достаточно поиграть со страницей MediaBox и / или TrimBox, и поскольку вы не будете анализировать содержимое страницы и остальную часть файловой структуры останется прежним, он должен работать быстро.

Ответы (1)

Похоже, вам определенно стоит заглянуть в Coherent PDF , кросс-платформенную утилиту для работы с PDF из командной строки с открытым исходным кодом. Это позволяет, например:

  • Объединяйте PDF-файлы вместе или разделяйте их на части
  • Шифровать и расшифровывать
  • Масштабирование, обрезка и поворот страниц
  • Чтение и установка информации о документе и метаданных
  • Копировать, добавлять или удалять закладки
  • Штамп логотипы, текст, даты, номера страниц
  • Добавить или удалить вложения
  • Сжатие PDF-файлов без потерь
Если вы также принимаете программы с графическим интерфейсом, а не только программы CLI, то в разделе «БЕСПЛАТНОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ PDF» на сайте willus.com/k2pdfopt/pdf_conversion.shtml есть несколько отличных указателей.
K2pdfopt можно использовать из командной строки, он отлично подходит для обрезки (обрезки) и быстрого
К вашему сведению, еще одним быстрым и интуитивно понятным графическим интерфейсом является PDF-Shuffler .