Преобразователь HTML в PDF (рендерер)

Для документирования мне нужно приложение или плагин, предназначенный для создания PDF-файлов из веб-страниц и выходящий за рамки элементарных функций, предоставляемых обычными браузерами.

Обязательные к приобретению

  • выбор нескольких подстраниц
  • согласованность внутренних ссылок документа
  • стилизованный верхний/нижний колонтитул
  • настраиваемый масштаб документа и границы страницы
  • подавление выбранных частей сайта (заголовок, навигация, боковые панели), особенно для страниц, которые не предоставляют таблицы стилей принтера

Приятно иметь

  • настраиваемые вставки разрывов страниц
  • таблица генерации контента
  • замена шрифта
  • управление потоком текста
  • многоколоночное перераспределение
  • генерация свойств документа (метаданные)
Похоже, вы пытаетесь автоматизировать (?) макет на основе экрана в макет в стиле документа - всегда нетривиальная вещь. Думали ли вы пойти другим путем PDF -> HTML или даже просто создавать PDF-файлы из той же информации, но не пытаться конвертировать произвольно сложные HTML-страницы?
В тех случаях, когда вы контролируете представленный контент, на самом деле более целесообразно следовать принципу единого источника. Если вы являетесь внешним потребителем данного артефакта, усилия зависят от вашего варианта использования.

Ответы (2)

Для создания выходных PDF-файлов веб-страниц я вижу ценное решение с использованием браузера Mozilla Firefox вместе с плагинами ScrapBook и Print pages to PDF :

введите описание изображения здесь

Плагин Scrapbookвыполняет захват страниц в боковую панель браузера (выбирая команду в контекстном меню окна браузера или используя параметры Сохранить в меню ScrapBook). Также есть возможность установить собственные сочетания клавиш для многих команд.

После того, как страницы сохранены и отображены на боковой панели, если вы ищете быстрые результаты, щелкните правой кнопкой мыши имя страницы и выберите ее печать:

введите описание изображения здесь

введите описание изображения здесь

Мы легко видим, что у нас все хорошо table of contentи все internal (and external) linksработает гладко!

Глядя в свойства документа, я не вижу ничего особенного, только Заголовок и Производитель. (Я не нашел способа добавить пользовательские метаданные в pdf).

введите описание изображения здесь

Давайте создадим еще один PDF-файл, но на этот раз мы пойдем по длинному пути:

введите описание изображения здесь

введите описание изображения здесь

Как видите, есть возможность выбрать глубину ссылки. Используя первый углубленный уровень, у вас будет возможность загрузить 121 главную страницу StackExchange:

введите описание изображения здесь

У вас есть возможность даже создать PDF-файл со всеми 121 веб-страницей или с выбором закладок на боковой панели, так что selection of multiple sub-pagesэто также выполняется.

Глядя на Print pages to PDFсвойства плагина, можно увидеть несколько вариантов форматирования вывода (поля, размер страницы), контур по заголовкам, настраиваемые верхние и нижние колонтитулы для всего pdf или отдельно для отдельных веб-страниц в pdf.

Одна из наиболее полезных функций Scrapbookплагина дает возможность изменять DOM путем удаления дочерних элементов перед сохранением изменений и преобразованием в pdf. Кроме того, вы можете выделить текст или даже свободно разместить аннотации внутри веб-страницы:

введите описание изображения здесь

Это выглядит многообещающе. Я проверю это и уже могу сказать: это тот ответ, который поднимет это сообщество до высокого уровня качества. Благодарю вас!
21.07.18 оказалось, что ссылка для скачивания не работает и может больше не поддерживаться более новой версией firefox.

Я использую Bullzip PDF Printer , в то время как я использовал его только с Microsoft Word, как вы его используете, так это то, что вы используете функцию печати с приложением, и вы выбираете новый принтер, который успокаивает после установки Bullzip, когда вы печатаете, он спросит куда сохранить пдф

я не уверен, насколько он соответствует тому, что вы должны иметь в списке, поскольку я использую его только для преобразования документов Microsoft Word в .pdf, но он также устанавливает отдельное приложение, которое вы можете использовать для настройки принтера, но, на мой взгляд, это по сути, обычный принтер, который выводит цифровой файл, а не убивает дерево.