Преобразование многих сохраненных веб-страниц в PDF

У меня есть много сохраненных веб-страниц (.html, .htm), я хотел бы преобразовать их все в файлы PDF (1 веб-страница в 1 PDF, без объединения) одновременно.

Какой инструмент вы бы порекомендовали? Я хотел бы создавать файлы PDF с текстом, а не с растровым изображением, чтобы я мог искать в файле PDF и копировать из него текст. Я также хочу, чтобы PDF-файл имел то же имя файла, что и файл HTML (конечно, только с другим расширением).

Для какой операционной системы?
Хорошо, Windows 7 64bit.

Ответы (3)

Хотя и с другим фоном, я использую для этого PrinceXML . Преобразование так же просто, как вызов prince file.html, что приводит к тому, file.pdfчто вы указали в своем вопросе. Тонкая настройка, конечно, возможна: через CSS и с использованием параметров командной строки.

PrinceXML бесплатен для личного некоммерческого использования.

Это странно. Кажется, я могу экспортировать веб-сайт с URL-адреса, но не с сохраненных веб-страниц в формате html. Я получаю много ошибок, например. имя атрибута ошибки синтаксического анализа.
Я использую его для сложных локальных страниц (мои книги) и не могу вспомнить такую ​​ошибку. Являются ли эти сохраненные страницы синтаксически правильными? Если у вас проблемы: ценовая поддержка довольно хороша, просто загляните на их форумы.

Я просмотрел wkhtml2pdf для преобразования веб-страницы в PDF. Он бесплатный и с открытым исходным кодом, работает на Windows, OS X и Linux. Между параметрами оболочки и командной строки он будет делать почти все с файлами и именами, которые вам нужны. Файлы PDF являются текстовыми, но вам обязательно понадобится поисковая система, которая понимает форматы PDF, чтобы правильно их искать.

Используйте PDF Creator для преобразования страниц из любого приложения в PDF-файлы. После установки PDF Creator вы должны использовать команду печати, а затем выбрать PDF Creator из списка принтеров.
Это преобразует страницы из любого приложения в PDF, которые поддерживают печать страниц.

Для сохраненных веб-страниц: просто снова откройте их в браузере и распечатайте.