У меня есть много сохраненных веб-страниц (.html, .htm), я хотел бы преобразовать их все в файлы PDF (1 веб-страница в 1 PDF, без объединения) одновременно.
Какой инструмент вы бы порекомендовали? Я хотел бы создавать файлы PDF с текстом, а не с растровым изображением, чтобы я мог искать в файле PDF и копировать из него текст. Я также хочу, чтобы PDF-файл имел то же имя файла, что и файл HTML (конечно, только с другим расширением).
Хотя и с другим фоном, я использую для этого PrinceXML . Преобразование так же просто, как вызов prince file.html
, что приводит к тому, file.pdf
что вы указали в своем вопросе. Тонкая настройка, конечно, возможна: через CSS и с использованием параметров командной строки.
PrinceXML бесплатен для личного некоммерческого использования.
Я просмотрел wkhtml2pdf для преобразования веб-страницы в PDF. Он бесплатный и с открытым исходным кодом, работает на Windows, OS X и Linux. Между параметрами оболочки и командной строки он будет делать почти все с файлами и именами, которые вам нужны. Файлы PDF являются текстовыми, но вам обязательно понадобится поисковая система, которая понимает форматы PDF, чтобы правильно их искать.
Используйте PDF Creator для преобразования страниц из любого приложения в PDF-файлы. После установки PDF Creator вы должны использовать команду печати, а затем выбрать PDF Creator из списка принтеров.
Это преобразует страницы из любого приложения в PDF, которые поддерживают печать страниц.
Для сохраненных веб-страниц: просто снова откройте их в браузере и распечатайте.
ненор
рлукс