Инструмент для преобразования онлайн-документации HTML в EPUB из командной строки.

Question

Инструмент для преобразования онлайн-документации HTML в EPUB из командной строки.

ОСХ
epub
HTML
Софт
конвертер документов

ррааллвв

У меня есть куча взаимосвязанных веб-страниц HTML, которые я хочу преобразовать в формат EPUB.

Например, индексная страница находится по адресу

http://example.com/documentation/index/index.html

В то время как главы, связанные со страницами указателя, находятся в

http://example.com/documentation/chapters/*

Также некоторые изображения и файлы форматирования находятся в

http://example.com/css/*
http://example.com/img/*

Есть ли инструмент для загрузки и рекурсивного преобразования документации с учетом этих конкретных ограничений в формат epub?

Я могу загрузить страницы с помощью httrack следующим образом:

httrack http://example.com/documentation/index/index.html +http://example.com/documentation/index/* +http://example.com/documentation/chapters/* +http://example.com/css/* +http://example.com/img/*

… и преобразовать HTML-страницы в XHTML с помощью tidy-html5

tidy -asxhtml -numeric < index.html > index.xhml

но я до сих пор не нашел инструмента для конвертации всего дерева в EPUB сразу.

Кроме того, однажды попробовал Caliber, но пользовательский интерфейс недружелюбен, поэтому я действительно не пытался понять этот инструмент. Если мне нужно изучить пользовательский интерфейс Caliber, я предпочитаю писать сценарий bash для выполнения этой работы.

Иззи

Calibre также имеет интерфейс командной строки. Я вообще редко пользуюсь графическим интерфейсом. См. здесь параметры ebook-convertCLI . И да, в моем случае обычно эту работу выполняет сценарий Bash: я использую скелет с «заполнителями» (переменными) для деталей источника :)

Ответы (1)

Инструмент для преобразования онлайн-документации HTML в EPUB из командной строки.

Calibre также имеет интерфейс командной строки. Я вообще редко пользуюсь графическим интерфейсом. См. здесь параметры ebook-convertCLI . И да, в моем случае обычно эту работу выполняет сценарий Bash: я использую скелет с «заполнителями» (переменными) для деталей источника :)

Стив Барнс · Answer 1

Хотя это не всегда дает идеальные результаты, вы можете использовать pandoc для загрузки html из Интернета и создания epub за один раз - вам может потребоваться указать pandoc порядок страниц/глав и/или какие страницы, но любые ссылки на css/изображения должны также загружаться и внедряться автоматически.

Командная строка — да
Загружается прямо из Интернета - Да
Создать электронный паб - Да и многое другое
Бесплатно, бесплатно и с открытым исходным кодом
Кроссплатформенность, включая OS-X

Инструмент для преобразования онлайн-документации HTML в EPUB из командной строки.

ррааллвв

Иззи

Ответы (1)

Стив Барнс

Сделать веб-сайт с гиперссылкой из файла EPUB

Инструмент с открытым исходным кодом для создания файлов EPUB

Программное обеспечение для преобразования формата HOCR в txt?

Инструмент для преобразования между различными форматами обычного текста

Инструмент для конвертации HTML4 в HTML5+CSS

Эквивалент MkDocs, написанный на Perl, для преобразования деревьев Markdown или POD в HTML с индексом в каждом файле.

Инструмент для сохранения веб-страниц в формате XML

Программное обеспечение для преобразования файлов MHT (MHTML) в независимый от браузера и платформы однофайловый формат файла

Конвертер веб-страницы в PDF

OSX бесплатное программное обеспечение для создания epub3