Сделать веб-сайт с гиперссылкой из файла EPUB

У меня есть электронная книга в формате EPUB.

Я хочу опубликовать его в Интернете в виде набора взаимосвязанных HTML-страниц (что может быть лучше, чем EPUB, как для онлайн-читателей, так и для поисковых систем).

Какое (бесплатное) программное обеспечение (работающее на сервере Linux или создающее статические HTML-страницы на ПК с Linux) вы можете порекомендовать для создания этого веб-сайта из EPUB?

Я программист и могу что-то написать сам, но предпочитаю готовые и профессиональные программы.

Я не тестировал его для этого, но вы можете взглянуть на Caliber , который может конвертировать все форматы электронных книг. Я использую его наоборот (преобразовывая HTML в EPUB), но он также должен работать для вашей задачи.
@Izzy Caliber создает один большой HTML-файл. Но я хочу страницы с гиперссылками
Ах хорошо. Видите, вот почему я сделал это комментарием, а не ответом :) Не уверен, есть ли варианты, чтобы Калибр создавал несколько файлов (по одному на «главу») и индекс с гиперссылкой, но я думаю, вы это уже проверил.
Недавно я заглянул в ePub и обнаружил, что это папка, содержащая (среди прочего) XHTML с реальным содержимым ( google.nl/search?q=epub+structure ). Возможно, вы уже на полпути к этим знаниям ;-)

Ответы (2)

Я использовал SIGIL для разработки книг epub. Сначала я разработал контент с помощью Pressbooks, а затем экспортировал в формат EPUB. Затем я использую SIGIL для редактирования контента, который будет больше похож на древовидную структуру. Поскольку этот редактор EPUB поможет вам просмотреть основные главы, вы также можете легко редактировать содержимое и ссылки в представлении кода. Он поддерживает EPUB2 и EPUB3.

Вы должны сделать следующие шаги:

  1. Импортируйте файл EPUB в SIGIL
  2. Внесите необходимые изменения, используя представление кода.
  3. Экспорт в HTML

Проверьте ссылку для дополнительной справки.

Pandoc может сделать это за вас с помощью основных параметров, или вы можете выполнить множество настроек с помощью параметров командной строки и шаблонов.

Однако с ограничением на то, что это один большой html-файл или фрагмент. Лично я бы затем использовал скрипт python, чтобы разделить это на несколько html-файлов на уровне <H1>, или, возможно, на более низких уровнях, каждый со ссылками pre/contents/next, создающими оглавление по пути. Для этого я бы, вероятно, использовал BeautifulSoup , так как должно быть достаточно просто изолировать главы, генерировать ссылки и т. д. Главный вопрос заключается в том, хотите ли вы разделить ниже, чем <H1>теги, и если да, поместите ли вы первый подраздел в тот же файл, что и <H1>содержимое.

Я просмотрел pandocсправочную страницу. Кажется, pandocне поддерживает вывод в несколько файлов HTML, чего я и хочу. Он поддерживает вывод только одного большого HTML-файла, чего я не хочу.