библиотека или программа для преобразования файлов ppt/pptx в файлы odt

У меня есть файлы ppt/pptx, которые я хочу преобразовать в текстовый формат, такой как odt или LaTeX, для печати.

Печать файлов ppt/pptx возможна, но не идеальна, так как слайды занимают много места (требуется больше бумаги), даже если я печатаю по два слайда на каждом листе, это также требует больше чернил, поскольку шрифт крупный, а большинство слайдов имеют стиль. В прошлом я использовал представление схемы LibreOffice, чтобы показать презентацию в виде текстового документа, а затем скопировать содержимое в новый файл odt и немного изменить стиль, недостатком является то, что это требует много работы, так как мне нужно настроить стиль а также копировать изображения вручную, более того, некоторые слайды даже не отображаются в виде схемы LibreOffice, поэтому мне приходится копировать текст со слайда напрямую (что занимает немного времени). моя идея преобразования состоит в том, чтобы перевернуть этот слайд, например (щелкните изображение, чтобы увеличить его):

горка

к этому в писателе libreoffice:

писатель libreoffice

Вы можете видеть, что он занимает намного меньше места (менее 1/4 страницы) и, вероятно, потребляет меньше тонера, а также тот факт, что документ теперь легче читать на бумаге.

Так есть ли инструмент, который делает это преобразование автоматически? Я на Linux, но если решение только для Windows, я могу попробовать запустить его через вино.

Библиотека Python, которая анализирует файлы pptx и дает объект, также будет полезна, поскольку я могу написать скрипт для легкого выполнения необходимых мне преобразований.

Ответы (1)

  1. Откройте файл PPT/PPTX в LibreOffice Impress.
  2. Экспортируйте его в HTML.
  3. При желании импортируйте HTML в LibreOffice Writer.

Вы также можете выполнять преобразования из командной строки, используя безголовый LibreOffice, командная строка должна выглядеть примерно так:

soffice --headless --convert-to html input.ppt

Бесплатно, с открытым исходным кодом.

Хорошо, никогда не думал об использовании HTML в качестве промежуточного шага. опубликованная вами команда не сработала, так как «выход» не является правильным фильтром, я думаю, что удаление его и запуск команды действительно приводит к HTML-файлу, но без изображений, экспорт из графического интерфейса LibreOffice также создает HTML-файлы только с текстом, только при экспорте в XHTML я получаю изображения и текст, но файл HTML выглядит плохо отформатированным