Существует ли бесплатное программное обеспечение, которое объединяет множество .html
файлов в один?
Он должен быть в Windows и должен удалять только заголовки.
Вы можете использовать Simple File Joiner :
С Cygwin вы можете использовать этот скрипт Bash :
#!/bin/bash
echo "Enter directory path pages:";
read html_path;
echo "Enter complete filename of the starting page:"
read start_page;
ls $html_path > "list.txt";
grep -iv "</body>" "$html_path/$start_page" | grep -iv "</html>" > "$html_path/all_merged.html";
for i in $(< list.txt)
do
grep -iv "<body>" "$html_path/$i" | grep -iv "<html>" | grep -iv "</body>" | grep -iv "</html>" >> "$html_path/all_merged.html"
done
echo "</body></html>" >> "$html_path/all_merged.html"
echo "Merged file ---> $html_path/all_merged.html"
unset html_path;
unset start_page;
unset i;
Я нашел SoftSnow Merger , который поддерживает то, что мне нужно:
Параметр «Удалить верхний/нижний колонтитул» удаляет лишние таблицы стилей, блоки Javascript, теги HEAD и HTML из файлов.
Также VirusTotal не нашел только одно попадание, которое кажется ложным срабатыванием.