Есть ли способ разделить HTML-файл, не теряя при этом все форматирование в каждом сегменте?

Итак … команда split позволяет мне разбивать файл на куски. Проблема с этим заключается в том, что только один из файлов будет содержать заголовки HTML, и только один из них будет содержать нижние колонтитулы HTML.

(это, вероятно, актуально для многих других файлов, содержащих информацию заголовка / нижнего колонтитула)

  • Перечислите дни рождения в том порядке, в котором они придут с сегодняшнего дня
  • Каковы различия между расколом и раном?
  • Как разбить файл на основе списка шаблонов и назвать выходные файлы по шаблону?
  • Регулярное выражение ERE для разделения () между разделителем и конечным словом
  • TAR: лучше пропустить каталог или использовать split
  • Разделить файл на два
  • разделить файл на две части, по шаблону
  • Могу ли я автоматизировать многотомную функцию tar?
  • 2 Solutions collect form web for “Есть ли способ разделить HTML-файл, не теряя при этом все форматирование в каждом сегменте?”

    Большинство инструментов unix, например split , являются агностиками формата файла. Чтобы разделить файлы, которые используют определенный формат (например, HTML), в более мелкие отформатированные файлы, используйте определенные инструменты. Для разбиения HTML htmldoc – это первое, что я нашел в Интернете быстро. Он был упакован (по крайней мере, в debian, ubuntu, fedora, gentoo и т. Д.).

    Не используйте sed -ish трюки, которые вызывают неудобства в файлах, так как это может привести к некорректным последствиям в один прекрасный день.

    Сначала вы можете извлечь и удалить верхний / нижний колонтитул исходного файла, разделить его и добавить выделенный верхний / нижний колонтитул в каждый раскол.

    Вы можете использовать xpath или sed для редактирования исходного файла.

    Например, эта командная строка разделяет нижний колонтитул заголовка файла:

     $ sed -e '0,/<body>/d' -e '/<\/body>/,$d input.html 

    Где sed – это GNU, и предполагается, что тег тела находится на собственной линии.

    Interesting Posts

    Анализ данных журнала и печать обратных ссылок регулярных выражений

    Извлеките путь к каталогу, содержащий файл с соответствующей строкой

    Debian растягивается на thinkpad: отключается от внешнего, черный экран после приостановки

    Передача подстановочного символа * в скрипт (bash?)

    Как изменить фокус в X-окне на терминале

    Btrfs RAID1 несовместимые диски полностью

    Как определить, использует ли плата Linux аппаратное FPU или нет?

    как передать несколько команд в sqlite3 в одной команде оболочки liner

    Является ли он частью любого стандарта (например, POSIX), что системные файлы должны быть более строчными?

    Необходимая модификация скрипта оболочки для отображения IP и хоста DD-WRT

    Использование YUM для пакетов CentALT

    Почему моя смола не работает?

    Что делает команда set speller aspell -x -c в nanorc?

    Сервер RHEL 5 с 8 ядрами. Нагрузка всегда равна 0 или 1. но оперативная память (8 ГБ) всегда занята

    Найдите владельца компьютера в файловой системе

    Linux и Unix - лучшая ОС в мире.