Есть ли способ разделить HTML-файл, не теряя при этом все форматирование в каждом сегменте?

Итак … команда split позволяет мне разбивать файл на куски. Проблема с этим заключается в том, что только один из файлов будет содержать заголовки HTML, и только один из них будет содержать нижние колонтитулы HTML.

(это, вероятно, актуально для многих других файлов, содержащих информацию заголовка / нижнего колонтитула)

  • Разделить входной файл на X частей общего количества строк / X
  • Регулярное выражение ERE для разделения () между разделителем и конечным словом
  • Указание высоты для вертикальных расщеплений в vim
  • Могу ли я автоматизировать многотомную функцию tar?
  • Каковы различия между расколом и раном?
  • разбиение массива и отправка значений в hashset в awk
  • Разделить разделенный запятыми список, игнорирующий запятые в соответствии с {}
  • Как преобразовать файл TTA и его лист CUE в несколько файлов FLAC?
  • 2 Solutions collect form web for “Есть ли способ разделить HTML-файл, не теряя при этом все форматирование в каждом сегменте?”

    Большинство инструментов unix, например split , являются агностиками формата файла. Чтобы разделить файлы, которые используют определенный формат (например, HTML), в более мелкие отформатированные файлы, используйте определенные инструменты. Для разбиения HTML htmldoc – это первое, что я нашел в Интернете быстро. Он был упакован (по крайней мере, в debian, ubuntu, fedora, gentoo и т. Д.).

    Не используйте sed -ish трюки, которые вызывают неудобства в файлах, так как это может привести к некорректным последствиям в один прекрасный день.

    Сначала вы можете извлечь и удалить верхний / нижний колонтитул исходного файла, разделить его и добавить выделенный верхний / нижний колонтитул в каждый раскол.

    Вы можете использовать xpath или sed для редактирования исходного файла.

    Например, эта командная строка разделяет нижний колонтитул заголовка файла:

     $ sed -e '0,/<body>/d' -e '/<\/body>/,$d input.html 

    Где sed – это GNU, и предполагается, что тег тела находится на собственной линии.

    Interesting Posts

    Что такое «выполнение текстовой ссылки»?

    bash: как мне записать содержимое, закодированное в base64, в файл на указанную строку

    Как настроить быстрые клавиши на основе префикса в kwin и / или KDE?

    Какая была первая платформа Unix для команды «да»?

    Мне интересно, как обеспечивается атомарность writev ()

    AppArmor: попросите меня принять решение разрешить / запретить

    Как стек TCP / IP обрабатывает UDP-пакеты локальному хосту и адресу назначения?

    Как перенаправить операции ввода / вывода файлов процесса в память или другой файл?

    Файл пропадает в течение короткого периода времени после сохранения его с помощью VIM

    Обязательно ли иметь файловую систему и MMU в Linux?

    Как определить, какой файл .log содержит ошибку?

    Поиск окон 7 / vista, таких как тема xfwm4

    Как передать список переменных в sed в функции оболочки

    Где документация для каких sda, sdb, dm-0, dm-1 означает

    Ошибка Sed, заменяющая частичную строку переменной

    Linux и Unix - лучшая ОС в мире.