Как загрузить все html-файлы из каталога URL с помощью wget?

Я хотел бы использовать wget для загрузки учебника на веб-сайте, но этот учебник находится в определенном каталоге.

Предположим, что URL-адрес является главной страницей учебника http://www.abc.com/aaa/bbb/ccc/index.html .

Но поскольку в нем есть «продолжения», есть другие страницы, которые я хотел бы быть interconected, которые находятся в каталогах, таких как:

 http://www.abc.com/aaa/bbb/ccc/ddd/index.html http://www.abc.com/aaa/bbb/ccc/eee/index.html http://www.abc.com/aaa/bbb/ccc/fff/ggg/index.html 

Поэтому в основном мне нужно рекурсивно загружать каталоги после ccc, но не раньше, а затем конвертировать ссылки, которые будут использоваться офлайн. Есть ли какой-либо аргумент, который будет использоваться с wget , который выполнил бы такую ​​задачу?

One Solution collect form web for “Как загрузить все html-файлы из каталога URL с помощью wget?”

Пытаться:

 wget -r -np -k -p http://www.site.com/dir/page.html 

Арги (см. man wget ):

  • r Ссылайтесь на ссылки, также получая эти страницы (у этого есть максимальная глубина по умолчанию 5, может быть установлена ​​с -l ).
  • np Никогда не вводите родительский каталог (т. е. не следуйте «домашней» ссылке и зеркалируйте весь сайт, это предотвратит переход к ccc в вашем примере).
  • k Преобразование ссылок относительно локальной копии.
  • p Получить реквизиты страницы, такие как таблицы стилей (это исключение из правила np ).

Если я правильно помню, wget создаст каталог, названный в честь домена, и поместит все там, но на всякий случай попробует его из пустой PWD.

  • используя wget для загрузки всех аудиофайлов (более 100 000 страниц на wikia)
  • Могу ли я использовать wget для рекурсивного скачивания всех файлов, но не их фактического содержимого?
  • «Wget -restrict-file-names = windows», похоже, не удалось преобразовать ссылки для NTFS
  • Запуск тысяч параллельных фоновых процессов в сценарии bash
  • удалите бит на бит бит wget
  • WGET Продолжить без --no-check-certificate
  • Как загрузить архив и извлечь его, не сохраняя архив на диск?
  • Как загрузить все файлы, перечисленные в массиве?
  • Как загрузить файлы и папки из Onedrive с помощью wget?
  • wget не загружает файлы рекурсивно
  • Команда wget по-прежнему загружает папку после исключения
  • Linux и Unix - лучшая ОС в мире.