Как загрузить все html-файлы из каталога URL с помощью wget?

Я хотел бы использовать wget для загрузки учебника на веб-сайте, но этот учебник находится в определенном каталоге.

Предположим, что URL-адрес является главной страницей учебника http://www.abc.com/aaa/bbb/ccc/index.html .

Но поскольку в нем есть «продолжения», есть другие страницы, которые я хотел бы быть interconected, которые находятся в каталогах, таких как:

 http://www.abc.com/aaa/bbb/ccc/ddd/index.html http://www.abc.com/aaa/bbb/ccc/eee/index.html http://www.abc.com/aaa/bbb/ccc/fff/ggg/index.html 

Поэтому в основном мне нужно рекурсивно загружать каталоги после ccc, но не раньше, а затем конвертировать ссылки, которые будут использоваться офлайн. Есть ли какой-либо аргумент, который будет использоваться с wget , который выполнил бы такую ​​задачу?

Пытаться:

 wget -r -np -k -p http://www.site.com/dir/page.html 

Арги (см. man wget ):

  • r Ссылайтесь на ссылки, также получая эти страницы (у этого есть максимальная глубина по умолчанию 5, может быть установлена ​​с -l ).
  • np Никогда не вводите родительский каталог (т. е. не следуйте «домашней» ссылке и зеркалируйте весь сайт, это предотвратит переход к ccc в вашем примере).
  • k Преобразование ссылок относительно локальной копии.
  • p Получить реквизиты страницы, такие как таблицы стилей (это исключение из правила np ).

Если я правильно помню, wget создаст каталог, названный в честь домена, и поместит все там, но на всякий случай попробует его из пустой PWD.