Устранение неполадок `$ wget -A.pdf -r site.com`

Я пытаюсь получить домашнюю работу с командой, но по какой-то причине она не возвращает их. Любая идея почему?

$ wget -A.pdf -r -nd https://noppa.aalto.fi/noppa/kurssi/mat-2.3152/viikkoharjoitukset/ 

Моя цель – загрузить все домашние задания, а затем объединить их с pdftk а затем pdftk поиск по ним с помощью какой-либо программы, но я не могу продолжить (без повторного перехода к Firefox DownloadThemAll -plugin), пока я не получу эту работу. Идеи, почему не работают? У системных администраторов установлены некоторые запреты на использование wgets или почему это не удается?

Я получаю только этот файл robots.txt:

 $ cat robots.txt User-agent: * Disallow: / User-agent: Googlebot Allow: / Disallow: /cgi-bin/ 

One Solution collect form web for “Устранение неполадок `$ wget -A.pdf -r site.com`”

Ваша проблема в robots.txt . Wget смотрит на него и видит

 User-agent: * Disallow: / 

Вы можете использовать команду tell wget для игнорирования robots.txt :

 wget -A.pdf -r -nd -e robots=off https://noppa.aalto.fi/noppa/kurssi/mat-2.3152/viikkoharjoitukset/ 

И это сработает.

  • Размер внутреннего буфера wget
  • Возможно ли выполнить результат wget как команды?
  • wget, чтобы получить все файлы в каталоге, возвращает index.html
  • Отфильтруйте гиперссылки с веб-страницы и загрузите все, что соответствует определенному шаблону
  • Использование wget для получения имен файлов из текстового файла
  • Извлечение каталога из stdout из wget
  • bash не может найти команду mvn после установки
  • Команда wget по-прежнему загружает папку после исключения
  • Curl-эквивалент wget's -read-timeout = X
  • Загрузите сразу несколько URL-адресов
  • как указать порт пересылки при использовании нескольких служб tsocks?
  • Linux и Unix - лучшая ОС в мире.