Устранение неполадок `$ wget -A.pdf -r site.com`
Я пытаюсь получить домашнюю работу с командой, но по какой-то причине она не возвращает их. Любая идея почему?
$ wget -A.pdf -r -nd https://noppa.aalto.fi/noppa/kurssi/mat-2.3152/viikkoharjoitukset/
Моя цель – загрузить все домашние задания, а затем объединить их с pdftk
а затем pdftk
поиск по ним с помощью какой-либо программы, но я не могу продолжить (без повторного перехода к Firefox DownloadThemAll -plugin), пока я не получу эту работу. Идеи, почему не работают? У системных администраторов установлены некоторые запреты на использование wgets или почему это не удается?
- Wget, загрузка устаревших файлов
- Равная команда между wget и cURL (с опциями)?
- Резервирование wget
- Можно ли получить «старую» временную марку?
- wget и предотвращение загрузки файлов на рекурсивный wget
Я получаю только этот файл robots.txt:
$ cat robots.txt User-agent: * Disallow: / User-agent: Googlebot Allow: / Disallow: /cgi-bin/
- Параметры Wget Directory
- `wait` не ждет` wget -background`
- wget изменяет имя файла после загрузки
- wget загруженные имена файлов с абсолютным путем для использования с apt-get
- Загрузить файл с фактическим именем wget
- Как оптимизировать скрипт загрузки wget
- Кэш DNS для wget
- Как получить текст страницы с помощью wget без html?
One Solution collect form web for “Устранение неполадок `$ wget -A.pdf -r site.com`”
Ваша проблема в robots.txt
. Wget смотрит на него и видит
User-agent: * Disallow: /
Вы можете использовать команду tell wget для игнорирования robots.txt
:
wget -A.pdf -r -nd -e robots=off https://noppa.aalto.fi/noppa/kurssi/mat-2.3152/viikkoharjoitukset/
И это сработает.
- Как установить стандартную ftp-корневую папку для пользователя Ubuntu, подключающегося к VSFTPD?
- Имея аргументы $ line, переданные rsync при использовании опции –protect-args