Исключая некоторые php-страницы, но не другие с wget?

Я хочу использовать wget для рекурсивной загрузки веб-сайта. Сайт содержит статьи, обслуживаемые php-скриптом, например. www.example.com/article.php?id=1021&ch=5 – это то, что я хочу, вся отдельная статья со всеми главами.

К сожалению, на сайте также есть комментарии – много-много комментариев. Комментарии также обрабатываются php-скриптом, например. www.example.com/comment.php?id=1021&no=144 – этого я не хочу.

В принципе, я хочу всего, кроме комментариев. Проблема в том, что ссылки на статьи, главы и комментарии вкраплены в списки статей и разделов, поэтому нет возможности «точно настроить» уровень рекурсии, чтобы избежать их … и делать уровень для уровня и вручную сортировки, между ними, потребовалось бы слишком много времени и усилий.

Поскольку оба являются php-скриптами, использование опций -A или -R wget для принятия или отклонения файлов с определенным суффиксом не будет работать – или это так? Есть ли другой более точный способ исключить один php-скрипт, но не другие, при загрузке рекурсивно?

One Solution collect form web for “Исключая некоторые php-страницы, но не другие с wget?”

Ниже приводится некоторое представление о том, что вы ищете: http://www.gnu.org/software/wget/manual/html_node/Directory_002dBased-Limits.html

Вы должны иметь возможность использовать --exclude /comment.php чтобы исключить все варианты страницы comment.php

  • Продолжение прерывания сессии wget?
  • Получить все изображения с веб-сайта
  • Как отключить сжатие gzip с помощью wget?
  • Сценарий Bash, создающий нежелательные файлы
  • Wget, загрузка устаревших файлов
  • Ошибка wget -output-document = при наличии символа ~
  • Почему я не могу передать файл через wget (FTP) с помощью функции exec () в PHP?
  • Преобразование ссылок загруженного веб-сайта
  • нижняя граница скорости загрузки в wget
  • Команда wget по-прежнему загружает папку после исключения
  • Как сообщить wget для загрузки файлов с именами, закодированными url?
  • Linux и Unix - лучшая ОС в мире.