wget изменение имени изображения изнутри страницы

Изображение генерируется один раз каждые n минут, и я хочу, чтобы каждый из них был в моем локальном каталоге. Мне не удалось получить png-изображение с помощью команды:

 wget -r -l1 --no-parent -A.png http://url.com/home/images/ 

поскольку он заблокирован сайтом, и я не могу использовать

 wget http://url.com/home/images/filename.png 

поскольку имя изображения изменяется с обновления на обновление.

Изображение, однако, связано в http://url.com/home/index.html и я мог получить имя файла оттуда. Что такое надежный способ сделать это? Я знаю шаблон для поиска: это единственный образ, который вызывается из каталога /home/images/ .

One Solution collect form web for “wget изменение имени изображения изнутри страницы”

Две стратегии:

  • стратегия index.html grep

Он работает только, пока в index.html есть только одна ссылка png:

 #!/bin/bash wget http://url.com/home/images/index.html LINK=$(cat index.html | grep -zPo 'href=.*.png"') LINK=${LINK#href=\"}; LINK=${LINK%\"} wget --no-parent "http://url.com/home/images/$LINK" rm index.html 
  • Эмуляция браузера путем изменения заголовков запросов

Примеры, как это сделать, здесь , здесь и здесь .

  • linux curl POST запрос не работает
  • Предсказывать имя файла перед загрузкой с URL-адреса, в сценарии оболочки
  • Вызов wget из make на основе шаблона
  • Проблема с загрузкой большого файла из Интернета
  • CURL не будет подключаться к себе
  • Как безопасно загружать файлы в сценарии оболочки?
  • Используя wget или другую команду, как скачать сейчас, но конвертировать ссылки позже?
  • Какой самый быстрый инструмент для синхронизации файлов прослушивания http
  • Как получить доступ к http-серверу из сценария bash с существующим подключением tcp?
  • wget сохраняет загруженные файлы как имя короткой ссылки, а не фактические имена файлов
  • Загрузите одну страницу html со всей необходимой графикой и связанными файлами pdf / zip
  • Linux и Unix - лучшая ОС в мире.