Intereting Posts
tty не изменяется правильно Как найти установленную версию yum без использования yum -version? Запуск службы до входа пользователя в систему установить переменные среды из stdout .txt Файл с Mac не будет правильно преобразован Предотвращать запуск определенных строк скрипта как root Как создать временное видео из неподвижных изображений с определенным временем между каждым изображением? Как получить пароль без пароля ssh между любыми двумя узлами в кластере серверов Как добавить путь к исходному каталогу, который будет обнаружен Unix, какая команда? file (1) 5.28 Недопустимый аргумент при использовании параметра байтов Укладка i3wm под тунар Ошибка строгой зависимости при установке пакета Создание пользователя, имеющего только доступ к папке и подпапке, который присутствует у другого пользователя той же Системы Как вы находите, какие ключи являются символами «стереть» и «убить строку» в Ubuntu? Без окон xterm? (Подделка терминала для процесса)

Как загрузить адрес электронной почты, который вызывается на веб-странице с помощью wget?

Как загрузить адрес электронной почты, который указан на веб-странице с веб-сайта?

Мне нужно отсканировать все страницы с этого сайта – родителя, детей и т. Д. Цель состоит в том, чтобы принимать разные адреса электронной почты, которые указали на разные страницы веб-сайта.

На веб-сайте также есть файл robots.txt.

Это не так просто, как вы хотите.

Вероятно, вы хотите загрузить электронное письмо с помощью wget из интерфейса веб-почты. Этот интерфейс использует множество сложных вещей, которые могут делать браузеры, но wget не может (или только через экстремальные скрипты).

Однако большинство веб-сайтов имеют поддержку MAP или POP, с ними вы можете сделать это относительно легко.

Если они этого не делают, тогда еще проще решить одну и ту же задачу с помощью другого средства автоматизации HTTP, как wget . Например, с Selenium вы можете автоматизировать настоящие браузеры, хотя это относительный комплексный настрой, и он потребляет гораздо больше ресурсов. По сути, вам нужно запрограммировать его.

В вашем случае я бы предложил пойти в направлении POP3 / IMAP.