Поиск всех типов расширений, указанных в файле html

Вот моя проблема:

Существует папка со многими html и текстовыми файлами. Мне нужно рекурсивно пройти через каждый из них и найти все виды расширений файлов, на которые ссылаются эти файлы html / text, такие как .jpg, .tif, .png и т. Д.

Проблема в том, что у меня нет определенного списка расширений, которые я хочу найти.

Каким будет лучший способ достичь этого с помощью сценария оболочки?

Придумать Reg-ex, который будет по существу искать все вхождения точки, за которой следует 3 или 4 буквы, и отфильтровывать те, которые заканчиваются пробелом или запятой, или цитата и т. Д.?

Любые предложения будут полезны.

Имея в виду, что HTML не является обычным языком, вы, вероятно, могли бы, по крайней мере, сузить его:

grep -Ro '[a-zA-Z0-9]+\.[a-zA-Z0-9]{1,4}' *