Moin Moin!
Du müßtest einen HEAD Request machen - allerdings weiss ich nicht, ob und wie das mit wget geht.
Ich fürchte, das geht nicht, weder mit wget noch mit irgendeinem anderen Tool: Wie soll wget oder sonst irgendein User-Agent rekursiv Links folgen, wenn er die HTML-Resourcen mit den Links nicht herunterladen darf?
Ich könnte ja veranlassen, dass das Programm zumindest die "index.html"-Dateien herunterlädt. Das würde schon reichen, anderen Links als in diesen Dateien muss nicht gefolgt werden. Und z.B. php-Dateien oder andere Dateien, sollen halt nicht heruntergeladen werden, sondern es soll nur die Größe erfasst werden. (Der Server sendet die Größe auch mit)
=/