Hi Michael!
Ich schicke an dieses Perl-Script folgenden Header:
$request = "/cgi-bin/sbu_server.pl";
brauchst Du nicht. Du kannst einfach die Hauptdatei absaugen, parsen
und in einer Schleife alle darin gefundenen Links absaugen.
Wie sauge ich denn die Hauptdatei ab, einfach mit
GET / HTTP/1.0\r\n
Host: forum.de.selfhtml.org\r\n
Connection: close\r\n
\r\n
?
Wenn Du zudem auch noch "Accept-Encoding: gzip" sendest, bekommst
Du die Daten in gzip-komprimierter Form. Die mußt Du dann natürlich
dekomprimieren - aber es geht um Faktor 5-10 schneller.
(Die Hauptdatei wird um Faktor 10 komprimiert, die Postings weniger gut.)
OK, gute Idee, aber leider habe ich dabei ein Problem, habe meienn obigen Header wie folgt ausgeweitet:
GET / HTTP/1.0\r\n
ACCEPT_ENCODING: gzip\r\n
Host: forum.de.selfhtml.org\r\n
Connection: close\r\n
\r\n
Aber was jetzt passsiert, ich komme wieder ein 200er Statuscode zurück, aber im body bekomme ich die teamone.de Startseite?!?!?!
Wirklich nur durch diese eine Zeile!
Ohne klappt es normal mit der Formushauptdatei!
Andere Frage: Wie würdest Du das dann dekomprimieren?
Viele Grüße
Andreas