Buddelflinktier: merkwürdige Zeichen zwischen HTTP-Header und Content

Beitrag lesen

Hallo,

wenn ich mittels Telnet unter Verwendung von HTTP zB www.heise.de aufrufe, erhalte ich die Raw-Ausgabe.

Serverantwort:

  
HTTP/1.1 200 OK  
Date: Fri, 06 Jan 2012 13:59:37 GMT  
Server: Apache  
Expires: Fri, 06 Jan 2012 14:04:37 GMT  
Etag: W/"87e2e7af1764565f4248758f728e703e"  
Cache-control: max-age=300  
Vary: Accept-Encoding,User-Agent  
X-Powered-By: Perl http://www.perl.org/  
Connection: close  
Transfer-Encoding: chunked  
Content-Type: text/html; charset=utf-8  
  
11f42  
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd">  
<html xmlns="http://www.w3.org/1999/xhtml" xmlns:og="http://ogp.me/ns#" xml:lang="de">  
...  

Am Ende steht dann noch

  
...  
</body>  
</html>  
<!-- Created with InterRed V12.0-x.x.x.x, http://www.interred.de/, by InterRed GmbH -->  
<!-- BID: 16, iBID: 721625, CID: 20, iCID: 1357206 -->  
<!-- Link: $(LB16:Linktext)$ $(LC20:Linktext)$ -->  
<!-- Generiert: 2012-01-06 10:42:15 -->  
  
  
0  

Was bedeutet dabei "11f42" und am Ende "0"?
Schaue ich mir den Quellcode in div. Browsern an, fehlen diese Parts, ebenso bei curl und wget. Bei einigen Sniffern sind sie vorhanden. In der RFC 2616 und auch beim W3C finde ich keine Infos.

Ich entwickle derzeit ein Tool zum Abholen von Websites und habe nun das Problem wo das Dokument anfängt und aufhört.

VG
Andreas