Hi,
Puh, ich hätte mir meine wortreiche Einleitung wohl besser sparen sollen ;-)
die Zeiten sind ja schon lange vorbei, da dieser kleine Codeschnippsel
if(*html == '<')
while(*html != '>') html++;
else putchar(*html);
für den Zweck der Textextraktion aus HTML wunderbar funktionierte,Hat er das jemals?
Nein, nie (oder evt bei HTML-0.9?), war rein rethorisch.
<body title="> blablubb" style="/*wasauchimmer*/">
ist vollkommen korrektes HTML.
Meiner Erinnerung nach hätten sich einige der _ganz_ frühen Browser an dem unmaskiertem '>' im Tag verschluckt. Aber das war noch vor Netscape-3, ist also nicht mehr wirklich relevant ;-)
Aber hast schon Recht, das hätte ich wahrscheinlich vergessen, danke.
Auha, das wird jetzt aber knapp, mit meinem 22-Zeiler ;-)
Und wenn man dann noch die ganzen SHORT_TAG Folgen bedenkt ...
Nein, das verstehe ich nicht, warum sollte es da nicht funktionieren? Vorrausgesetzt natürlich, da steht nichts "gefährliches" in den Attributen.
so short
Christoph Zurnieden