Christoph Zurnieden: Textknoten aus HTML rippen (HTML2TXT)

Beitrag lesen

Hi,

Puh, ich hätte mir meine wortreiche Einleitung wohl besser sparen sollen ;-)

die Zeiten sind ja schon lange vorbei, da dieser kleine Codeschnippsel
if(*html == '<')
  while(*html != '>') html++;
else putchar(*html);
für den Zweck der Textextraktion aus HTML wunderbar funktionierte,

Hat er das jemals?

Nein, nie (oder evt bei HTML-0.9?), war rein rethorisch.

<body title="> blablubb" style="/*wasauchimmer*/">
ist vollkommen korrektes HTML.

Meiner Erinnerung nach hätten sich einige der _ganz_ frühen Browser an dem unmaskiertem '>' im Tag verschluckt. Aber das war noch vor Netscape-3, ist also nicht mehr wirklich relevant ;-)

Aber hast schon Recht, das hätte ich wahrscheinlich vergessen, danke.
Auha, das wird jetzt aber knapp, mit meinem 22-Zeiler ;-)

Und wenn man dann noch die ganzen SHORT_TAG Folgen bedenkt ...

Nein, das verstehe ich  nicht, warum sollte es da nicht funktionieren? Vorrausgesetzt natürlich, da steht nichts "gefährliches" in den Attributen.

so short

Christoph Zurnieden