Textknoten aus HTML rippen (HTML2TXT) von Christoph Zurnieden, 22.02.2005 15:01

Beitrag lesen

Textknoten aus HTML rippen (HTML2TXT)

Christoph Zurnieden 22.02.2005 15:01

programmiertechnik

Hi,

Puh, ich hätte mir meine wortreiche Einleitung wohl besser sparen sollen ;-)

die Zeiten sind ja schon lange vorbei, da dieser kleine Codeschnippsel
if(*html == '<')
while(*html != '>') html++;
else putchar(*html);
für den Zweck der Textextraktion aus HTML wunderbar funktionierte,

Hat er das jemals?

Nein, nie (oder evt bei HTML-0.9?), war rein rethorisch.

<body title="> blablubb" style="/*wasauchimmer*/">
ist vollkommen korrektes HTML.

Meiner Erinnerung nach hätten sich einige der _ganz_ frühen Browser an dem unmaskiertem '>' im Tag verschluckt. Aber das war noch vor Netscape-3, ist also nicht mehr wirklich relevant ;-)

Aber hast schon Recht, das hätte ich wahrscheinlich vergessen, danke.
Auha, das wird jetzt aber knapp, mit meinem 22-Zeiler ;-)

Und wenn man dann noch die ganzen SHORT_TAG Folgen bedenkt ...

Nein, das verstehe ich nicht, warum sollte es da nicht funktionieren? Vorrausgesetzt natürlich, da steht nichts "gefährliches" in den Attributen.

so short

Christoph Zurnieden

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Christoph Zurnieden: Textknoten aus HTML rippen (HTML2TXT)

Beitrag lesen

Textknoten aus HTML rippen (HTML2TXT)

Textknoten aus HTML rippen (HTML2TXT)