MudGuard: Textknoten aus HTML rippen (HTML2TXT)

Beitrag lesen

Hi,

die Zeiten sind ja schon lange vorbei, da dieser kleine Codeschnippsel
if(*html == '<')
  while(*html != '>') html++;
else putchar(*html);
für den Zweck der Textextraktion aus HTML wunderbar funktionierte,

Hat er das jemals?

<body title="> blablubb" style="/*wasauchimmer*/">
ist vollkommen korrektes HTML. Ab dem zweiten Zeichen des title-Attributs würde der Text ausgegeben.

Und wenn man dann noch die ganzen SHORT_TAG Folgen bedenkt ...

cu,
Andreas

--
Warum nennt sich Andreas hier MudGuard?
Schreinerei Waechter
Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.