Axel Richter: Textknoten aus HTML rippen (HTML2TXT)

Beitrag lesen

Hallo,

Oder ist ein Textknoten zwischen </script> und </head> etwa erlaubt?)
Das ist zwar nicht erlaubt, aber trotzdem zeigen die meisten Browser normale Zeichendaten direkt innerhalb von head an.

In einigen HTML-Versionen ist es erlaubt, weil das HEAD- und BODY-Element optionale Start- und End-Tags haben. Das HEAD-Element ist dann eben beendet, wenn die ersten Zeichendaten auftauchen und BODY beginnt hier.

@Christoph: Willst Du wirklich noch einen HTML-Parser schreiben. Da gibt es doch sicherlich in allen OOP-Sprachen schon ausreichend fertige Klassen für.

viele Grüße

Axel