Hi Axel,
Der Text in der ursprünglichen HTML-Datei kann (nun) codierte Zeichen enthalten. Das sind sowohl besondere Schriftzeichen (bspw. der Form Ä),
aber auch Zeichenfolgen, die zur Darstellung nicht-latenischer Schriftzeichen verwendet werden.
Beispiel? Darunter kann ich mir nichts vorstellen, jedenfalls nichts, was nicht mit der Entity-Notation (ä bzw.: €) identisch wäre.
siehe bspw.:
ÁùÕ£¨£µ£°£©
Das ist Chinesisch, charset=gb2312, gibt's aber auch noch für andere Sprache und auch für gleiche Sprache diverse charsets...
Allerdings muss ich mir das alles nochmal genauer ansehen, evtl. kann man damit dem charset was machen, ich glaube, die Probleme sind bei mir erst durch die Maskierung von $Auml; & Co. entstanden, also dass ein Ä in solchen Zeichensätzen halt kein Ä sein soll, und es, wird es maskiert, zu Fehlern kommt..
Die Textarea kann ja offenbar nicht eingestellt werden, Quelltext uninterpretiert darzustellen.. Na ja, die Frage war es wert, danke für Deine Zeit und
schönen Gruß,
Mike