Ulta Edit - invalid UTF-8 bytes bei Tidy Prüfung
Michael
- software
Hallo und guten Abend.
Bei einem xhtml-Dokument bekomme ich bei der Prüfung mit HTML Tidy mehrere Warnungen: "replacing invalid UTF-8 bytes (char. code U+0000)" (bei ü im Text) (und ...U+0006 bei ö) usw.
Das Dokument soll in UTF-8 kodiert sein (<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />).
Ich habe es als UTF-8 im UE gespeichert. Alle Browser zeigen als charset auch UTF-8 an und zeigen alle Umlaute korrekt an.
Probehalber habe ich schon alle möglichen Konvertierungen vorgenommen (zb Unicode/UTF8 nach UTF8(Unicodebearbeitung) usw.) und als UTF-8 mit und ohne BOM gespeichert, alles ohne Erfolg -> HTML Tidy hat sich noch immer beschwert.
Wenn ich Tidy ein "Tidy-Dokument" erzeugen lasse und dieses wieder mit Tidy prüfe, sind die Fehler weg, allerdings werden mir dann die vorhandenen Umlaute werder in UE noch in Browsern korrekt dargestellt. Wenn ich dann in dem "Tidy-Dokument" neue Umlaute schreibe, werden diese jedoch wieder korrekt dargestellt.
Ich suche, lese und probiere jetzt schon seit Stunden, werde aber nicht schlauer.
Kann mir bitte jemand auf die Sprünge helfen, woher der Fehler genau rührt und was ich tun muss, damit das Dokument "richtig" gespeichert wird.
Vielen Dank und viele Grüße
Michael
Hallo,
Frage zurückgenommen, scheint sich wohl um einen Bug des HTML Tidy in meinem UE (v.12.10b) zu handeln.
Grüße
Michael
Hey,
zur Info: das Standalone-Tidy hat den passenden Schalter dafür.
> tidy -?|grep utf8
-utf8 use UTF-8 for both input and output