Gunnar Bittersmann: "non SGML character number"

Beitrag lesen

Hello out there!

1. Error  Line 343 column 161: non SGML character number 150.

Waschbrettbauch – davon träumen alle Männer

^
Um dieses Zeichen geht’s.

Im Windows-Zeichensatz steht das an der Stelle 150 = x96; und dein Editor  bzw. die Software, die die Nachrichten reinsetzt, schreibt dir das als Byte mit dem Wert x96 in die Datei. Du denkst, das wäre ISO-8859-1-codiert, ist es aber nicht: in ISO 8859-X sind die Bytes x7F bis x9F (127 bis 159) Codes für Steuerzeichen.

Wenn du '–' (U+2013 en dash) im Quelltext verwenden willst, musst du eine Codierung wählen, die dieses Zeichen enthält. UTF-8 ist erste Wahl. Es ginge aber auch windows-1252 (das ist die, bisher verwendet wird).

Dein Server muss die verwendete Codierung richtig im HTTP-Header angeben, und auch die HTTP-EQUIV-Angabe im Dokument sollte stimmen.

Wenn du an ISO 8859-1 gebunden bist, müsstest du die nicht in dieser Codierung erfassten Zeichen als numerische oder Entity-Zeichen-Referenzen notieren (– bzw. –), die Wahl einer geeigneten Codierung ist aber vorzuziehen.

See ya up the road,
Gunnar

--
“Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)