Moin!
Das kann schon sein, dass das unter Unicode falsch ist.
Unter extended ASCII (Codetabelle 437) ist es ein geschütztes Leerzeichen :-)
"Extended ASCII" ist kein geschützter Begriff für irgendwas, sondern leider eine Allerweltsbezeichnung für alles, was oberhalb (und wie man an CP 437 sieht, auch unterhalb) von Zeichennummer 127 Definitionen vornimmt, die über "undefiniert" hinausgehen (ASCII ist bekanntlich ein 7-Bit-Zeichensatz). Soll heißen: Auch ISO-8859-1 ist eine Erweiterung von ASCII - nur eben "anders".
Themenbereich ist HTML/XHTML.
HTML und XHTML haben als Zeichensatz ISO 10646 (Unicode), nicht extended ASCII.
Es ist ja grundsätzlich kein Problem, Codepage 437 als Zeichencodierungsangabe zu verwenden. Eventuell wird man damit nicht bei sehr vielen Browsern Erfolg haben, aber erlaubt ist es. Die korrekte Angabe wäre eine von diesen vieren:
charset=IBM437
charset=cp437
charset=437
charset=csPC8CodePage437
Vgl. http://www.iana.org/assignments/character-sets
Zeichen 255 in HTML ist also ein y-Umlaut (das "geschützte" non-breaking-Space ist in HTML/XHTML Zeichen 160).
Fehlende Zeichencodierungsangaben provozieren halt Fehlinterpretationen.
- Sven Rautenberg
"Love your nation - respect the others."