Sven Rautenberg: „discouraged characters“: warum sind welche Zeichen unerwünscht?

Beitrag lesen

Moin!

Wenn ich Dich richtig verstehe, geht es um den Block "Arabic Presentation Forms-A", der von U+FB50 bis U+FDFF geht.

Aha, interessante Informationen, die du da verteilst. :)

Die Specials gehen von U+FFF0 bis U+FFFF, wovon wiederum die letzten beiden Non-characters sind. (In jeder Ebene sind jeweils die letzten beiden Codes Non-characters.)

Naja, warum U+FFFE ein Non-Character sein muß, war mir schon klar, weil man sonst die BOM U+FEFF nicht als Unterscheidung für little/big endian einsetzen könnte. Aber der Rest - da hätte ich vermutet, dass irgendwie dieselben Ansätze für die Surrogatzeichen gelten könnten, was nach Betrachtung der Bereiche, die Surrogate darstellen sollen, und der hier hinterfragten Non-Chars aber irgendwie gar keinen Sinn ergab. ;)

- Sven Rautenberg