Moin!
Wenn ich Dich richtig verstehe, geht es um den Block "Arabic Presentation Forms-A", der von U+FB50 bis U+FDFF geht.
Aha, interessante Informationen, die du da verteilst. :)
Die Specials gehen von U+FFF0 bis U+FFFF, wovon wiederum die letzten beiden Non-characters sind. (In jeder Ebene sind jeweils die letzten beiden Codes Non-characters.)
Naja, warum U+FFFE ein Non-Character sein muß, war mir schon klar, weil man sonst die BOM U+FEFF nicht als Unterscheidung für little/big endian einsetzen könnte. Aber der Rest - da hätte ich vermutet, dass irgendwie dieselben Ansätze für die Surrogatzeichen gelten könnten, was nach Betrachtung der Bereiche, die Surrogate darstellen sollen, und der hier hinterfragten Non-Chars aber irgendwie gar keinen Sinn ergab. ;)
- Sven Rautenberg