Hallo ...
Bitte. Lies, bevor du schreibst. Bei UTF-8 sind alle Code-
Einheiten 8 Bit gross. Dabei können bis zu 6 (bzw. 4, je nach dem
welchen Standard man liest) Code-Einheiten ein Zeichen
beschreiben.
Verstehe ich nicht so ganz, was mit Code-Einheit gemeint ist.
Jedenfalls ist ein Zeichen mit 16 Bit codiert, d.h. jeder Buchstabe
besteht aus 2 Byte, was sich bei Fehldarstellungen ja immer in diesen
doppelten Zeichen (z.B. Rechtecke) darstellt.
Was meinst du also genau mit "Code-Einheit"?
Gruß
L00NIX