Hallo,
Das heißt, die Byte-Darstellung dieser Zeichen enthält irgendwo einen der Bytewerte 0x00 .. 0x1F, 0xFF oder 0x7F (gehört AFAIR zu :cntrl: dazu).
Kann doch eigentlich gar nicht. Die Bytewerte der Bytesequenzen von Nicht-ASCII-Zeichen (i.e. ab U+0080) in UTF-8 sind binär 110xxxxx, 1110xxxx, 11110xxx oder 10xxxxx, also weder 00000000 bis 00011111 noch 11111111 noch 01111111.
ja, das dachte ich eigentlich auch. Deswegen hat mich Michas Beschreibung des Problems auch erst etwas verunsichert. Aber ich dachte, wer weiß - vielleicht matcht :cntrl: ja noch auf 0x80 .. 0x9F, der Bereich ist ja in den ISO-Latin-Codierungen AFAIR auch reserviert oder nicht definiert oder sowas. Genaue Angaben über den Umfang von :cntrl: habe ich nämlich nicht gefunden.
Oder hab ich da einen Denkfehler?
Möglich. Vielleicht denselben wie ich.
Ciao,
Martin
Es gibt eine Theorie, die besagt, dass das Universum augenblicklich durch etwas noch Komplizierteres und Verrücktes ersetzt wird, sobald jemand herausfindet, wie es wirklich funktioniert. Es gibt eine weitere Theorie, derzufolge das bereits geschehen ist.
- (frei übersetzt nach Douglas Adams)