Karl Heinz: einige Fragen zur Zeichenkodierung

Beitrag lesen

Die doppelte Kodierung liegt dann vor, wenn ein Text, der UTF-8-kodiert ist ein weiteres mal mit UTF-8 (um)kodiert wird.

Leider ist der Groschen noch immer nicht gefallen :-(

Bei der UTF-8 Codierung werden Zeichen aus dem ASCII Zeichensatz ja mir nur einem Byte codiert.

Nehmen wir an auf der Festplatte ist für ein bestimmtes ASCII-Zeichen folgender Wert gespeichert:

01010001 (Zeichen auf dem ASCII Zeichensatz mit UTF8 in die Bitfolge codiert)

Soll das mit UTF8 gespeicherte Zeichen in einem Editor dargestellt werden, so wendet der Editor einfach die UTF8-Codierung an, dadurch wird aus der Bitfolge das gespeicherte Zeichen rekonstruiert.

UTF8 wird doch immer die gleiche Codierung verwenden, sprich der Buchstabe wird immer die gleiche Zahlenkombination haben.

Demnach verstehe ich nicht wie die von die genannte Umkodierung von statten gehen soll.

Kannst du ein konkretes Beispiel nennen?