Christian Kruse: E-MAIL und UTF-8

Beitrag lesen

你好 Dennis,

Die Einfachheit. Keine variable Länge der Code Units, alle sind 32 Bit lang. Man kann also z. B. sofort erkennen, wie lang die Zeichenkette ist. Beim schneiden von Zeichenketten (substring oder so) muss man nicht auf Zeichengrenzen aufpassen, etc, pp. Man kann diese Kodierung viel einfacher verarbeiten.

Ich weiß nicht, ob ich das jetzt richtig verstanden habe - aber heißt das dann, dass ein einfacher Text der nur aus ACII Zeichen besteht in UTF-32 mehr Speicherplatz benötigt (weil für jedes Zeichen 32 Bit benötigt) als in UTF-8 (wo für normale ASCII-Zeichen sicherlich nur 8 Bit oder so benötigt werden)?

Dass dem so ist, haben dir die beiden anderen ja gesagt. Deshalb wird UTF-8 auch hauptsächlich in der internen Verarbeitung verwendet. Ist halt wirklich schön einfach.

Bei UTF-16 muss man da sehr aufpassen, bei UTF-8 noch viel mehr.

Da sieht man mal wieder, was du mit der Programmierung dieses Forum geleistet hast, wovon man als normaler User gar nichts weiß ;-)

Ach Unfug *abwink* So schwer ist das nun auch wieder nicht.

再见,
 克里斯蒂安

--
Interessante Kommunikation | Modifiziertes Code-Folding mit TextMate
<zentrum> wie war noch mal die option in make.conf fuer das benutzen von pipes um das compile zu beschluenigen?
<CK1> CFLAGS="-pipe"
<torsten> Oder man frage einen Gentooer seiner Wahl, wie man 2 km Compilerswitches fuer seine CPU hinbekommt ;)
http://wwwtech.de/