Daniel Thoma: Griechische Pfirsiche

Beitrag lesen

Hallo molily,

Die Etablierung *einer* hinreichenden Unicode-Kodierung wie UTF-8 in der Software-Welt hat auch wenig mit Speicherplatzersparnis zu tun.

UTF-16 ist zumindest als Format für die Textverarbeitung (im Unterschied zur Speicherung) sehr verbreitet. Strings werden oft als UTF-16 gespeichert (nicht nur in Java).

So ist Latin-1 für deutschsprachige Texte auch platzsparenter, dennoch hat UTF-8 viele Vorteile.

Ja, aber kaum, die Umlaute und ß machen nur wenig aus. Wenn man aber z.B. asiatische Sprachen kodiert, hat man mit UTF-8 wirklich einen Faktor drei.

Bei UTF-16 ist es anders herum, weil viel Software, die UTF-8 unterstützt, auch ISO-8859-1 unterstützt (auch wenn dabei Probleme auftreten), aber längst nicht UTF-16.

Für Browser gilt das wohl nicht. Mit Windows-Texteditoren kenne ich mich nicht aus, aber da muss man dann eben einen entsprechenden wählen.

Im Webkontext würde man sich wahrscheinlich für UTF-8 entscheiden, weil es die Standardkodierung ist, die mittlerweile breit unterstützt wird.

Wo mangelt es denn an UTF-16-Unterstützung? Bei Browsern wohl nicht, auf der Serverseite eher auch nicht, Unicode-fähige Programmiersprachen benutzen oft UTF-16.

Für Sprachen mit im Wesentlichen lateinischem Alphabet ist UTF-8 natürlich optimal, für Sprachen, deren Zeichen dann 3-Byte benötigen, also vor allem wohl asiatische, zweifle ich etwas.

Grüße

Daniel