Sven Rautenberg: Wozu Unicode?

Beitrag lesen

Moin!

Unicode zu verwenden, wird eigentlich erst dann interessant, wenn man mehrere Sprachen in einem Dokument verwenden will oder wenn Seiten dynamisch erzeugt und sich nicht auf einen bestimmten Zeichensatz festlegen will.
Speicherst Du Deine Inhalte z.B. in utf-8 in einer Datenbank ab, bekommst Du keine Schwierigkeiten, wenn Du doch mal irgend ein ungewöhnliches Zeichen benötigst.

Deine Ausführungen sind in der Theorie richtig - in der Praxis ist es aber, bedingt durch real existierende Browser, alles viel grausamer.

Dieses Forum hier wird unzweifelhaft primär in der deutschen Sprache genutzt. Dennoch verwenden wir jetzt UTF-8. Warum? Weil die Browser zu blöde sind, mit dem Eurozeichen ordentlich umzugehen.

Das Problem ist nämlich: In "Latin 1" bzw. ISO-8859-1 ist das Eurozeichen nicht definiert. Man kann es also nicht übermitteln, selbst wenn der Benutzer es eingegeben hat (was heutzutage ja keine Schwierigkeit ist). Erst ISO-8859-15 kennt das Eurozeichen.

Die Browser verhalten sich beim Formularversand aber leider ziemlich häßlich. Entweder werden uncodierbare Zeichen als Zahlen-Entity übermittelt, oder das Zeichen wird in ein Fragezeichen umgewandelt, oder es wird entgegen den Anweisungen im <form> einfach eine Windows-Codierung genutzt, bei der das Eurozeichen in einem verglichen mit ISO-8859 illegalen Bytebereich liegt.

Unterm Strich hat man bei Nichtverwendung von UTF-8 dermaßen viele Probleme durch Browser, was die Übermittlung auch von "gewöhnlichen" Zeichen angeht, dass UTF-8 wirklich der einzige Ausweg ist.

- Sven Rautenberg