molily: Charset UTF-8 vs. ISO 8859-1

Beitrag lesen

Hallo,

Auf der Startseite von SELFHTML (http://de.selfhtml.org/) finde ich im HEAD-Teil den Tag:
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">

Die Dokumentation ist technisch noch ziemlich veraltet (Quirksmode, Tabellen-Layouts, Entities für alle nicht-Ascii-Zeichen).

Für UTF-8 in der statischen Dokumentation besteht derzeit keine dringende Notwendigkeit, weil Zeichen außerhalb von ISO-8859-1 extrem selten vorkommen. Entities für alle Nicht-ASCII-Zeichen gibt es nicht mehr. Das gesamte statische SELFHTML-Angebot benutzt momentan ISO-8859-1. Das ist auch keine veraltete Praxis, sondern nach wie vor eine mögliche Option.

Dass im Forum UTF-8 verwendet wird, hat spezielle Gründe, die sich so nicht auf die Dokumentation übertragen lassen: Das Forum lebt vom Eingeben von Texten im Browser. Hier ISO-8859-1 zu verwenden, führte dazu, dass Browser unvorhersehbar reagieren, wenn Zeichen, die nicht in ISO-8859-1 vertreten sind, in die Formularfelder eingegeben werden. Manche Browser nehmen dann einfach ungefragt UTF-8 als Kodierung für die Formulardaten, andere senden diese Zeichen als numerische Zeichenreferenzen. Die Forumssoftware ist daher sehr tolerant geschrieben. Mit UTF-8 als einheitlicher Kodierung für Ausgabe, Speicherung und Eingabe versucht sie, die Browser zu vorhersehbaren Resultaten zu bringen, nämlich möglichst UTF-8-kodierte Formulardaten zu senden.

Mathias