Hi!
Sollte man nun grundsätzlich alles Websiten in UTF-8 abspeichern?
Website ist nicht Webseite.
Ja (zumindest solche in lateinischer, kyrillischer, griechischer, … Schrift).
Diese Aussage ist mir nicht verständlich/eindeutig genug. Dass das "ja" aufgrund der Einschränkung schon logisch falsch ist, ist nicht so tragisch. Aber das "…" bedarf einer Erläuterung. Das schließt nämlich auch CJK und anderes mit ein, das mit 3 und 4 Byte kodiert wird. Oder anders gesagt: "…" schließt diese Zeichen nicht aus. Und das wolltest du ja mit deiner Einschränkung zum Ausdruck bringen. Außerdem müsste in die Einschränkung noch ein "vorwiegend" eingebaut werden, denn wenn ein Text in lateinischen Buchstaben drei chinesische Zeichen enthält, lohnt sich eine Umcodierung nach UTF-16 auch nicht richtig.
Die ganze Betrachtung berücksichtigt allerdings nur die Effizienz der Texte eines Webdokuments. Wenn viel Markup (verwendet ASCII-Zeichen) enthalten ist, kommt man wieder mit UTF-8 günstiger. Wenn das Backend (PHP, DBMS, etc.) nicht fähig ist, mit UTF-16 umzugehen, ist es auch wieder ein Punkt, der gegen die Verwendung von UTF-16 sprechen kann. (MySQL beispielsweise kann zwar UTF-16 (bzw. UCS-2) als Speicherformat verwenden, nicht jedoch als Übertragungsformat.)
Zurück zur eigentlichen Frage, die eher auf einen Vergleich mit Ein-Bye-Kodierungen wie ISO-8859-1 und Win-1252 abzielt: Es kann natürlich auch Gründe gegen UTF-8 geben. Beispielsweise wenn man für die Datenverarbeitung ein altes System verwenden muss, das partout nicht mit UTF-8 umgehen kann, die Daten nicht nur durchreicht sondern unter Umständen sogar UTF-8-Byte-Sequenzen auseinander reißt. Für neue Projekte ist es in der Regel jedoch sinnvoll, zu betrachten, ob man UTF-8 verwenden kann und dies dann zu tun, wenn nichts gravierendes dagegenspricht.
Lo!