Tach,
Ach, vielen Dank.Jetzt verstehe ich auch, warum Windows UTF-16 nutzt und nicht UTF-8. Alles klar, super, wieder mal was dazugelernt! Eine Frage noch: UTF-8 nutzt man dann genau, weil ...? Aus Platzgründen? Könnte man doch gleich UTF-16 nutzen!
ja, aus Platzgründen, hier im europäischen Sprachraum sind die meisten Zeichen in UTF-8 mit weniger als zwei Bytes kodiert (darunter quasi alles am Quelltext, was kein Nutztext ist), am Beispiel deines Postings: in UTF-8 belegt es bei mir 35904 Bytes, nach der Umwandlung in UTF-16 71740. Je nach Menge an Nicht-Ascii-Zeichen, wird das Verhältnis weiter von 50% entfernt sein, aber vermutlich immer besser bleiben.
Oder anders gefragt: macht es Sinn, Webseiten als UTF-16 auszuliefern? Oder spricht was dagegen?
Es ergibt Sinn, wenn man z.B. in ostasiatischen Sprachen geschriebene Inhalte hat; hier kann es sein, dass die einzelnen Zeichen in UTF-8 drei Bytes belegen, während sie in UTF-16 nur zwei brauchen.
mfg
Woodfighter