Tach!
Eine Frage noch: UTF-8 nutzt man dann genau, weil ...? Aus Platzgründen? Könnte man doch gleich UTF-16 nutzen!
Sagte ich ja schon, aus Platz- und Kompatibilitätsgründen. Die ersten 128 UTF-8-Zeichen sind zu ASCII kompatibel und benötigen nur 1 Byte pro Zeichen.
Oder anders gefragt: macht es Sinn, Webseiten als UTF-16 auszuliefern? Oder spricht was dagegen?
Eine absolute Antwort kann ich nicht geben, nur eine mit Wenns und Abers.
Wenn du überwiegend (inklusive dem ganzen HTML-Markup und eingebetteten CSS/JS/...-Codes) Zeichen aus dem ASCII-Bereich hast, dann lohnt sich was anderes als UTF-8 nicht aus Platzgründen. Die Rechnung kippt allerdings stärker zugunsten von UTF-16, wenn du sehr viele drei- und vierbytige UTF-8-Sequenzen benötigst. Weiter musst du in die Betrachtung mit einbeziehen, dass dich vielleicht der Speicherplatz auf dem Server nicht juckt, weil mehr als genügend vorhanden ist, dir jedoch die Übertragung Traffickosten beschert. Das lässt sich jedoch mit einer Komprimierung kompensieren (Transfer-Encoding).
dedlfix.