Tim Tepaße: Zeichenkodierung: ISO ... vs. Unicode

Beitrag lesen

Hallo Kai,

  1. Muss ich einen Zeichenkode in meinen HTML-Dateien angeben?

Es empfiehlt sich.

  1. Was ist sinnvoller: Unicode oder z. B. ISO 8859?

Das hängt davon ab, welche Zeichen Du verwenden willst. Wenn Du nur das lateinische Alphabet plus Umlaute und Eszett verwendest, genügen ISO 8859-1 (alias Latin 1) oder ISO 8859-15 (alias Latin 9), das nichts anderes als ein Latin 1 plus Eurozeichen ist. Wenn Du kyrillische Zeichen verwenden willst, brauchst Du den entsprechenden Zeichensatz ISO 8859-irgendwas.

All diese Zeichensätze kennen insgesamt nur 256 Zeichen, einige davon nicht mal druckbar.

Im Unicode Standard dagegen sind so ziemlich die meisten bekannten und gebräuchlichen Zeichen enthalten. Zusammen. Das heißt, man kann lateinische und kyrillische und asiatische (CJK) und sonstige Zeichen mischen. Manche sehen das als Vorteil. Hier im SELF-Forum wird z.B. die Unicode-Kodierung UTF-8 verwendet, hauptsächlich weil Cheffe chinesische Begrüßungen verwenden will. Das hat für mich den schönen Nebeneffekt, dass ich „korrekte deutsche Anführungszeichen“ verwenden kann, die in dem Zeichensatz ISO 8859-1 nicht enthalten sind.

Wenn Du also Zeichen verwenden willst, die nicht in einem der ISO 8859-X Zeichensätze enthalten sind oder Zeichen aus verschiedenen Zeichensätzen mischen willst, empfiehlt sich Unicode in der Kodierung UTF-8.

  1. Habe ich überhaupt einen Einfluss auf die Zeichenkodierung, wenn ich Webspeicherplatz z. B. bei Strato & Co. angemietet habe?

Im Prinzip ja. Ich glaube, auch bei Strato geht das. Dazu solltest Du eine .htaccess-Datei anlegen, in dem Du dem Webserver mitteilst, mit welcher Kodierung er die und die Dateien über HTTP senden sollst. Das machst Du mit der AddCharset-Direktive.

  1. Werden nicht eh Voreinstellungen verwendet?

Wenn bei HTTP keine Kodierung angegeben wurde, soll laut Standard die Kodierung Latin 1 angenommen werden. Keine Ahnung, ob da diverse Browser Mist bauen.

Tim