Tom: Umstellung auf UTF-8

Beitrag lesen

Hello,

wie stelle ich denn am besten eine Seite auf UTF-8 um.
Gibt es ein Konvertierprogramm?
Wie muss ich dann Sonderzeichen eingeben?
ä,ö,ü .... wie bisher mit den auf der deutschen Tastatur vorhandenen Tasten?
Wie Zeichen, die nicht vorhanden sind, z.B. franz. Sonderzeichen?

Wenn die Seite aktiv generiert wird, z.B. durch PHP, dann ist zusätzlich zu dem bereits erwähnten leider auch noch das ganze Programm von single byte codierung auf multi byte codierung umzustellen.

Es müssen dann die passenden Funktionen für die Stringfunktionen benutzt werden. Aber auch an Stellen, denen man es nicht unbedingt ansieht, muss nachgebessert werden. Wenn z.B. auf Zeichen im String mit

$string[$i]

zugegriffen wird, ist das nun nicht mehr sinnvoll. Das ($i+1)-te Zeichen steht ja nicht mehr sicher an der Position $i.

Und auch beim Abspeichern von Zeichenketten in Dateien muss man genau hingucken, ob der vorgesehene Platz noch ausreicht. Eine Zeichenkette mit 20 Zeichen kann nun (erstmal) bis zu 60 Bytes lang werden.
Da muss man dann also auch nachbessern.

Einige Datenbanken (z.B. MySQL) haben das ebenfalls getan. Sie können jetzt mit varianten Multibyte-Codierungen sowohl beim Abspeichern als auch beim Sortieren umgehen. Man muss es ihnen aber auch sagen, welche Codierung jetzt gilt.

Vorhandene Datenbestände müssen entsprechend angepasst werden, was aber in der Richtung ASCII -> UTF-8 oder ISO 8859-x -> verlustfrei möglich ist.

Harzliche Grüße vom Berg und Frohe Weihnachtszeit

Tom

--
Nur selber lernen macht schlau