dbenzhuser: UTF8 - was ist zu beachten?

N'Obend

Ich komme so langsam auf den Geschmack von UTF-8, wahrscheinlich ist es einfach Faulheit etwas exotischere Sonderzeichen immer in Tabellen nachschlagen zu müssen.

Nun hab ich zwei Fragen:

a) Gibt es noch irgendwelche relevanten Probleme beim Verwenden von UTF-8 auf Webseiten? Macht meine MySQL-Datenbank das ohne weiteres mit?

b) Wie konvertiere ich meine bestehenden ISO-sonstnochwas-Dokumente in einem Rutsch nach UTF-8? Da muss es doch sicher irgendwelche Tools geben. Konnte bisher nix finden...

Es dankt dbenzhuser.

--
Heute in der Reihe „unser Ranking soll schöner werden“:
Gefälschte Musikinstrumente Marke Bessons
  1. echo $begrüßung;

    a) Gibt es noch irgendwelche relevanten Probleme beim Verwenden von UTF-8 auf Webseiten?

    Solange die angegebene Codierung stimmt dürften nur alte Browser, die noch kein UTF-8 sprechen das nicht anzeigen. Ausschlaggebend ist das, was der Server in den HTTP-Headern mitsendet, nicht das was in der META-Angabe des HTML-Headers steht. Das nächste Problem ist die Unterstützung der Darstellung der Zeichen durch einen entsprechenden Zeichensatz.

    Weiterhin ist eine verwendete Scriptsprache zu beachten. Erkennt diese bei ä ein Zeichen oder zwei?

    Macht meine MySQL-Datenbank das ohne weiteres mit?

    Das kommt darauf an. Das reine Speichern und Auslesen geht problemlos. Schwieriger wird es, wenn codierungsspezifische Dinge eine Rolle spielen, wie zum Beispiel Sortierungen, Vergleiche usw.

    Dann solltest du schon eine Version 4.1 zur Verfügung haben. In freier Wildbahn soll diese Version schon vorkommen, doch in den Provider-Zoos mag das noch nicht so sein. 4.1 ist erst im vorigen Jahr freigegeben worden und hat wohl auch einen lizenzrechtlichen Haken.

    b) Wie konvertiere ich meine bestehenden ISO-sonstnochwas-Dokumente in einem Rutsch nach UTF-8? Da muss es doch sicher irgendwelche Tools geben. Konnte bisher nix finden...

    Das kommt auf die Systemplattform an. Notwendig ist ein UTF-8-fähiger Editor für die Bearbeitung der Dateien. Für das einmalige Konvertieren gibt es beispielsweise unter Linux Tools wie iconv.

    echo "$verabschiedung $name";

    1. Macht meine MySQL-Datenbank das ohne weiteres mit?

      Das kommt darauf an. Das reine Speichern und Auslesen geht problemlos. Schwieriger wird es, wenn codierungsspezifische Dinge eine Rolle spielen, wie zum Beispiel Sortierungen, Vergleiche usw.

      Sortieren mit UTF-8-codierten Strings und nicht-utf8-aware-Funktionen ergibt dieselben Ergebnisse wie bei Verwendung von Latin1. Erst wenn man mit case-insensitive herumspielt gibt es Probleme.

    2. N'Obend

      Dankesehr, dann werd ich mal mein ubuntu starten und mit dem konvertieren anfangen. Wundert mich, dass es da kein einfaches Windowsprogramm gibt (und mit den Macros von jEdit hab ichs leider auch nicht hinbekommen...)

      Tschö,
      dbenzhuser

      --
      Heute in der Reihe „unser Ranking soll schöner werden“:
      Gefälschte Musikinstrumente Marke Bessons
      1. echo $begrüßung;

        Dankesehr, dann werd ich mal mein ubuntu starten und mit dem konvertieren anfangen. Wundert mich, dass es da kein einfaches Windowsprogramm gibt

        Das hab ich so nicht gesagt. Ich kenne nur keins, weil mir dieses Problem unter Windows noch nicht begegnet ist.

        Vielleicht gibt es ja iconv unter Windows. Vielleicht gehts auch mit iconv unter CygWin. Vielleicht ist CygWin in dem Fall auch mit Kanonen auf Spatzen geschossen...

        echo "$verabschiedung $name";

      2. Wundert mich, dass es da kein einfaches Windowsprogramm gibt (und mit den Macros von jEdit hab ichs leider auch nicht hinbekommen...)

        recode und iconv gibt es auch für Windows.