Die allwissende Müllhalde: Euro/Characterset Probleme mit dem IE mac

Beitrag lesen

Was genau spricht denn gegen die althergebrachten Umschreibungen à la ä und €?

Dagegen spricht, dass die EINGABE eines Euro-Symbols durch einen Nutzer dann als Sonderzeichen gespeichert wird. Den Nutzer können wir schlecht bitten, HTML-Entitäten einzugeben.

Vollkommen richtig. Aber vielleicht gibt es doch eine Möglichkeit, den vom Benutzer eingesetzten Zeichensatz _eindeutig_ zu identifizieren und anschließend die HTML-Ausgabe entsprechend mit Umschreibungen zu gestalten.

Falls die Eingaben über <form>-Elemente gemacht werden, kann man über das Attribut accept-charset Zeichensätze vorgeben (etwa "utf-8 iso-8859-15 iso-8859-1", siehe http://www.w3.org/TR/html401/interact/forms.html#h-17.3). Achte beim Einlesen der Formulardaten auf im aktuellen Zeichensatz nicht vorhandene Codes (Eurosymbol bei iso-8859-1), meistens kommen die in der Form "&#12345;".
Für Zeichensatzkonvertierungen selbst steht übrigens die iconv-Bibliothek zur Verfügung, auch in einigen Skriptsprachen (http://www.gnu.org/software/libiconv/).

Die Verwendung des richtigen Zeichensatzes im Web ist ein einziges Problem; die vielen als iso-8859-1 gekennzeichneten Eurosymbole an Position 128, die eigentlich aus windows-1252 stammen, sprechen für sich. Sämtliche großen Browser haben deshalb Kompatibilitätsmodi eingebaut, damit es nicht gar so auffällt.

"To apply a character set to an entire document, you must insert the meta element before the body element. For clarity, it should appear as the first element after head, so that all browsers can translate the meta element before the document is parsed. "

<meta> gehört meines Erachtens nach nur in den <head>-Bereich und der wiederum gehört sinnigerweise vor den <body>-Bereich. Die obige Erklärung ist insofern zwar richtig, aber auch etwas "um die Ecke".