BLÖDLeser: Besser "Ö" oder "Ö" und "charset=UTF-8"?

Hallo.
Ist es besser, wenn ich im Kopf meiner Seite UTF-8 als Charset angeben und einfach "Ö" schreibe, oder ist es besser, wenn ich die Entity "Ö" benutze? (In Bezug auf Darstellbarkeit aller Browser)

  1. Hallo.
    Ist es besser, wenn ich im Kopf meiner Seite UTF-8 als Charset angeben und einfach "Ö" schreibe, oder ist es besser, wenn ich die Entity "Ö" benutze? (In Bezug auf Darstellbarkeit aller Browser)

    Liste aller Sonderzeichen nach iso 8559
    Damit HTML-Dateien problemlos zwischen verschiedenen Rechnerwelten ausgetauscht werden können, setzt die Sprache HTML auf einem international genormten Zeichensatz auf: dem Zeichensatz ISO 8859-1 (auch ISO Latin-1 genannt). Dieser Zeichensatz enthält 256 Zeichen. Davon sind die ersten 128 identisch mit dem klassischen 7-Bit-ASCII-Zeichensatz. Die zweiten 128 Zeichen beinhalten dagegen etliche Sonderzeichen und Buchstaben für bestimmte Sprachen. Die Zeichen mit den Dezimalwerten 128 bis 159 werden vom Latin-1-Zeichensatz jedoch derzeit offiziell nicht benutzt. Deshalb werden sie in der folgenden Liste auch nicht dargestellt.
    Wenn Sie in Ihren HTML-Dateien erlaubte Sonderzeichen verwenden wollen, maskieren Sie diese Zeichen so wie in der Tabelle weiter unten angegeben. Dann wird jeder WWW-Browser auf der Welt Ihre HTML-Datei korrekt anzeigen (vorausgesetzt, die eingestellte Schrift unterstützt das Zeichen).

    Sonderzeichen kodieren Sie am einfachsten durch ein kaufmännisches Und (&), ein Gatter (#) und den bereffenden Zahlenwert im Zeichensatz. Die folgende Liste enthält alle Sonderzeichen des ISO Latin-1- Zeichensatzes und deren Kodierung im Text einer HTML-Datei. Buchstaben verschiedener Landessprachen können Sie auch mit einer entsprechenden Zeichenfolge umschreiben. Bei Buchstaben, wo dies möglich ist, wird die entsprechende Zeichenfolge angegeben.

    Quelle: http://www.rzuser.uni-heidelberg.de/~x02/html/tcad.htm

    selfhtml meint dazu:
    Ein WWW-Browser muss jedoch HTML 4.0 interpretieren, und auch dann kann er nur solche Zeichen darstellen, für die er eine geeignete Schriftart vorfindet.

    1. Hallo ìtte,

      Quelle: http://www.rzuser.uni-heidelberg.de/~x02/html/tcad.htm

      Du zitierst aus einem 10 Jahre alten Dokument, das doch ziemlich aus der Mode ist. Hier ist ein Update.
      Heute kann man getrost Umlaute ohne Umschreibung verwenden und zwar sowohl unter ISO 8859-1, als auch UTF-8. Browser, die das falsch darstellen, sind ausgestorben.

      Gruß,

      Dieter

      1. aber grundsätzlich wäre es doch sicherer, wenn man die unmlaute und sonderzeichen umschreibt, da sie so sicher nicht falsch dargestellt werden können sollten.
        oder so, im endeffekt wohl vollkommen egal. schreib einfach alles auf englisch, die haben kein äüöß

        1. Hallo ìtte,

          aber grundsätzlich wäre es doch sicherer, wenn man die unmlaute und sonderzeichen umschreibt

          Nein, waere es absolut nicht, lies bitte das Posting von Gunnar.

          Gruß,

          Dieter

      2. Hi!

        Kleine Anmerkung (Erweiterung):

        unter ISO 8859-1

        ISO 8859-1 enthält die westeuropäischen Sonderzeichen, u.a. auch die deutschen Umlaute.
        ISO 8859-15 deckt ebenfalls die deutschen Umlaute ab, enthält aber auch noch das Eurozeichen.

        Schöner Gruß,
        rob

    2. Hi

      [...]

      Quelle: http://www.rzuser.uni-heidelberg.de/~x02/html/tcad.htm

      dir ist schon bewusst, dass die Quelle SelfHTML Version 6.0 (vom 11.03.1997) ist?

      Internationalisierung @SelfHTML: Version 8.1.2 vom 01.03.2007

      SilverSurfer

    3. Hello out there!

      Damit HTML-Dateien problemlos zwischen verschiedenen Rechnerwelten ausgetauscht werden können, setzt die Sprache HTML auf einem international genormten Zeichensatz auf: dem Zeichensatz ISO 8859-1 (auch ISO Latin-1 genannt).

      Nein, das ist falsch.

      „HTML [nutzt] das so genannte Universal Character Set (UCS), einen viel umfangreicheren Zeichensatz, definiert in [ISO10646]. Dieser Standard definiert einen Vorrat von Tausenden von den Völkern der ganzen Welt verwendeten Zeichen.

      Der in [ISO10646] definierte Zeichensatz ist Zeichen für Zeichen äquivalent zu Unicode ([UNICODE]).“ [HTML401 §5.1]

      IIRC interpretiert ein Browser (Tag-Soup-Parser), wenn ihm keinerlei Information über die verwendete Zeichen_codierung_ vorliegt (weder im HTTP-Header noch HTTP-EQUIV-Angabe im Dokument), den Eingabestrom gemäß ISO 8859-1.

      Zwischen Zeichen_satz_ und Zeichen_codierung_ sollte streng unterschieden werden, sonst gibt’s Verwirrung. [</archiv/2007/5/t153210/#m997116>, HTML401 §5.2]

      Zur Frage von BLÖDLeser:

      “It is almost always preferable to use an encoding that allows you to represent the characters in their normal form, rather than using character entities or NCRs.” [QA-ESCAPES]

      s.a. </archiv/2007/3/t148760/#m965601> ff.

      See ya up the road,
      Gunnar

      --
      „Wer Gründe anhört, kommt in Gefahr nachzugeben.“ (Goethe)
      1. Hi,

        „HTML [nutzt] das so genannte Universal Character Set (UCS), einen viel umfangreicheren Zeichensatz, definiert in [ISO10646]. Dieser Standard definiert einen Vorrat von Tausenden von den Völkern der ganzen Welt verwendeten Zeichen.

        Nanana, nicht übertreiben. "von den Völkern der ganzen Erde".

        Oder noch genauer "von den derzeit bekannten Völkern der Art Homo Sapiens der ganzen Erdoberfläche" *)

        *) Morlocks ...

        cu,
        Andreas

        --
        Warum nennt sich Andreas hier MudGuard?
        O o ostern ...
        Fachfragen unaufgefordert per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.