carboneum: Zeichen maskieren in title und meta tags in ISO-8859-2

Hallo,

muss man die Zeichen im title tag und in den meta tags im head maskieren damit die Mitteleuropäischen Buchstaben richtig angezeigt werden?

Es handelt sich um diese Seite:
http://www.novus-web.com/

Ich habe zwar charset=ISO-8859-2 eingegeben, doch bei der meta tag Analyse durch diese Seite:
Meta tag Analyzer
wurden mir die unmaskierten Zeichen nicht richtig angezeigt, doch als ich sie maskiert habe wurde alles korrekt angezeigt.

Doch jetzt stelle ich mir die frage, darf man diese Zeichen (title und meta tags) maskieren? In den meta tags darf ja kein html code stehen.

Werden mir die Buchstaben auch unmaskiert in den Suchergebnissen von google richtig angezeigt?

Mfg. Carboneum

  1. Hi!

    muss man die Zeichen im title tag und in den meta tags im head maskieren damit die Mitteleuropäischen Buchstaben richtig angezeigt werden?

    Nein, ob du eine Ersatzschreibweise oder korrekt kodierte Zeichen direkt notierst, ändert am Ergebnis nichts.

    Es handelt sich um diese Seite:
    http://www.novus-web.com/

    Ich habe zwar charset=ISO-8859-2 eingegeben, doch bei der meta tag Analyse durch diese Seite:
    Meta tag Analyzer
    wurden mir die unmaskierten Zeichen nicht richtig angezeigt, doch als ich sie maskiert habe wurde alles korrekt angezeigt.

    Zwei Möglichkeiten: Du hast was falsch gemacht - die haben was falsch gemacht. Das lässt sich grad nicht entscheiden, da die jetzt im Dokument stehenden NCRs immer richtig erkannt werden.

    Doch jetzt stelle ich mir die frage, darf man diese Zeichen (title und meta tags) maskieren? In den meta tags darf ja kein html code stehen.

    Man darf. Schau in die Referenz. Wenn CDATA unter Inhalt steht, dürfen da auch Entitys und NCRs stehen.

    Werden mir die Buchstaben auch unmaskiert in den Suchergebnissen von google richtig angezeigt?

    Wenn sie zur angegebenen Kodierung passen.

    Lo!

    1. Hallo,

      Schau in die Referenz. Wenn CDATA unter Inhalt steht, dürfen da auch Entitys und NCRs stehen.

      Sicher?? Ich dachte, das sei nur bei PCDATA (Parsed Character Data) erlaubt, während CDATA nur reiner, nicht-interpretierter Text ist ...

      So long,
       Martin

      --
      They say hard work never killed anyone, but I figure, why take the risk?
        (Ronald Reagan, US-Präsident 1981-1989)
      Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
      1. Hi!

        Schau in die Referenz. Wenn CDATA unter Inhalt steht, dürfen da auch Entitys und NCRs stehen.
        Sicher?? Ich dachte, das sei nur bei PCDATA (Parsed Character Data) erlaubt, während CDATA nur reiner, nicht-interpretierter Text ist ...

        Weil ich es noch aufgeschlagen hatte, hier die Stelle der HTML-Spec, der ich das entnahm:

        CDATA is a sequence of characters from the document character set and may include character entities. User agents should interpret attribute values as follows:

        • Replace character entities with characters, [...]

        Auch href vom a-Element ist CDATA, und dort wird dir die Verwendung von &amp; geläufig sein.

        Lo!

        1. @@dedlfix:

          nuqneH

          Schau in die Referenz. Wenn CDATA unter Inhalt steht, dürfen da auch Entitys und NCRs stehen.
          Sicher??

          Na klar darf da die Zeichenkette "&auml;" stehen. ;-) Sie wird aber nicht zu 'ä' aufgelöst. Im Gegensatz zu PCDATA-Inhalt.

          Übrigens haben die meisten Elemente in HTML 4.01 andere Elemente oder PCDATA als Inhalt. Zu CDATA fallen mir nur 'script' und 'style' ein.

          Weil ich es noch aufgeschlagen hatte, hier die Stelle der HTML-Spec, der ich das entnahm:

          CDATA is a sequence of characters from the document character set and may include character entities. User agents should interpret attribute values as follows:

          • Replace character entities with characters, [...]

          Nicht übersehen: Das gilt für Attributwerte, nicht für Elementinhalte.

          Qapla'

          --
          Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
          (Mark Twain)
          1. Hi!

            Schau in die Referenz. Wenn CDATA unter Inhalt steht, dürfen da auch Entitys und NCRs stehen.
            Sicher??
            Na klar darf da die Zeichenkette "&auml;" stehen. ;-) Sie wird aber nicht zu 'ä' aufgelöst. Im Gegensatz zu PCDATA-Inhalt.

            Du verwechselst da was (im Sinne der von mir gemeinten Aussage und der dazu verlinkten Stellen).

            Übrigens haben die meisten Elemente in HTML 4.01 andere Elemente oder PCDATA als Inhalt. Zu CDATA fallen mir nur 'script' und 'style' ein.

            Das Wort Inhalt steht in der verlinkten Referenz nur bei den Attributen. Der Inhalt, den du meinst, ist dort als "Kindelemente" beschriftet.

            Weil ich es noch aufgeschlagen hatte, hier die Stelle der HTML-Spec, der ich das entnahm:

            CDATA is a sequence of characters from the document character set and may include character entities. User agents should interpret attribute values as follows:

            • Replace character entities with characters, [...]

            Nicht übersehen: Das gilt für Attributwerte, nicht für Elementinhalte.

            Genau darum geht's doch. (Außer bei Title, da ist PCDATA Kindelement. Aber PCDATA im Sinne der HTML4-Spec ist nicht in ihr erläutert.)

            Mir scheint, dass die HTML4-Spec keinen Unterschied zwischen CDATA und PCDATA sieht. Oder aber CDATA unterscheidet sich zwischen Element- und Attribut-Inhalt. Bitte um Aufklärung.

            Lo!

  2. @@carboneum:

    nuqneH

    muss man die Zeichen im title tag und in den meta tags im head maskieren damit die Mitteleuropäischen Buchstaben richtig angezeigt werden?

    Nein. „Es ist fast immer besser, eine Zeichencodierung zu benutzen, die es erlaubt, die Zeichen in ihrer normalen Form zu verwenden, anstatt Zeichen-Entity-Referenzen oder numerische Zeichenreferenzen zu verwenden.

    Die Verwendung von Escapes macht den Quelltext schlechter lesbar und schwerer zu pflegen und kann auch die Dateigröße beträchtlich erhöhen.“ [qa-escapes]

    Verwende UTF-8 als Zeichencodierung! [qa-changing-encoding]

    BTW: Tags? Deppenleerzeichen?

    Das Sprachumschaltmenü würde ich auch nochmal überarbeiten. Wenn jemand auf Ungarisch oder Englisch umschalten muss, wird er kaum „mađarski“ bzw. „engleski“ verstehen. Das sollte in der Zielsprache beschriftet sein: „magyar“, „English“.

    (Und man sollte möglichst gar nicht umschalten müssen, sondern gleich die richtige Sprachversion präsentiert bekommen. [qa-when-lang-neg])

    Und was haben die Flaggen da zu suchen? Flaggen stehen nicht für Sprachen.

    Qapla'

    --
    Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
    (Mark Twain)