Johannes Weißl: Unicode, benannte Zeichen

Hallo,

ich frage mich, warum auf einer Seite, die xhtml1.1-konform und im
unicode-zeichensatz ist, nur bestimmte zeichen maskiert werden müssen.
Konkret: Warum muss das "ä", aber nicht das "a" maskiert werden ?!

(Im Validator erzeugen Sonderzeichen in einer UTF-8 Seite eine Fehlermeldung)

Und nochwas:
Sollte das Anführungszeichen (") wirklich auch maskiert werden ?!
Der Validator bemängelt das nämlich nicht ...

Danke im Vorraus,
Johannes Weißl

  1. Hallo Johannes,

    ich frage mich, warum auf einer Seite, die xhtml1.1-konform und im
    unicode-zeichensatz ist, nur bestimmte zeichen maskiert werden müssen.
    Konkret: Warum muss das "ä", aber nicht das "a" maskiert werden ?!

    Das 'ä' muss nicht maskiert werden, wenn Du die Datei korrekt als
    Unicode-Datei abspeicherst. Dazu benötigst Du einen Editor mit der
    entsprechenden Funktionalität. Unter Windows werden die Dateien meist
    als windows-1252 und unter UNIX oft als iso-8859-1 abgespeichert.

    Du kannst aber auch problemlos XHTML1.1-konforme Dateien schreiben,
    die nicht in Unicode verfasst sind:

    <?xml version="1.0" encoding="windows-1252"?>

    http://selfhtml.teamone.de/xml/regeln/xmldeklaration.htm#zusatzangaben

    Sollte das Anführungszeichen (") wirklich auch maskiert werden ?!

    AFAIK nur in Attributwerten. Aber es ist sinnvoll, es immer zu
    maskieren, da muss man nicht immer daran denken.

    Grüße,

    Christian

    --
    Ich bitte darum, dass ein Themenbereich (BARRIEREFREIHEIT) eingerichtet wird.
    1. Hallo Christian,

      Das 'ä' muss nicht maskiert werden, wenn Du die Datei korrekt als
      Unicode-Datei abspeicherst. Dazu benötigst Du einen Editor mit der
      entsprechenden Funktionalität. Unter Windows werden die Dateien meist
      als windows-1252 und unter UNIX oft als iso-8859-1 abgespeichert.

      Danke ... ich hab mein System (Debian) auf UTF-8 umgestellt, und
      jetzt funktioniert es auch ohne Maskierung.

      Du kannst aber auch problemlos XHTML1.1-konforme Dateien schreiben,
      die nicht in Unicode verfasst sind:

      <?xml version="1.0" encoding="windows-1252"?>

      Ich weiß, aber ich bin von der Unicode-Idee irgendwie begeistert
      und bin der Ansicht, dass im Internet nur noch dieser
      Zeichensatz verwendet werden sollte.

      Sollte das Anführungszeichen (") wirklich auch maskiert werden ?!

      AFAIK nur in Attributwerten. Aber es ist sinnvoll, es immer zu
      maskieren, da muss man nicht immer daran denken.

      Werd ich machen.

      Danke für die schnelle Antwort,
      Johannes Weißl

  2. Hallo Johannes,

    Tut mir leid, dass deine Antwort auf Christian
    Seiler verschwunden ist. Ich habe gerade ein
    Update der Software gemacht :)

    ich frage mich, warum auf einer Seite, die
    xhtml1.1-konform und im unicode-zeichensatz
    ist, nur bestimmte zeichen maskiert werden
    müssen.

    Was heisst fuer dich 'maskiert'?

    (Im Validator erzeugen Sonderzeichen in einer
    UTF-8 Seite eine Fehlermeldung)

    Dann ist die aller vorraussicht nach doch nicht
    im UTF-8-Zeichensatz gespeichert :)

    Und nochwas:
    Sollte das Anführungszeichen (") wirklich auch
    maskiert werden ?! Der Validator bemängelt das
    nämlich nicht ...

    Es *muss* nur in Attribut-Werten mit "
    maskiert werden.

    Gruesse,
     CK

    1. Hallo Christian,

      Tut mir leid, dass deine Antwort auf Christian
      Seiler verschwunden ist. Ich habe gerade ein
      Update der Software gemacht :)

      Macht nichts ... mittlerweile hab ich eh schon auf UTF-8 umgestellt,
      was ich in der neuen Fassung meiner Antwort unterbringen konnte.

      Was heisst fuer dich 'maskiert'?

      hmm ... vielleicht ist "maskieren" das falsche Wort. Ich meine das
      ersetzen von Zeichen durch benannte Zeichen oder numerische
      Unicode-Notationen.

      Dann ist die aller vorraussicht nach doch nicht
      im UTF-8-Zeichensatz gespeichert :)

      Stimmt ... irgendwie war das mein Denkfehler.

      Es *muss* nur in Attribut-Werten mit "
      maskiert werden.

      Ok ... naja, es bereitet auch nicht soo viel Mühe, es überall zu
      maskieren ... dann werd ich das in Zukunft tun.

      cu,
      Johannes Weißl

    2. Hi,

      Und nochwas:
      Sollte das Anführungszeichen (") wirklich auch
      maskiert werden ?! Der Validator bemängelt das
      nämlich nicht ...
      Es *muss* nur in Attribut-Werten mit "
      maskiert werden.

      Und das nur dann, wenn " als Begrenzer des Attribut-Werts benutzt wird.
          alt='Ein "netter" Text'
      ist zulässig, aber
          alt="ein "netter" Text"
      muß als
          alt="ein "netter" Text"
      geschrieben werden.
      cu,
      Andreas

      --
      Der Optimist: Das Glas  ist halbvoll.  - Der Pessimist: Das Glas ist halbleer. - Der Ingenieur: Das Glas ist doppelt so groß wie nötig.