Nadja: Copyright in XML

Hallöchen :)

Wie kann ich das Copyrightzeichen © innerhalb einer XML-Datei kodieren, damit es im Browser angezeigt wird?

Als Zeichensatz muss ich UTF-8 verwenden. Funktioniert das überhaupt?

Liebe Grüße,
Nadja

--
system.exit(0);
  1. Copyrightzeichen © innerhalb einer XML-Datei kodieren
    Als Zeichensatz muss ich UTF-8 verwenden.

    Nadja,
    UTF-8 ist kein Zeichensatz, sondern eine Zeichencodierung.

    Du verwendest "©" im Quelttext und speicherst das Dokument UTF-8-codiert. Was ist dein Problem?

    Live long and prosper,
    Gunnar

    --
    „Weisheit ist nicht das Ergebnis der Schulbildung, sondern des lebenslangen Versuchs, sie zu erwerben.“ (Albert Einstein)
    1. Hallöchen :)

      Was ist dein Problem?

      Dass das Zeichen so dargestellt wird: �

      Liebe Grüße,
      Nadja

      --
      system.exit(0);
      1. Tach,

        Dass das Zeichen so dargestellt wird: �

        dann ist das Anzeigeprogramm nicht UTF-8 fäöhig, oder die verwendete Schriftart enthält das Zeichen nicht.

        mfg
        Woodfighter

        1. Hallöchen :)

          dann ist das Anzeigeprogramm nicht UTF-8 fäöhig, oder die verwendete Schriftart enthält das Zeichen nicht.

          Hm... Denke nicht, dass der Firefox 1.5 dieses Zeichen im XML-Baum nicht anzeigen kann...

          Liebe Grüße,
          Nadja

          --
          system.exit(0);
          1. Tach,

            Hm... Denke nicht, dass der Firefox 1.5 dieses Zeichen im XML-Baum nicht anzeigen kann...

            was zeigt denn Firefox in den Seiteninformationen als Zeichenkodierung an?

            mfg
            Woodfighter

            1. Hallöchen :)

              was zeigt denn Firefox in den Seiteninformationen als Zeichenkodierung an?

              Unicode (UTF-8) :-/

              Liebe Grüße,
              Nadja

              --
              system.exit(0);
        2. Tach,

          Dass das Zeichen so dargestellt wird: �

          dann ist das Anzeigeprogramm nicht UTF-8 fäöhig, oder die verwendete Schriftart enthält das Zeichen nicht.

          Nein, wenn die Schriftart das Zeichen nicht hätte, käme ein Kasten oder ein Fragezeichen. Das hier gezeigte Zeichen ist extra für falsche Codierungen vorgesehen:
          REPLACEMENT CHARACTER: used to replace an incoming character whose value is unknown or unrepresentable in Unicode
          Quelle: http://www.unicode.org/charts/PDF/UFFF0.pdf

          Das bedeutet, daß die Datei zwar als Unicode gelesen wird, aber das Bytemuster paßt einfach nicht - sprich: Die Datei wurde nicht als Unicode gespeichert (wahrscheinlich ANSI).

          Viele Grüße vom Længlich

          1. Tach,

            Nein, wenn die Schriftart das Zeichen nicht hätte, käme ein Kasten oder ein Fragezeichen.

            also hier sehe ich ein Fragezeichen, im Büro ein Kästchen, aber danke für die Aufklärung war mir bisher nicht bekannt.

            mfg
            Woodfighter

            1. Ahoj!

              Nein, wenn die Schriftart das Zeichen nicht hätte, käme ein Kasten oder ein Fragezeichen.

              also hier sehe ich ein Fragezeichen, im Büro ein Kästchen, aber danke für die Aufklärung war mir bisher nicht bekannt.

              Dann hat die bei Dir verwendete Schriftart wahrscheinlich dieses Spezialsymbol nicht. ;-)
              Lustig; daran habe ich gar nicht gedacht, daß das passieren könnte...

              Viele Grüße vom Længlich

      2. echo $begrüßung;

        Was ist dein Problem?

        Dass das Zeichen so dargestellt wird: �

        Vermutlich ist das Dokument nicht UTF-8-kodiert gespeichert. Welche Bytefolge zeigt denn ein Hexeditor an?

        Es kann auch sein, dass der Server eine falsche Zeichensatzangabe sendet. Wird es richtig angezeigt, wenn die Zeichensatz-Einstellung (ISO-8859-1 und UTF-8) des Browsers umgestellt wird testen wird reichen?

        echo "$verabschiedung $name";

        1. Hallöchen :)

          echo $begrüßung;

          Was ist dein Problem?

          Dass das Zeichen so dargestellt wird: �

          Vermutlich ist das Dokument nicht UTF-8-kodiert gespeichert. Welche Bytefolge zeigt denn ein Hexeditor an?

          Höh? Hexeditor??
          Kannst du mir ein Beispiel nennen, stehe da gerade irgendwie auf dem Schlauch :(

          Liebe Grüße,
          Nadja

          --
          system.exit(0);
          1. echo $begrüßung;

            Was ist dein Problem?

            Dass das Zeichen so dargestellt wird: �

            Vermutlich ist das Dokument nicht UTF-8-kodiert gespeichert. Welche Bytefolge zeigt denn ein Hexeditor an?

            Höh? Hexeditor??
            Kannst du mir ein Beispiel nennen, stehe da gerade irgendwie auf dem Schlauch :(

            Das kommt auf dein System an. Unter Windows kann man Ultraedit nehmen, unter Linux beispielsweise den mc (Midnight Commander). Du öffnest die Datei und schaltest auf Hex-Ansicht um.
            Siehst du dann an der Stelle des © ein Byte A9 oder zwei Bytes C2 A9?

            echo "$verabschiedung $name";

            1. Hallöchen :)

              Das kommt auf dein System an. Unter Windows kann man Ultraedit nehmen, unter Linux beispielsweise den mc (Midnight Commander). Du öffnest die Datei und schaltest auf Hex-Ansicht um.
              Siehst du dann an der Stelle des © ein Byte A9 oder zwei Bytes C2 A9?

              Danke für die Info!
              Bei mir steht an der Stelle A9.

              Liebe Grüße,
              Nadja

              --
              system.exit(0);
              1. echo $begrüßung;

                Das kommt auf dein System an. Unter Windows kann man Ultraedit nehmen, unter Linux beispielsweise den mc (Midnight Commander). Du öffnest die Datei und schaltest auf Hex-Ansicht um.
                Siehst du dann an der Stelle des © ein Byte A9 oder zwei Bytes C2 A9?

                Danke für die Info!
                Bei mir steht an der Stelle A9.

                Dann ist das kein UTF-8-kodierter Wert, denn das wäre die 2-Byte-Variante gewesen. Dein Dokument ist ISO-8859-1-kodiert. (Es könnten auch noch andere ISO-8859-Werte sein, aber -1 ist hierzulande am wahrscheinlichsten.)

                echo "$verabschiedung $name";

                1. Hallöchen :)

                  Dann ist das kein UTF-8-kodierter Wert, denn das wäre die 2-Byte-Variante gewesen. Dein Dokument ist ISO-8859-1-kodiert. (Es könnten auch noch andere ISO-8859-Werte sein, aber -1 ist hierzulande am wahrscheinlichsten.)

                  Aber wie kann das sein, wenn ich die als folgende Zeile angegeben habe:
                  <?xml version="1.0" encoding="UTF-8" ?>

                  :(

                  Liebe Grüße,
                  Nadja

                  --
                  system.exit(0);
                  1. Tach,

                    Aber wie kann das sein, wenn ich die als folgende Zeile angegeben habe:
                    <?xml version="1.0" encoding="UTF-8" ?>

                    das gibt nur an wie das Encoding der Datei sein sollte, der Editor muß die Datei trotzdem auch als UTF-8 abspeichern.

                    mfg
                    Woodfighter

                    1. Tach,

                      das gibt nur an wie das Encoding der Datei sein sollte, der Editor muß die Datei trotzdem auch als UTF-8 abspeichern.

                      verdammt, zu früh abgeschickt:

                      das gibt nur an wie das Encoding der Datei ist, damit der Client nicht raten muß, der Editor muß die Datei trotzdem auch als UTF-8 abspeichern.

                      mfg
                      Woodfighter

                      1. Hallöchen :)

                        das gibt nur an wie das Encoding der Datei ist, damit der Client nicht raten muß, der Editor muß die Datei trotzdem auch als UTF-8 abspeichern.

                        Achso... Dann sollte ich wohl einen anderen Editor verwenden, denn beim Crimson Editor habe ich diese Funktion noch nicht gefunden.

                        Liebe Grüße,
                        Nadja

                        --
                        system.exit(0);
                        1. Hallo,

                          Achso... Dann sollte ich wohl einen anderen Editor verwenden, denn beim Crimson Editor habe ich diese Funktion noch nicht gefunden.

                          Sorry, das ich jetzt ein *RFTM!* sage, aber Crimson kann das: "Other useful features: support Unicode & UTF-8 encoding"

                          Grüße
                          Thomas

                          1. Hallöchen :)

                            Sorry, das ich jetzt ein *RFTM!* sage, aber Crimson kann das: "Other useful features: support Unicode & UTF-8 encoding"

                            Oh... Danke *schäm*

                            Hab das jetzt mit UE32 gemacht und siehe da: Es funktioniert *sich verneigt und sich bedankt*!!

                            Liebe Grüße,
                            Nadja

                            --
                            system.exit(0);
                  2. echo $begrüßung;

                    Dann ist das kein UTF-8-kodierter Wert, denn das wäre die 2-Byte-Variante gewesen. Dein Dokument ist ISO-8859-1-kodiert. (Es könnten auch noch andere ISO-8859-Werte sein, aber -1 ist hierzulande am wahrscheinlichsten.)

                    Aber wie kann das sein, wenn ich die als folgende Zeile angegeben habe:
                    <?xml version="1.0" encoding="UTF-8" ?>

                    Der nachfolgende Text ist Englisch: Tu fais une erreur.

                    Was? Ich hab gar nicht englisch geschrieben? Na sowas...

                    echo "$verabschiedung $name";

  2. Hallo,

    Wie kann ich das Copyrightzeichen © innerhalb einer XML-Datei kodieren, damit es im Browser angezeigt wird?

    Als Zeichensatz muss ich UTF-8 verwenden. Funktioniert das überhaupt?

    Entweder wie Gunnar es gesagt hat, oder mit &#169; bzw. &#xA9;

    Grüße
    Thomas