Daniel Thoma: Wozu Unicode?

Beitrag lesen

Hallo Anton,

Wir der Validator dann nicht einen Fehler ausspucken ? Da "<" doch Teil eines html tags ist?

Ja, die Zeichen, die in SGML/XML eine besondere bedeutung haben "'&<> musst Du natürlich immer durch Zeichen oder Entityreferenzen angeben.
Da hilft Dir auch utf-8 nicht, weil das Problem ja in dem Fall nicht ist, dass die Zeichen nicht mit der Kodierung darstellbar sind, sondern dass sie eine spezielle Bedeutung haben.

Also wenn ich mir das als Menge vorstelle. Ein Kreis mit ganz vielen Elementen drin. Im Falle von Unicode alle Zeichen, die es auf der Welt gibt. Im Falle von Western Latin ist der Kreis kleiner. Also die Lateinischen und noch ein paar andere?

Ja.

Also von jedem Pfeil aus der Menge auf eine Zahl ? Oder anders bildlich gedacht eine 2-spaltige Tabelle, in einer Tabelle zahlen in der andere das Zeichen des Zeichensatzes ?

Ja, wobei die Zuordnung natürlich eindeutig sein muss.

Schriftart: Zuordnung von Zeichen zu Symbol.
Wie kann man sich das bildlich vorstellen

Wieder eine Tabelle, die eben diesmal einem Zeichen einem Bildchen zuordnet.
Ein Zeichen ist etwas Abstraktes, um die Zuordnung tatsächlich aufzuschreiben benötigt man natürlich wieder irgend eine Kodierung der Zeichen.
Wenn Du mit Swing (Javaoberfläche) eine Textdatei anzeigen willst, die in iso-... gespeichert ist, wird diese z.B. beim einlesen in utf-16 übersetzt, weil Java utf-16 verwendet um Zeichen zu verarbeiten.
Wenn nun die gewünschte Schriftart die Zeichen in iso-... kodiert, müssen diese erst wieder zurückgewandelt werden, um herauszufinden, welches Zeichen denn nun am Bildschirm auszugeben ist.

Wie kamm man sich die Schriftarten vorstellen. Noch ne Menge mit Symbolen mit Pfeilen zu der Elementen der Menge des Zeichensatzes?

Ja

Doch, wenn der Benutzer die Schriftart nicht installiert hat. Oder?

Ja, ich meinte natürlich, dass Du mit der Speicherung dann kein Problem hast.
Wenn das Zeichen beim Benutzer nicht darstellbar ist, kannst Du natürlich nichts machen.

Grüße

Daniel