Anton: Wozu Unicode?

Beitrag lesen

Hallo,

Sicher, wieso sollten sie nicht.

Wenn ich nun diesen Text in der utf-8 kodierten DB gespeichert habe:

"Anton sagte zu dem Schüler: 3 ist kleiner als 4. Geschrieben wird das 3<4 ..."

Wir der Validator dann nicht einen Fehler ausspucken ? Da "<" doch Teil eines html tags ist?

Zeichensatz: Der gesammte Zeichenvorrat, den man im Dokument verwenden kann. Direkt oder indirekt über Zeichenreferenzen.

Also wenn ich mir das als Menge vorstelle. Ein Kreis mit ganz vielen Elementen drin. Im Falle von Unicode alle Zeichen, die es auf der Welt gibt. Im Falle von Western Latin ist der Kreis kleiner. Also die Lateinischen und noch ein paar andere?

Kodierung: Die Abbildung von Zeichen auf Bytes und umgekehrt

Also von jedem Pfeil aus der Menge auf eine Zahl ? Oder anders bildlich gedacht eine 2-spaltige Tabelle, in einer Tabelle zahlen in der andere das Zeichen des Zeichensatzes ?

Schriftart: Zuordnung von Zeichen zu Symbol.

Wie kan man sich das bildlich vorstellen

Ob ein Zeichen dargestellt wird, hat also nichts mit dem Zeichensatz oder gar der Kodierung zu tun, sondern allein mit den installierten Schrifftarten. Ob Du ein deutsches Dokument in iso-... oder utf-8 codierst, ist also gleichgültig.

Wie kamm man sich die Schriftarten vorstellen. Noch ne Menge mit Symbolen mit Pfeilen zu der Elementen der Menge des Zeichensatzes?

Unicode zu verwenden, wird eigentlich erst dann interessant, wenn man mehrere Sprachen in einem Dokument verwenden will oder wenn Seiten dynamisch erzeugt und sich nicht auf einen bestimmten Zeichensatz festlegen will.

Dachte ich mir und nun ziehe ich es auch durch.

Speicherst Du Deine Inhalte z.B. in utf-8 in einer Datenbank ab, bekommst Du keine Schwierigkeiten, wenn Du doch mal irgend ein ungewöhnliches Zeichen benötigst.

Doch, wenn der Benutzer die Schriftart nicht installiert hat. Oder?