Gunnar Bittersmann: Wozu Unicode?

Beitrag lesen

Wenn ich nun diesen Text in der utf-8 kodierten DB gespeichert habe:

Anton,
Was ist der DB steht, ist dem Validator egal. Den intereesiert nur, was als HTML rausgeht.

"Anton sagte zu dem Schüler: 3 ist kleiner als 4. Geschrieben wird das 3<4 ..."
Wir der Validator dann nicht einen Fehler ausspucken ? Da "<" doch Teil eines html tags ist?

Wird er. Das < muss maskiert werden: http://de.selfhtml.org/html/allgemein/zeichen.htm#html_eigene

Und das ist unabhängig davon, ob du in UTF-8, ISO 8859-1 oder sonstwas codierst.

Also wenn ich mir das als Menge vorstelle. Ein Kreis mit ganz vielen Elementen drin. Im Falle von Unicode alle Zeichen, die es auf der Welt gibt. Im Falle von Western Latin ist der Kreis kleiner. Also die Lateinischen und noch ein paar andere?

Genau. Die mit ISO 8859-1 codierbaren Zeichen sind eine Teilmenge des Unicode-Zeichensatzes. Deren Mächtigkeit ist 256, wobei das nicht alles darstellbare Zeichen sind, sondern auch Steuerzeichen.

Die mit ISO 8859-2 codierbaren Zeichen sind eine andere Teilmenge (der Mächtigkeit 256) des Unicode-Zeichensatzes. Ebenso -3, -4, ...

Die Schnittmenge dieser Teilmengen ist nicht leer, sondern umfasst auf jeden Fall die Zeichen von 0 bis 127. http://de.selfhtml.org/inter/zeichensaetze.htm

Kodierung: Die Abbildung von Zeichen auf Bytes und umgekehrt

Umgekehrt wär dann Decodierung.

Also von jedem Pfeil aus der Menge auf eine Zahl ? Oder anders bildlich gedacht eine 2-spaltige Tabelle, in einer Tabelle zahlen in der andere das Zeichen des Zeichensatzes ?

Ja.

Schriftart: Zuordnung von Zeichen zu Symbol.

Wie kan man sich das bildlich vorstellen

http://de.selfhtml.org/inter/sprache.htm#schriftarten, am besten mal die ganze Seite lesen.

Gunnar

--
"(Der Student) kann sich so völlig dem hingeben, was er naiv für die Computerwissenschaft hält, also der bloßen Verfeinerung seiner Programmiertechniken, daß er sich auf diese Weise effektiv daran hindert, etwas wirklich Wesentliches zu studieren."
(Joseph Weizenbaum in "Die Macht der Computer und die Ohnmacht der Vernunft")