dedlfix: charset=ISO-8859-2 aktivieren

Beitrag lesen

Hi!

Für einen Gelegenheits-HTML-er wie mich ist es immer wieder überraschend, wie kompliziert sich eine eigentlich einfach vorgestellte Sache erweist.

Nunja. Man kann nicht immer von vornherein eine einfache allumfassende Lösung aufsetzen, wenn einen unter anderem Sachzwänge wie geringe Speicherausstattung, Prozessorleistung und Grafikauflösung in früheren Tagen zur Entscheidung geführt haben, sie auf eine für den eigenen Kulturkreis ausreichende zu beschränken - von der politischen Teilung der Welt mal ganz abgesehen.

Das Ergebnis ist nun, dass du viele Zeichensätze hast und die damit einhergehenden Probleme irgendwie gelöst werden müssen. Ein Ansatz war Unicode. Zwischenschritte waren Erweiterungen des Vorhandenen, was sich aufgrund der Platzprobleme (256 Zeichen) nur sprachabhängig gestalten ließ oder ganz andere Lösungen benötigte, wie für die Asiaten mit ihren "viel zu vielen" Zeichen.

Unicode ist da schon ein gewaltiger Fortschritt, aber bis er zum alleinigen Standard geworden ist, fließt noch sehr viel Wasser die Flüsse entlang, wenn dieses Ziel überhaupt erreicht wird. Bis dahin jedenfalls müssen wir mit dem Chaos leben. Du kannst dich ihm größtenteils entziehen, wenn du für deine eigenen Anwendungen Unicode und darauf beruhende Transformationen (zum Beispiel UTF-8) verwendest. Allerdings ist die Verarbeitung von Unicode/UTF-8 immer noch nicht in allen Systemen gewährleistet, doch für die meisten praktischen Anwendungen ausreichend (zumindest gibt es meist ausreichende Workaroundmöglichkeiten).

Dass man im Hinblick auf Unicode die Nummerischen Zeichenreferenzen in HTML sich auf diesen einen Standard beziehen lässt, ist sehr sinnvoll, kann man doch (wenn man das Prinzip kennt) eindeutig von der Nummer auf das Zeichen schließen, beziehungsweise muss es nur in einer einzigen Liste nachschlagen.

Ich will ein Zeichen von - sagen wir 100000 - anzeigen, also brauche ich eine 6-stellige Dezimalzahl oder in einem anderen Stellenwertsystem mehr oder weniger Stellen - und fertig. So könnte es sein, ist es aber wohl nicht.

So ist es - in Unicode.

Doch es gibt noch weitere Beschränkungen, für die man Umgehungen benötigt. Eine wichtige ist die Anzahl der Tasten auf einer Tastatur. Die individuellen Notwendigkeiten einer Sprache einerseits und die eingeschränkten technischen Möglichkeiten andererseits haben hier auch zu ziemlich unterschiedlichen Lösungen geführt. Ebensowenig wie es sinnvoll ist, die Tastatur auf 11 Tasten zu beschränken (10 Ziffern und Enter), um die Zeichen über ihre Unicode-Position einzugeben, ist es sinnvoll die Zeichen anhand ihrer Unicode-Position in ein Dokument zu schreiben. Das eine ist umständlich zu bedienen, das andere umständlich zu lesen.

Lo!