Sven Rautenberg: ASP + HTML in Russisch??

Beitrag lesen

Moin!

Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
Also z.B. iso-8859-5 (IIRC) oder UTF-8
ich brauche kyrillische zeichen oft nur zeilenweise. gibt es dafür ne elegante lösung?

Unicode-Entities sind eine tolle Lösung für sowas.

Ӓ (was auch immer das für ein Zeichen ist - aber so gehts zumindest).

Aber weil das je Zeichen mindestens 6 Byte (dreistellige Dezimalzahl plus &, # und ;) sind, ist es uneffektiv, wenn man längere Texte hat.

UTF-8 hat den Vorteil, dass man ALLE Zeichen dieser Welt (naja, zumindest die, die in Unicode drin sind) gleichzeitig verwenden kann.

ISO-8859-5 bietet, dafür immer als 1-Byte-Zeichen, nur einen Ausschnitt an Zeichen an, und man muß für die Ausgabe anderer Zeichen wieder auf Unicode-Entities zurückgreifen. Besonders problematisch ist es mit Formularen, denn ein eingegebenes Zeichen, was sich nicht mit dem gewünschten Zeichensatz codieren läßt, kann nicht übermittelt werden. Der "gewünschte Zeichensatz" eines Formulars ist dabei von Browser zu Browser auch noch unterschiedlich. Man kann "accept-charset" angeben. Läßt man es weg, gilt oft (hängt vom Browser ab) der Charset des Dokuments. Manche Browser wandeln uncodierbare Zeichen einfach in Unicode-Entities, wobei man diese dann nicht mehr von manuell eingegebenen Unicode-Entities unterscheiden kann. Andere Browser senden ein Fragezeichen. Alle Browser außer Opera senden keinerlei Information über den benutzten Zeichensatz. Aber alle wenden sie zum Glück UTF-8 an, wenn es gewünscht ist - und damit kann man ja alle Zeichen codieren.

- Sven Rautenberg