Moin,
view-source:http://www.teamone.de/selfaktuell/forum/?m=132537&t=25278? [1]
Bleibt das Problem, warum mein Client diverse der Lettern als Fragezeichen anzeigt. Gibt es günstigere Entitäten, etwa im Bereich &8xxx;?
nope, die meisten Entities bestehen einfach aus & + # + Unicodenummer + ;. Ein paar werden anders codiert, hauptsaechlich aus dem ISO-8859-1-Bereich.
Abhilfe schafft evtl. das explizite Umschalten auf UTF-8 beim Client (bei mir gehts jedenfalls).
Ich habe geplant, das ganze modular aufzubauen. In dem Fall würde mein "Wort-Server" nur den reinen Text liefern; und der Client (das Script) darf das dann korrekt kodieren (je nach Bedarf). Vielleicht überlege ich mir sogar einen geschickten Objekttyp, in dem diese Kodierung mit enthalten ist... :-)
ich schlage nochmals eine einheitliche Unicodecodierung vor, damit waerst du aus dem Schneider ;) Gerade bei einem solchen Internationalitaetsgrad...
n.d.p.