Hi,
Also können alle Entities � - ÿ in ISO-charsets umgewandelt werden. Alle Entities > ÿ können nur in UTF-charsets umgewandelt werden.
Nein.
Die numerischen Zeichenreferenzen in HTML (SGML) beziehen sich IMMER auf Unicode.
Denn wenn es so wäre, daß alle Entities von � bis ÿ in ISO-8859-x charsets umgewandelt werden könnten, wären alle ISO-8859-x charsets identisch, da sie ja alle die Unicode-Zeichen 0 bis 255 enthielten.
Die in den verschiedenen ISO-charsets enthaltenen Zeichen sind aber nicht immer die Zeichen, die im Unicode die Codes 0 bis 255 haben.
Z.B. sind die in ISO-8859-5 enthaltenen kyrillischen Zeichen im Unicode ab Code 1024 zu finden.
z.B. Zeichen Б (Б) läßt sich in ISO-8859-5 codieren (es hat dort den Code 177, wenn ich das richtig sehe),
z.B. Zeichen ± (±) läßt sich in ISO-8859-5 nicht darstellen.
Außerdem sind in HTML einige der Zeichen mit Unicodes zwischen 0 und 255 gar nicht zulässig (z.B.  bis Ÿ).
Es ist so, daß aus dem gesamten Unicode-Bereich eine Teilmenge von max. 256 Zeichen in eine ISO-8859-x Kodierung überführt werden kann.
Welche Teilmenge das ist, hängt von der konkreten ISO-8859-x ab.
AFAIR sind auch noch die ersten 128 Zeichen der ISO-8859-x Charsets jeweils identisch (nämlich mit den Zeichen 0 bis 128 des Unicodes, die wiederum 7-Bit-ASCII entsprechen).
cu,
Andreas
Warum nennt sich Andreas hier MudGuard?
Schreinerei Waechter
Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.