Hallo,
nein, du sollst das Zeichen U+201A notieren. Sagte ich doch schon. Und Gunnar auch.
Das kann ich mit meinem Gewissen nicht vereinbaren. Das hieße ja, ich würde behaupten, dass der Browser ein x201A ausgibt, wenn er ein x82 kriegt und das ist mit Sicherheit nicht richtig.
doch, das ist ganz bestimmt richtig. HTML basiert grundsätzlich auf Unicode (merke: Unicode, nicht UTF-8!). Damit ist es naheliegend, wenn nicht gar zwangsläufig, dass ein Browser alle HTML-Inhalte (vermutlich sogar *alle* Textinhalte, auch JS oder CSS), die er bekommt, intern in Unicode vorhält.
Es passiert also browserintern genau das, was du nicht glauben magst:
* Browser erhält in den Eingabedaten für ein ISO-8859-x-codiertes Dokument ein 0x82
* Browser stellt fest, dass 0x82 in ISO-8859-x nicht definiert ist, fällt
also ersatzweise auf Windows-1252 zurück
* In der Umschlüsselungstabelle für Windows-1252 steht, dass 0x82 dem
Unicode-Zeichen U+201A entspricht
* Browser speichert intern das Zeichen U+201A.
Warum hast du dann Skrupel, das ebenso zu machen?
So long,
Martin
Die letzten Worte des stotternden Beifahrers:
Frei... frei... frei... freilich kommt da was!!