Hi Joachim,
ich [bin] vor kurzem im FTP-Programm Fetch (Mac) ueber eine Option "Translate ISO-characters" gestolpert,
Hm, was „FTP-Programme“ so alles machen, was mit FTP überhaupt nichts zu tun hat …
Wie kann man denn z.B. UTF-8 kodierte Dateien herstellen, wenn der Rechner keinen entsprechenden Zeichensatz hat oder das Programm gar nicht Unicode-faehig ist (wie afaik z.B. Homesite 4.5)?
Die Codierung hat mit Zeichensatz oder in einer Schriftart enthaltenen Zeichen gar nichts zu tun. _Rechner_ kennen keinen Zeichensatz, die kennen Folgen von Oktetts (Bytewerte). Diese werden von _Programmen_ (da zähl ich jetzt mal das Betriebssystem auch dazu) bei Bedarf als Zeichen interprätiert.
Welche Oktettfolge dabei für welches Zeichen steht, bestimmt die Zeichencodierung. Das Oktett C3 steht in ISO 8859-1 für das Zeichen 'Ã', BC für '¼'; die Oktettfolge C3 BC steht also für 'ü'. Dieselbe Oktettfolge steht in UTF-8 für 'ü'.
Wenn ich also 'ü' in ein Dokument schreibe und das in ISO 8859-1 codiert speichere, aber später einem Programm mitteile, das Dokument wäre in UTF-8 codiert, zeigt dieses 'ü' an. Bequem ist das freilich nicht; ist schon besser, man verwendet für ein Dokument beim Speichern und Laden dieselbe Codierung, um wieder dieselben Zeichen zu erhalten.
Mit Unicode-Fähigkeiten hat die Codierung wiederum nichts zu tun. Der Editor Textpad z.B. ist nicht Unicode-fähig, sondern beherrscht nur 256 Zeichen; welche das sind, kann man ihm sagen: alle in ISO 8859-1 codierbaren oder alle in ISO 8859-2 codierbaren oder … (Analog zum GIF-Format mit seinen max. 256 Farben umfassenden Paletten, wobei jedes Bild eine andere Palette haben kann.) Dennoch kann ich mit Textpad problemlos Dateien in UTF-8 codiert speichern.
Aber warum stehen die ['?'] drinne?
Genau das ist die Frage, die es zu klären gilt.
Ich denke, weil er die Datei eben nicht in dieser Kodierung abspeichern konnte.
Aber das konnte er doch. Sonst wären ja die kyrillischen Zeichen in title und den Meta-Angaben auch nicht da.
Nein, im Quelltext kommt kein 'ü' vor,
In den Keywords stand Lübeck mit "ü"...
Wann? 2006-02-02T14:20+01:00 stand da
<meta name="keywords" content="Зубоврачебный кабинет,врач-стоматолог,Lübeck,Кристины Мартенс, […]">
(Und Кристина (Christina) immer noch im Genitiv.)
Live long and prosper,
Gunnar
„Weisheit ist nicht das Ergebnis der Schulbildung, sondern des lebenslangen Versuchs, sie zu erwerben.“ (Albert Einstein)