dedlfix: HTML durch PHP downloaden

Beitrag lesen

Hi!

Doch.
OK, kombinierte und nichtkombinierte Zeichen. Dass die einer zusammenmischt halte ich für eher unwahrscheinlich.

'tschuldigung, korrekt muss das heißen precomposed characters (z.B. ä) und combining characters (z.B. a plus extra ¨), also auf deutsch vielleicht vorkombinierte Zeichen und kombinierende Zeichen.

Das ist durchaus nicht unwahrscheinlich.

Es geht hier nicht um unterschiedliche Kodierungen sondern um zwei Möglichkeiten der Darstellung des selben Zeichens unter Unicode. Mir ist bis jetzt nur ein System unter die Finger gekommen, das das macht: Apple (OSX). Das speichert Dateinamen mit diakritischen Zeichen auf und an lateinischen Buchstaben in der kombinierten Form auf den USB-Stick, auf dass ein Windows sie nicht richtig entziffern kann. Aber das Dateisystem ist nochmal wieder eine andere Baustelle als die Inhalte von Dateien.

Editoren, die sowas machen, bin ich noch nicht begegnet. Die hauptsächlich für die Entwicklung verwendeten Systeme werden sich sicherlich hüten, da anders vorzugehen als die anderen.

Man muss ja mit seinem Editor die Datei nur im falschen Modus öffnen und sich dann nach dem Öffnen dazu entschließen, sie anders wieder abzuspeichern.

Wie gesagt, ich kenne keinen Editor, der Umlaute und Konsorten unter UTF-8 in der Form Grundbuchstabe plus Tüdelchen als extra Zeichen speichert.

Lo!