Hallo,
Wenn du nur ASCII-Zeichen hast, dann gibt es keinen Unterschied zwischen UTF-8 und ISO-8859-1 und ANSI/ASCII.
Das Problem ist aber, dass ggf. Nutzer die XML-Datei mit dem Editor bearbeiten und nachträglich Umlaute abspeichern. Da ist dann das Problem, dass diese im ANSI Format abgespeichert werden, außer man ist so versiert, dass man manuell als UTF-8 abspeichert.
das stimmt, das Problem wirst du aber nicht auf technische Art lösen können, denn die Konsequenz aus dedlfix' Feststellung ist, dass es unmöglich ist, die gewünschte Codierung eines Dokuments festzustellen, solange nur ASCII-Zeichen darin vorkommen.
Du kannst also höchstens die Anwender deutlich darauf hinweisen, dass das Dokument bei Änderungen *immer* als UTF-8 gespeichert werden muss.
Oder integriere irgendein Element in dein XML, das du selbst (bzw. dein Programm) grundsätzlich ignoriert, und schreib da ein paar Umlaute rein, an denen die Codierung UTF-8 erkennbar ist.
Oder bau eine Fehlerbehandlung in deinem Programm ein, die bei Codierungsfehlern alternativ versucht, die zu lesende Datei von ISO/Latin in UTF-8 umzucodieren.
Keine dieser Lösungen ist perfekt ...
So long,
Martin
Zwei Stammtischbrüder:
Hier steht, dass laut Statistik über 60 Prozent aller Ehefrauen fremdgehen.
Was soll ich mit dieser Information? Ich brauche Namen, Fotos, Telefonnummern ... !