Ashura: Codierung einer XML Datei herausfinden und korrigieren

Beitrag lesen

Hallo AllesMeins.

ich habe hier eine XML Datei erhalten, die per PHP importiert werden soll. Leider scheint diese Datei ungewöhnlich/fehlerhaft/sonstwie codiert zu sein, denn alle Sonderzeichen sind durch andere Zeichen ersetzt. So wird zum Beispiel ein kleines ä zu „, wo ein ü stehen sollte ist ein � usw.

Das deutet in der Tat auf eine inkorrekte Kodierungsangabe seitens deines Content-Type-Headers hin.

In dem Header der Datei steht der Zeichensatz sei "iso-8859-1".

Welcher? Der XML- oder der PHP-Datei?

Wo genau liegt hier der Fehler? Ist die Datei fehlerhaft erzeugt worden, wird sie nicht richtig angezeigt oder wie? Wie dem auch sei: Wichtig für mich ist vor allem wie bekomme ich sie beim einlesen wieder in ein richtiges Format?

Wenn du die Kodierung auslesen willst und dich nicht auf den BOM verlassen möchtest, wirst du wohl nichts ohne große Verrenkungen bewirken können.
(Sollte die XML-Datei im UTF-8-Format vorliegen hilft auch [Wikipedia: UTF-8] für's Verständnis.)

Einen schönen Mittwoch noch.

Gruß, Ash*feel free*ura

--
Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:) fl:( ss:) ls:[ js:|
30 Days to becoming an Opera8 Lover -- Keyboard Shortcuts
Meine Browser: Opera 8.50 | Firefox 1.0.7 | Lynx 2.8.5 | Konqueror 3.3.2 | Netscape 4.7 | IE 6.0
Use OpenOffice.org