dedlfix: Umlaute und Sonderzeichen ändern

Beitrag lesen

Hi!

Ergo ist die falsche Angabe der Codierung sehr wohl das Hauptproblem, denn sie führt dazu, dass der Browser auch die POST-Daten in der falschen Codierung verschickt. Oder?

Grundlegend stimme ich mit dir überein, aber eben nicht in allen Details. Ich weiß nicht, welche Kodierung er verwenden will, darüber hat er nichts konkret verlauten lassen. Ein Indiz, UTF-8 haben zu wollen, wäre, dass er sich fragte, ob seine META-Angabe ISO-8859-1 etwa ein Fehler wäre. Da er aber von der Kodierung im Editor anscheinend nichts wusste und es auch noch nicht Klick machte, dass ISO-8859-1 und UTF-8 was anderes sind und auch andere Bytefolgen verwenden, als er diese charset-Angabe fand, gehe ich eher davon aus, dass er nicht willentlich UTF-8 einsetzt und sein Editor nur per Zufall/Default-Konfiguration/anderer Grund UTF-8 produziert. (Üblicherweise haben sich die Inhaber solcher Problem gar keine Gedanken über Zeichenkodierungen gemacht. Kann man nachholen: http://wiki.selfhtml.org/wiki/Doku:Grundlagen/Zeichenkodierung_und_geschriebene_Sprache.)

Script (vermutlich) in UTF-8

Ja, kann als bestätigt angesehen werden durch: echo urlencode('Märchen'); => Ausgabe: M%C3%A4rchen

Scriptausgabe (mittlerweile verifiziert) in UTF-8

Ist mir da was entgangen? Zu einer Ausgabe von Umlauten (und Fehlern dabei) gab es weder eine Aussage, noch ein belastbares Indiz. Lediglich die Vermutung, dass ein UTF-8-kodiertes Script eine UTF-8-kodierte Ausgabe erzeuge. Es könnten ja auch noch Daten aus einem dritten System, das ISO-8859-1 liefert, unverändert in die Ausgabe durchgereicht worden sein. Aber wie gesagt, das ist alles für das konkrete Problem nicht relevant, weil das weder das Formular noch die Affentechnik noch die zurückgesendeten Daten betrifft.

Ich hoffe, wir haben ihn jetzt nicht verschreckt und er sagt uns noch, was für eine Zeichenkodierung er eigentlich verwenden möchte[*], denn dann kann er auch noch konkrete Tipps bekommen, was zur Fehlerbehebung zu tun ist und was zu tun ist, damit keine weiteren Fehler auftreten. Auch die Information über weitere Datenquellen (Datenbank) wäre dazu wichtig.

[*] Bei "weiß-nicht" und einem Projekt, das noch keinen Alt-Datenbestand hat, wäre die Empfehlung UTF-8.

Lo!