dedlfix: HTML mit Umlauten ohne Verhunzung des Codes

Beitrag lesen

problematische Seite

Tach!

und es gibt keine Möglichkeit, Umlaute korrekt darstellen zu lassen, ohne dass der ganze Code nachher mit ä, ü und ö gespickt ist? Gibt es eine Möglichkeit, allein im Header was reinzuschreiben?

Ja doch, aber um eine Kodierung zu entschlüsseln, muss man zum einen den Schlüssel kennen und zum anderen müssen die Daten entsprechend dem Schlüssel kodiert sein. Der Schlüssel ist hier der Name der Kodierung und die dazu passende und öffentlich bekannte Kodierungsvorschrift. Wenn also zum einen die Kodierung bekannt ist und zum anderen die Daten dieser Kodierung entsprechen, dann kann man sie korrekt darstellen.

Man kann aber keinen Algorithmus erstellen, der von "unbekannt" in eine bestimmte Zielkodierung konvertiert. Deshalb gibt es keine Möglichkeit der automatischen Reparatur.

Man kann lediglich anhand einer Indizien und mit Ausschlussverfahren vermuten, dass ein Text in einer bestimmten Kodierung ist, aber ohne menschliche Bestätigung kann das kein Programm zweifelsfrei feststellen.

Und wie soll man diesen Schrottcode editieren? Geht das nur indem man immer hin- und her-konvertiert?

Wenn du Quell- und Ziel-Kodierung kennst, dann ja. Wenn die Kodierung nicht bekannt ist, kann kein Algorithmus sie korrekt konvertieren. Dann musst du mit deinem menschlichen Verstand erraten, was der Text eigentlich sein sollte und ihn per Hand reparieren.

dedlfix.