dedlfix: String auf codierung prüfen

Beitrag lesen

Hi!

ich habe im Netz 2 Versionen gefunden, mit der ich einen String auf seine codierung prüfen können soll.

"Auf seine Kodierung" ist zu allgemein formuliert. Die Funktion testet lediglich auf gültiges UTF-8. Ob allerdings wirklich UTF-8 gemeint ist, ist theoretisch nur durch eine Sinn-Analyse feststellbar. Praktisch werden wohl eher kaum die UTF-8-Byte-Sequenzen in "normalen" Texten vorkommen.

"Ein deutsches scharfes s, UTF-8-kodiert aber als ISO-8859-1 interpretiert sieht so aus: ß"

Dieser Satz ist gültiges UTF-8, ergibt aber nur als ISO-8859-1 interpretiert einen Sinn.

Kann jemand bestätigen, dass diese Funktion sauber arbeitet?

Sie sieht zumindest auf den ersten bis dritten Blick betrachtet richtig aus.

Lo!