dedlfix: Zeichen-Kodierung von Verzeichnissen

Beitrag lesen

echo $begrüßung;

Windows-Share (korrekter dateiname)

ÖÖÖÖ.jpg

Linux: ls

????????.jpg

Mich irritiert, dass es 8 Fragezeichen sind. Sonst hätte ich auf ISO 8859-x-Zeichen getippt, die mit UTF-8 zu lesen versucht wurden. Eine Byte-Sequenz eines UTF-8-Zeichen muss einer bestimmten Regel folgen, die im Allgemeinen von sinnvoll aneinander gereihten ISO 8859-1-Zeichen nicht eingehalten wird. Das Resultat wäre dann ein Fragezeichen pro Zeichen.

Linux: ls --show-control-chars

ÃÃÃÃ.jpg

Das sieht so aus, wie ein UTF-8-kodiertes Ö das mit ISO 8859-1 zu lesen versucht wurde. Ein Ö besteht aus den Bytes (hex) C3 und 96. C3 wird zu Ã, die 96 ist ein nicht darstellbares Steuerzeichen. Unter Windows-1252 wäre es statt dessen ein –

Im Browser (mittels JSP, als charset=ISO-8859-1)

????????.jpg

siehe oben.

echo "$verabschiedung $name";