Kalle_B: Zeichencodierung bestimmen

Beitrag lesen

Hallöle,

mal wieder Ärger mit Umlauten und dem beta.

Ich möchte die Zeichencodierung einer hochgeladenen CSV- Datei bestimmen und versuche es mit mb_detect_encoding:

,'[feldinhalt]'      =>( mb_detect_encoding($arr_felder[$j])=="UTF-8" ) ? trim($arr_felder[$j]) : utf8_encode( trim($arr_felder[$j]) )
        ,'[encoding]'        =>  mb_detect_encoding($arr_felder[$j]).''

Also, wenn ein Wert bereits in UTF-8 codiert ist, soll er unverändert übernommen werden, sonst nach UTF-8 umsetzen. Zum Test ermittle ich noch, was mb_detect_encoding denn gefunden hat.

mb_detect_encoding erkennt den Wert Getr„nkeindustrie (so angezeigt in meinem Editor) nicht, gibt nichts an. Also wird umgesetzt nach UTF-8 und dann in HTML als Getr„nkeindustrie angezeigt.

Hier die in HTML angezeigten Zeichen und was sie sein sollen:
„ ä
” ö
� ü
á ß
™ Ö

Wie kann ich die Zeichencodierung herausfinden?

Gruß, Kalle