hotti: Massenkonverter ARCII zu UTF-8

Beitrag lesen

moin,

Kann mir jemand helfen?

Perl:
sub latin1_to_utf8{return(pack("U*", unpack("C*", shift)))}

PS: Wie Martin schon schrieb, in ascii gibts keine Umlaute. Stelle die Zeichencodierung in Deiner Datei genau fest, wenn es iso-8859-1 (latin1) ist, geht o.g. Perlfunktion. In latin1 liegt das deutsche 'ä' auf 228 (C4) mit einem byte codiert. In utf-8 hat das 'ä' 2 byte.

Hab neulich die Daten aus einer Exceltabelle extrahieren müssen und dabei versucht, alles auf utf-8 umzuwandeln. Dabei gab es jedoch Fliegendreck, also irgendwelche undefinierten bytes, so bin ich dann bei iso geblieben und alles sieht ordentlich aus. Prüfe also auch im Einzelfall, ob eine Convertierung wirklich notwendig ist, manchmal ists besser, die Codierung einer (großen) Datenquelle einfach so zu belassen und die neue Anwendung darauf abzustimmen.

Hotti