Tach!
ich habe einen String in dem sich "Hochzahlen" wie ⁵ befinden. Ich editiere meine Scripte mit Notepad++. Und trotz Umstellung auf die Codierung UTF8 bekomme ich nur einen viereck (falsche Codierung?)
Das ist zu wenig detailreich, um zu erkennen, was du konkret machst und was das Problem sein könnte. Ein beliebtes Problem ist, zwar dem Empfänger mitzuteilen, dass das Dokument UTF-8 sei, aber die eigentliche Kodierung des Dokuments nicht entsprechend umzustellen. Wenn man nur eine Angabe im HTTP-Header oder Meta-Element ändert, hat das noch keine Auswirkungen darauf, wie der Editor das Dokument speichert.
Das muss auch bei Kommunikation zwischen zwei Systemen beachtet werden: a) Zeichenkodierung dem Empfänger mitteilen, b) diese Kodierung auch verwenden, c) den Empfänger so konfigurieren, dass er diese Kodierung verarbeitet.
Gerne würde ich den Spaß aus meinen String filtern, aber wenn Sie nicht in Notepad++ einbauen kann?
Man kann zwar mit Unicode-Kategorien und Regexen arbeiten, so wie von CK vorgeschlagen, oder die Zeichen alle per Hand selbst als Zeichenklase notieren, aber dazu muss immer auch die Zeichenkodierung stimmen, sonst kann der Regexp-Mechanismus die Zeichen nicht erkennen.
dedlfix.