Hi!
Rufe ich dieses auf und fuelle Umlaute ein ist alles OK. Fuelle ich aber einen echten Unicodestring rein, wie z.B 東京, dann erhalte ich:
string(16) "東京"
Irgendeine sch** Komponente konvertiert hier also, was dazu fuehrt, dass der String auch als solcher in der Datenbank landet und nicht als echter Unicode String.
Kann mir wer sagen, welche Komponente das ist, wie man es aendert und welche Implikationen das hat?
Diese Komponente nennt sich Browser. Da die Seite mit ziemlicher Sicherheit in einer Kodierung vorliegt, in der die Zeichen nicht darstellbar sind, ist das Verhalten der Browser undefiniert. Einige senden dann NCRs, so wie in deinem Fall.
In deinem Test-Script war zum einen keine Meta-Angabe zum Content-Type inklusive charset-Angae und vermutlich hat auch dein Server keine charset-Angabe im HTTP-Header Content-Type mitgesendet (diese muss ein Browser bevorzugt vor der Meta-Angabe verwenden) oder eine, die nicht UTF-8 ist.
Lo!