dedlfix: Zeichensätze - Ungültige Zeichen auf Wikipedia?

Beitrag lesen

echo $begrüßung;

Das sind gotische Zeichen, die in Unicode jenseits der Basic Multilingual Plane liegen, also Werte oberhalb von 0xFFFF haben.
Endlich mal jemmand der sich auskennt...

Ich hab nur an den richtigen Stellen recherchiert ... und etwas Erfahrung hinzugezogen.

Bin gestern im IRC alle möglichen Channels von #java über #mysql zu #wikipedia und #wikimedia-tech rauf und runter gelaufen, keiner wusste so recht was los ist...

Als erstes googelte ich nach der Meldung "Incorrect string value". Die Anworten deuteten darauf hin, dass diese Meldung kommt, wenn ungültige Werte für die verwendete Kodierung verwendet werden. Dass der Firefox sie mit einem 6-Ziffern-Ersatzzeichen anzeigte, statt der sonst zu sehenden 4-Ziffern-Zeichen anderer "exotischer" Zeichensysteme war ein Indiz auf "unnormale" Unicode-Zeichen. Etwas Nachlesen im MySQL-Handbuch ergab, dass MySQL dafür nicht ausgelegt ist.

Als Wissensergänzung kam noch hinzu: got -> Gotische Sprache -> Gotisches Alphabet.

Kann ich vllt. MySQL sagen dass es diese Zeichen einfach ignoriert?

Das macht es ja. Leider auch alle nachfolgenden Zeichen.

Oder sie in der Java Anwendung irgendwie "unschädlich" machen?

Wenn du sie als Zeichen außerhalb der BMP erkennen kannst (Ordinalwert größer 65535), dürfte es kein Problem sein, sie durch nichts oder ein anderes Ersatzzeichen auszutauschen.

echo "$verabschiedung $name";