Tach!
Unter der Annahme, dass UTF-8-kodierte Daten mit dem Request reinkommen, müssen diese einfach nur durchgereicht werden. PHP nimmt die Bytes und Byte-Sequenzen der Zeichen und schiebt sie 1:1 an das DBMS weiter, solange man nichts an ihnen ändert (Kontextbehandlung darf man machen, die ist für UTF-8-Byte-Sequenzen (also Zeichen jenseits von ASCII) ungefährlich).
Interessant. Das ist, wenn ich das mal mit der Entwicklung von Perl vergleiche, der Stand von 2004 ;)
Es ist kein Geheimnis, und auch nicht zum ersten Mal hier erwähnt worden, dass PHP immer noch von der Annahme 1 Zeichen = 1 Byte ausgeht. Änderungen sind erst mit der nächsten Major-Version angekündigt. Die Entwicklung dazu zieht sich, warum auch immer, seit 2005 hin. Für die meisten Aufgabenstellungen ist das meiner Meinung nach jedoch ausreichend, denn da hat PHP mehr oder weniger nur eine Durchreichfunktion zwischen Webserver und Datenhaltung. Und wenn wirklich mal Multibyte-String-Verarbeitung nötig ist, gibt es ja diverse Funktionen dafür.
dedlfix.