dedlfix: Autovervollständigen

Beitrag lesen

Tach!

Das ist eine Frage der Kollation, welche Umlaute etc. welchen anderen Zeichen gleichgesetzt sind. Was ist denn da für das betroffene Feld konfiguriert?
utf8_unicode_ci
Ich denke, die Umlautbehandlung gehört nicht in ein utf8 Feld? Das kann ja auch japanische Schriftzeichen enthalten.

Die Zeichenkodierung ist wichtig, damit der Server weiß, was die Bytes in den Feldern für eine Bedeutung haben, für welches Zeichen sie stehen. utf8(mb4) oder latin1 oder was anderes sagt nur aus, welche Zeichen überhaupt abgelegt werden können und in welcher Form dies geschieht. Die Kollationsangabe ist ein Zusatz und ein Default-Wert, der dann beschreibt, wie die Zeichen der Inhalte beispielsweise zu vergleichen sind.

Ein Vergleichen von Strings unterschiedlicher Schriftsysteme ist in der Regel nicht sinnvoll. Selbst wenn du Texte aus mehreren auf lateinischen Buchstaben basierenden Sprachen in einem Feld ablegst, scheiterst du, wenn du sprachindividuell entscheiden möchtest. Dazu fehlt dir nicht nur die Meta-Information zur Sprache jedes einzelnen Feldinhalts. Du kannst jedenfalls immer nur einen Satz von Sortierregeln berücksichtigen. Diese kann durchaus eine andere sein als für das Feld per Default festgelegt ist.

Du solltest hier nicht alle möglichen theoretischen Fälle berücksichtigen, sondern das was deine Anwender wirklich benötigen. Wieviele davon können überhaupt andere Schriftsysteme verstehen? Und willst du am Ende wirklich die Begriffe in Originalsprache und -schreibung ablegen, auf dass sie das Zielpublikum nicht findet, weil es an fremden Schriftsystemen und zu ihren eigenen Scheibweisen abweichenden Notationen scheitert?

dedlfix.