umstellung mariadb, nun codierungsproblem von Gunnar Bittersmann, 06.12.2023 19:19

umstellung mariadb, nun codierungsproblem

@@Rolf B

Der Standardzeichensatz "latin1_swedish_ci"

Zeichensatz? Eine Collation ist doch mehr als das.

Verwende den Latin1-Zeichensatz. Sortiere nach schwedischen Regeln und vergleiche ohne Beachtung von Groß- und Kleinschreibung.

Eben.

Das passt für Deutsch halbwegs.

Werden im Schwedischen nicht Umlaute nach Z einsortiert? Da würde ich dann nicht von „passt halbwegs“ sprechen, sondern von: passt gar nicht.

Solange Du in Perl nicht versuchst, einen solchen String zeichenweise (statt byteweise) zu verarbeiten, fällt das gar nicht auf.

Bist du da mit der Verneinung und Zeichen und Bytes durcheinander gekommen?

Einen solchen UTF-8 String

So etwas gibt es nicht. Man kann vielleicht von einer UTF-8-Bytefolge (mind the non-gap!) sprechen.

Ein String besteht aus Zeichen, diese sind aus einem Zeichensatz. UTF-8 ist kein solcher, sondern eine Zeichencodierung.

Ich weiß nicht, wie weit Du Dich auf 100% UTF-8 einlassen kannst.

Ich weiß, dass man sich 100%ig auf UTF-8 einlassen sollte. Und jetzt will der Mitleser 2.0 auch noch eine Begründung dafür! 😏

🖖 Живіть довго і процвітайте

--
Ad astra per aspera