MySQL - Umlaute - Suchen von suit, 28.03.2008 14:41

MySQL - Umlaute - Suchen

Daniel_t 28.03.2008 11:58

datenbank

Hallo,

ich hab eine Datenbank, mit einer Tabelle und einem Feld. Hier die Ausgabe:

Wenn ich nun folgende Abfrage mach:

select * from testing where test like '%Öster%';

Findet er nur die Einträge mit großem "Ö", egal ob "ster" oder "STER" oder "sTeR" als rest da steht. Ich möchte nun, dass eine Suche mit kleinem Umlaut auch die großen findet und umgekehrt.

Im Netz hab ich oft den Hinweis gefunden, dass man bei einer DB mit Umlauten die Collation latin1/latin1_swedish_ci benutzen soll. Habs auch mit utf8/utf8_general_ci und einigen anderen versucht, aber komme nicht zum Ergebnis.

Kann mir da einer helfen? Verzweifel schon damit :)

Baba Daniel

Beitrag melden

– Informationen zu den Bewertungsregeln

MySQL - Umlaute - Suchen
Matt 28.03.2008 12:25

datenbank
– Informationen zu den Bewertungsregeln
Hallo,

Kann mir da einer helfen? Verzweifel schon damit :)

Hi,

vielleicht hilft die BINARY weiter:

http://www.phphq.de/mysql.de/manual.de_617.html

folglich:
```
  
SELECT * FROM ... WHERE ... LIKE BINARY '...'  
```
Grüße Matt
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. MySQL - Umlaute - Suchen
  
  Daniel_t 28.03.2008 13:01
  
  datenbank
  – Informationen zu den Bewertungsregeln
  Hi,
  
  vielleicht hilft die BINARY weiter:
  
  Mit Binary kann ich doch eben Casesensitive Abfragen machen, was genau das verkehrte ist, oder hab ich da was falsch verstanden:
  
  "Wenn Sie wollen, dass eine Spalte immer abhängig von der verwendeten Groß-/Kleinschreibung behandelt wird, deklarieren Sie sie als BINARY"
  
  Grüße Matt
  
  Baba Daniel
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. MySQL - Umlaute - Suchen
    
    Matt 28.03.2008 13:40
    
    datenbank
    
    – Informationen zu den Bewertungsregeln
    Hm
    
    also wenn bei mir eine Tabelle durchsuche:
    
    SELECT * FROM `projekte` WHERE `papier` LIKE '%inhalt%' LIMIT 0 , 30
    
    dann findet er alle INHALT, Inhalt, iNHALT
    
    und das macht er bei dir nicht? Komische Sache...
    
    SELECT * FROM `projekte` WHERE `papier` LIKE Binary '%inhalt%' LIMIT 0 , 30
    
    dann liefert er mir nur alle mit "inhalt" zurück.
    Bei mir verhält sich alles völlig korrekt.
    
    Alle Kollationen utf8_general_ci
    Das durchsuchte Feld hat den Typ 'text'
    
    Grüße
    Matze
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
    1. MySQL - Umlaute - Suchen
      
      Daniel_t 28.03.2008 14:38
      
      datenbank
      
      – Informationen zu den Bewertungsregeln
      
      Hm
      
      also wenn bei mir eine Tabelle durchsuche:
      
      WHERE papier LIKE '%inhalt%'
      
      dann findet er alle INHALT, Inhalt, iNHALT
      
      und das macht er bei dir nicht? Komische Sache...
      
      Oja, das funktioniert bei mir auch. Aber versuch das mal mit "inhält" bzw halt einem Umlaut im String. Da hab ich das Problem.
      
      Trag in die Tabelle ein: "inhält" und "inhÄlt" und such dann eines der beiden, da find ich immer nur eines.
      
      Grüße
      Matze
      
      Baba Daniel
      
      Beitrag melden
      
      –
      Informationen zu den Bewertungsregeln
      
      Übersicht
      
      alle Foren
      
      SELFHTML-Forum
      
      anmelden
      
      Benutzerkonto erstellen
      
      Beitrag im Thread-Baum
      1. MySQL - Umlaute - Suchen
        
        Sven Rautenberg Homepage des Autors 28.03.2008 17:55
        
        datenbank
        
        – Informationen zu den Bewertungsregeln
        
        Moin!
        
        WHERE papier LIKE '%inhalt%'
        
        dann findet er alle INHALT, Inhalt, iNHALT
        
        und das macht er bei dir nicht? Komische Sache...
        
        Oja, das funktioniert bei mir auch. Aber versuch das mal mit "inhält" bzw halt einem Umlaut im String. Da hab ich das Problem.
        
        Trag in die Tabelle ein: "inhält" und "inhÄlt" und such dann eines der beiden, da find ich immer nur eines.
        
        Dann hast du die MySQL-Verbindung nicht auf UTF-8 eingestellt, aber dennoch UTF-8 Daten gesendet, die MySQL als Default (typisch ISO-8859-1) empfangen hat, und nach UTF-8 konvertiert ins Feld gespeichert hat.
        
        Resultat: Im Feld steht kein Umlaut, sondern die UTF-8-Form der ISO-8859-1-Darstellung des UTF-8-Umlauts. Und der kann natürlich nicht korrekt in die Case-Insensitive-Betrachtung einfließen, und daher werden nur bei korrekter Übereinstimmung der Großschreibung Funde gemeldet.
        
        "SET NAMES utf8" als erster Query sollte Pflichtbestandteil jedes vernünftigen Verbindungsaufbaus zur Datenbank sein.
        
        - Sven Rautenberg
        
        --
        "Love your nation - respect the others."
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
        
        MySQL - Umlaute - Suchen
        
        Daniel_t 29.03.2008 08:36
        
        datenbank
        
        – Informationen zu den Bewertungsregeln
        
        Moin!
        
        "SET NAMES utf8" als erster Query sollte Pflichtbestandteil jedes vernünftigen Verbindungsaufbaus zur Datenbank sein.
        
        Da war mein Fehler, danke!
        
        Bei "jeder" Verbindung und die DB mit der richtigen Collation angelegt, dann passts.
        
        Sven Rautenberg
        
        Vielen Dank an alle!
        
        Baba Daniel
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
        
        MySQL - Umlaute - Suchen
        
        dedlfix 29.03.2008 10:58
        
        datenbank
        
        – Informationen zu den Bewertungsregeln
        
        echo $begrüßung;
        
        Bei "jeder" Verbindung [SET NAMES ...] und die DB mit der richtigen Collation angelegt, dann passts.
        
        Die Kollation/Kodierung der Datenbank oder auch der Tabelle ist letzlich unbedeutend. Es kommt immer darauf an, welche Kodierung/Kollation für jedes einzelne Feld eingestellt ist. Die Datenbank- und Tabellenangaben sind nur Default-Werte, die verwendet werden, wenn für das Feld keine explizite Angabe gemacht wurde.
        
        Für die Kommunikation mit dem Client ist außerdem allein die Kodierung der aktuellen Verbindung interessant. Wenn diese nicht mit der Feldkodierung übereinstimmt, nimmt MySQL selbständig eine Umkodierung vor. Da dies nicht von jeder Kodierung in jede andere Kodierung verlustfrei möglich ist, ist man gut beraten, für die gesamte Verarbeitungskette eine Kodierung zu verwenden, die alle benötigten Zeichen repräsentieren kann.
        
        echo "$verabschiedung $name";
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
MySQL - Umlaute - Suchen
suit 28.03.2008 14:41

datenbank
– Informationen zu den Bewertungsregeln
Im Netz hab ich oft den Hinweis gefunden, dass man bei einer DB mit Umlauten die Collation latin1/latin1_swedish_ci benutzen soll. Habs auch mit utf8/utf8_general_ci und einigen anderen versucht, aber komme nicht zum Ergebnis.

der zeichensatz selbst soltle latin1 bzw utf8 sein

die zeichensortierung bei einem deutschen/österreichischen text auf swedisch_ci stellen ist dämlich - hier würde german_ci oder general_ci empfehlen

utf8_general_ci findet ein Ö bei der suche nach ö oder Ö

bei latin1_swedish_ci ist zb Ü, ü, Y und y identisch - das ist in deinem fall sicher schlecht

bin/binary wurde ich ebenfalls nicht nehmen, da hier ein exakter binärvergleich durchgeführt wird

wichtig ist aber auch die verbindung zur datenbank

wenn die datenbank in utf8 codiert ist und da drinne Ö steht und du dann nach Ö suchst, die verbindung/übertragung in ANSI erfolgt, kommt in der db dann halt Ã– anstatt Ö an, somit findest du nix
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. MySQL - Umlaute - Suchen
  
  Daniel_t 28.03.2008 15:07
  
  datenbank
  – Informationen zu den Bewertungsregeln
  Also ich hab das nun direkt nochmal versucht:
  
  create database testing3 default character set 'utf8' default collate 'utf8_general_ci'
  
  Dann ne table erstellt, 2 Datensätze eingefügt, und das selbe wie vorher.
  
  Mit einem select * zeigt es mir beide Datensätze ohne Fehler an.
  
  baba Daniel
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. MySQL - Umlaute - Suchen
    
    dedlfix 28.03.2008 17:46
    
    datenbank
    
    – Informationen zu den Bewertungsregeln
    echo $begrüßung;
    
    create database testing3 default character set 'utf8' default collate 'utf8_general_ci'
    Dann ne table erstellt, 2 Datensätze eingefügt, und das selbe wie vorher.
    
    Das Problem kann ich mit dem phpMyAdmin nicht nachvollziehen. Zwei Datensätze, einer mit "Österreich", einer mit "köstlich", eingefügt und mit LIKE "%öst%" und auch großem Ö werden beide Datensätze gefunden. Ich vermute dein Problem an anderer Stelle. Welche Kodierung verwendest du auf der Verbindung deines Clients mit dem Server? Stellst du die explizit auf einen definierten Wert und sendest dementsprechend kodierte Daten?
    
    echo "$verabschiedung $name";
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
  2. MySQL - Umlaute - Suchen
    
    suit 28.03.2008 18:11
    
    datenbank
    
    – Informationen zu den Bewertungsregeln
    Mit einem select * zeigt es mir beide Datensätze ohne Fehler an.
    
    wie gesagt, das hilft nichts wenn die VERBINDUNG zur datenbank falsch codierd wird
    
    mysql kann mehr als nur eine datenbank mit einem zeichensatz erzeugen - wie gesagt die verbindung selbst ist entscheidend - wenn du ein utf-8 zeichen durch eine ansi-verbindung jagst, geht das ding defintiv verloren bzw kommt nicht so an wie gewolt = kein ergebnis
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
MySQL - Umlaute - Suchen
Vinzenz Mai 28.03.2008 17:38

datenbank
– Informationen zu den Bewertungsregeln
Hallo

ich hab eine Datenbank, mit einer Tabelle und einem Feld. Hier die Ausgabe:

+-------------+
| test        |
+-------------+
| essen       |
| Mahlzeit    |
| Mahlzeit    |
| österreich |
| Österreich |
| Österreich |
...

Wenn ich nun folgende Abfrage mach:

select * from testing where test like '%Öster%';

Findet er nur die Einträge mit großem "Ö", egal ob "ster" oder "STER" oder "sTeR" als rest da steht. Ich möchte nun, dass eine Suche mit kleinem Umlaut auch die großen findet und umgekehrt.

ich verwende inzwischen grundsätzlich UTF-8 als Default charset und kann Dein Problem nicht nachvollziehen.

Freundliche Grüße

Vinzenz
Beitrag melden

–
Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Daniel_t: MySQL - Umlaute - Suchen