Rolf b: Levenshtein Distance Alternative

Beitrag lesen

Ich würde behaupten, dass eine fehlertolerante Suche per Levenshtein-Distanz einer SQL DB nicht gut tut. Eine Indizierung ist dann nicht wirklich effizient. Man kann natürlich einen Index auf die Suchspalte legen, aber SQL muss dann immer noch einen Full Index Scan machen.

Es gibt im Netz Vorschläge, die Levenshtein-Distanzfunktion als Stored Procedure zu implementieren; ich weiß allerdings nicht, wie effizient der Procedure-Interpreter (oder -Compiler?) von MySQL ist. Bei vielen 1000 Sätzen, die zu durchsuchen sind, kann ich mir vorstellen, dass das langsam wird.

Du brauchst eine Methode, die einfacher über den Index nutzbar ist - ich hatte dazu Trigramme im Kopf, finde spontan aber nichts dazu.

Rolf