Hi Daniela,
Nein, ich habe vor das genau so zu machen, über den Teilstring auf
die möglichen Worte und die dann per OR zu benutzen. Das ganze ein
allerdings per Default ausgeschaltet damits nicht zu heftig wird
weil es wohl gar nicht so häufig benutzt wird. Die Teilstrings am
Wortanfang sind ja kein Problem.
Und weil das so ist, reicht es, alle Postfixe zu indexen und diese dann mit einer Präfixsuche zu bearbeiten. Damit es nicht zu viele Einträge sind, erzwingt man dann noch eine Mindestlänge für die eingegebenen Suchbegriffe - sagen wir mal drei Zeichen.
Beispiel: "Daniela" wird geindext als ["Daniela", "aniela", "niela", "iela", "ela"] - und mit einer Präfixsuche nach "nie" (LIKE "nie%" in SQL) in dieser Liste findet man nun sehr performant (mit Indexzugriff) "Daniela", was "nie" als Substring enthält.
Bei einer mittleren Wortlänge der deutschen Sprache von etwa sieben Buchstaben und einer Mindestlänge der Einträge von drei Zeichen entstehen etwa fünfmal so viele Indexeinträge wie Worte. Bei dieser Technik bringt eine Stopwortliste übrigens fast nichts, weil sie überwiegend kurze Worte eliminieren würde, die oftmals schon an der geforderten Mindestlänge scheitern würden.
Viele Grüße
Michael
T'Pol: I apologize if I acted inappropriately.
V'Lar: Not at all. In fact, your bluntness made me reconsider some of my positions. Much as it has now.