Michael Schröpl: (tech.+jur.) Fragen zu Suchalgorithmus

Beitrag lesen

Hi Rol,

  1. Wie könnte man einen Suchalgorithmus etwas mehr „fuzzy“ machen,
    so dass er z.B. auch (in Grenzen) mit Tippfehlern zurecht kommt.

das kommt auf die Art der Tippfehler an.

Wenn die Leute nicht wissen, was gemeint ist, dann halte ich die
bereits genannte soundex-Methode für sehr interessant.
Das sind dann aber meiner Meinung nach nicht Tipp-Fehler, sondern
Unkenntnis.

Echte Tippfehler selbst könntest Du natürlich auch bekämpfen.
Ansatzpunkte dafür wären beispielsweise

a) Apaches "mod_speling" (das wohl im wesentlichen "Hamming-Distanz 1"
   und "nicht case-sensitiv" für URL-Zugriffe macht)

oder auch

b) glimpse (das ist ein UNIX-Programm, eine Art aufgemotztes "grep",
   welches parametrisierbare Hamming-Distanzen verarbeiten kann).
   Zu letzterem gibt es auch eine (bzw. sogar mehrere drauf gesetzte
   Suchmaschine (teils Freeware, teils kommerziell).

Viele Grüße
      Michael