Tom: Volltextsuche

Hallo Forumler

Zuerst möcht ich mich entschuldigen, dass ich beim Thread zur Forumssuche weiter unten die Diskussion in die falsche Richtung gelenkt habe.

Trotzdem interessiere ich mich für eine Volltextindex-Lösung, die die Textdaten nicht nur sequentiell durchsucht, sondern leistungsfähigere Algorithmen anwendet.

Kennt jemand Quellen, wie solche Suchindizes aufgebaut werden, bzw. wie der Suchalgorithmus mit einem solchen Index-File abläuft ?

Grüsse

Tom

  1. Hallo Tom,

    Da ich gerade für den Mike(30708) auf Suche bei metalab (ehemals sunsite) war :
    Hast Du schonmal an WebGlimpse (braucht einen Index von glimpseindex, kann auch auf Deinem Rechner gemacht werden, ist dann aber recht schwierig) gedacht, oder versuchs mal mit WebGrep
    http://metalab.unc.edu/pub/Linux/apps/www/misc/webgrep-1.8.tar.gz
    (ohne Indexing, einfach die Perlversion von grep, trotzdem recht zügig bei nicht zu textlastigen Seiten)

    naürlich htdig:
    http://metalab.unc.edu/pub/Linux/apps/www/indexing/htdig-3.1.2.tar.gz
    schweift dann aber von der reinen Perl Lösung ab ist aber auch auf manch einem Linux Server bereits drauf.
    HomeAlone:
    http://metalab.unc.edu/pub/Linux/apps/www/indexing/homealone0.92b.tgz

    Die Adresse von WebGlimpse habe ich jetzt auf die Schnelle nicht gefunden, sorry, allerdings gibt es auf derselben Seite
    http://metalab.unc.edu/pub/Linux/apps/www/indexing/!INDEX.html
    GlimpseHTTP, vieleicht haben die nur den Namen geändert. die doc files gibt es extra.

    Wenn Du jetzt noch nicht genügend Materail hast, weiß ich auch nicht mehr ;-)

    Grüße
    Christoph