Volltextsuche
Tom
- perl
Hallo Forumler
Zuerst möcht ich mich entschuldigen, dass ich beim Thread zur Forumssuche weiter unten die Diskussion in die falsche Richtung gelenkt habe.
Trotzdem interessiere ich mich für eine Volltextindex-Lösung, die die Textdaten nicht nur sequentiell durchsucht, sondern leistungsfähigere Algorithmen anwendet.
Kennt jemand Quellen, wie solche Suchindizes aufgebaut werden, bzw. wie der Suchalgorithmus mit einem solchen Index-File abläuft ?
Grüsse
Tom
Hallo Tom,
Da ich gerade für den Mike(30708) auf Suche bei metalab (ehemals sunsite) war :
Hast Du schonmal an WebGlimpse (braucht einen Index von glimpseindex, kann auch auf Deinem Rechner gemacht werden, ist dann aber recht schwierig) gedacht, oder versuchs mal mit WebGrep
http://metalab.unc.edu/pub/Linux/apps/www/misc/webgrep-1.8.tar.gz
(ohne Indexing, einfach die Perlversion von grep, trotzdem recht zügig bei nicht zu textlastigen Seiten)
naürlich htdig:
http://metalab.unc.edu/pub/Linux/apps/www/indexing/htdig-3.1.2.tar.gz
schweift dann aber von der reinen Perl Lösung ab ist aber auch auf manch einem Linux Server bereits drauf.
HomeAlone:
http://metalab.unc.edu/pub/Linux/apps/www/indexing/homealone0.92b.tgz
Die Adresse von WebGlimpse habe ich jetzt auf die Schnelle nicht gefunden, sorry, allerdings gibt es auf derselben Seite
http://metalab.unc.edu/pub/Linux/apps/www/indexing/!INDEX.html
GlimpseHTTP, vieleicht haben die nur den Namen geändert. die doc files gibt es extra.
Wenn Du jetzt noch nicht genügend Materail hast, weiß ich auch nicht mehr ;-)
Grüße
Christoph