(ZU DIESEM FORUM) Offline Suchmaschine für das Forum in JavaScript
Oliver
Hallo allerseits,
seit geraumer Zeit benutze ich SELFHTML und finde es klasse. :o)
Besonders dieses Forum hat mir immer wieder bei kniffeligen
Fragen helfen können, da viele spezielle Probleme bereits
das eine oder andere mal angesprochen wurden. Darum habe
ich mir auch immer schön fleissig das Forumsarchiv runtergeladen,
um lokal auf meiner HD damit arbeiten zu können. - Leider gibt es
dafür keine einfache Suchmaschine, zwar ein CGI-Script, auf das
in älteren Threads schon einmal hingewiesen wurde, aber dafür
muß man so etwas erst einmal installiert haben. Und die Online-Suche
ist auch immer mit Kosten verbunden. Somit gestaltete
sich für mich die Archiv-Suche immer noch sehr umständlich.
Um diese Schwachstelle für mich zu umgehen, habe ich eine kleine
Suchmaschine in JavaScript realisiert, die die Threadtitel,
wie sie in den Indexdateien im Archiv stehen, durchsucht.
Wer von Euch an so etwas Interesse hat, kann sie sich unter
http://www.tu-bs.de/~y0004525/selfhtmlforumsearch.zip
downloaden und austesten. Die Datei ist 213k gross.
Die Suchmaschine berücksichtigt im Augenblick alle vorhandenen Quartale,
also von 3/1998 bis 1/2000 und muß im Unterverzeichnis "selfhtml/sfarchiv/"
entpackt werden. Dabei wird die bestehende "index.htm" überschrieben,
da die neue Version einen Link zur Suchmaschine enthält.
Getestet habe ich sie auf IE5 und NN4.61 und läuft, allerdings nicht
auf Opera 3.6.
Die Performance ist IMHO OK. Auf meinem K6 mit 233Mhz und 64MB braucht
eine Suchanfrage, die rund 2000 Treffer hat (z.b:'javascript') auf dem
IE knapp 3 Sek. und auf dem NN ca. 7 Sek. Dabei ist der entscheidende Faktor
die Trefferanzahl, nicht die Anzahl der zu durchsuchenden Beiträge, d.h.
Anfragen mit weniger Treffern gehen deutlich fixer.
Viel Spass und ein effizientes Suchen
Oliver
Hi Oliver!
Ein anderer Oliver, naemlich der Oliver García (js@ogu.de), hat schon eine JS-offline-suche realisiert (sorry for that) - am besten poste ich einfach mal - was er dazu geschrieben hat:
<cite>
ich habe jetzt die Netscape-Version der Selfhtml-Suche fertiggestellt und
nebenbei die bisherige Version (fuer IE und Netscape <=4.04) etwas verbessert.
Beides kann heruntergeladen werden unter
http://dejure.org/jvts/selfsuche2.zip (18 KB)
Die Zip-Datei bitte ins Selfhtml-Verzeichnis entpacken, die bisherigen
Programmdateien der Suchmaschine werden ersetzt, der Index (aus
http://dejure.org/selfsuche.zip) bleibt der gleiche.
Zur Benutzung der Suchmaschine wird wie bisher aufgerufen "suche.html"
fuer IE und Netscape bis einschliesslich Version 4.04.
Netscape darueber laeuft nunmehr mit "suchen.html".
Ich hatte eigentlich vor, eine automatische Weiterleitung zu integrieren, die
so funktioniert haette, dass "suche.html" die allgemeingueltige Startseite ist,
und von dort aus je nach Browser "suchen.html" geladen wird.
Leider hat das nicht geklappt, da aus irgendeinem Grund Netscape 4.6 mit dem
Code:
if (document.layers && navigator.appVersion.substr(2).match(/[1]^0[5-9]/)) location.href="suchen.html"
abstuerzt. Der Code ist in Ordnung und isoliert laeuft er auch, nur in der
konkreten Datei "suche.html" gibt es offenbar keine Stelle, wo ich ihn
hinlegen kann, ohne dass es zum Absturz kommt.
Stattdessen wird man spaeter die Verteilung von einer Seite aus machen muessen,
die beiden Suchmasken vorgelagert ist.
Die neue Netscape-Version hat die gleichen Leistungsmerkmale wie die
bisherige IE-Version. Allerdings hat Netscape in diesen hoeheren Versionen
einige Probleme mit seinem Zeichensatz. Deshalb wird die _Phrasensuche_
erst richtig funktionieren, wenn ich den Index neu erstellt habe.
Was weiter aussteht ist die Anpassung des Layouts. Vorschlaege sind immer
noch erbeten.
Zum zweiten:
Es ist der Wunsch nach einer Version der Offline-Suchmaschine fuer das
Forumsarchiv laut geworden. Deshalb habe ich die Vervollstaendigung der
Opera-Version zurueckgestellt und die Forumsarchivsuche fertiggemacht.
Der Index kann nun heruntergeladen werden unter
http://personal1.iddeo.es/tma4/selfindx.zip (15 MB!)
Die uebrigen erforderlichen Dateien liegen unter
http://dejure.org/jvts/selfarchiv.zip (282 KB)
Erfasst ist der Zeitraum bis zum 18.1.2000.
Es bestehen zwei Moeglichkeiten der "Installation":
entweder werden die beiden ZIP-Dateien in das Verzeichnis "sfarchiv", das
direkt ueber den Quartalsverzeichnissen liegt, entpackt (der Index landet
in einem Unterverzeichnis namens "vt-index"). Dann kann die
Suchmaschine gleich ohne weitere Anpassung benutzt werden.
oder man entpackt in ein Verzeichnis seiner Wahl (was die einzige
Moeglichkeit ist, falls man das Archiv auf CD hat). Dann muss man in den
Dateien "vt.js" und "vt2.js" in der ersten Zeilen die Variable "archiv"
mit der entsprechenden lokalen Basis-URL belegen, z.B.
archiv = "file:///D/Selfhtml/sfarchiv/"
Auch hier gilt:
Der hauptsaechliche technische Unterschied zwischen der Archivsuche und der
Selfhtml-Suche liegt darin, dass bei der Archivsuche die Angaben mit den
Dateititeln nicht zu Beginn der Suchsitzung komplett geladen werden,
sondern immer nur in dem Augenblick, in dem sie zum ersten Mal gebraucht
werden. Das hat den Vorteil, dass keine Wartezeit vor der ersten Suchanfrage
entsteht. Dafuer verlaengert sich die Wartezeit der Ausgabe der
Suchergebnisse diskret etwas bei den ersten Suchanfragen. Sind die
erforderlichen Angaben aber einmal im Speicher, dann bleiben sie auch dort
ueber die ganze Sitzung hinweg. Je mehr Suchanfragen gestellt werden,
umso schneller wird die Suchmachine.
</cite>
CU Roman
1-9 ↩︎
Hallo Roman,
Danke für den Hinweis auf meine Suchmaschine.
Meine Erläuterungen, die Du zitiert hast, sind aber teilweise überholt und aus sich heraus nicht ganz klar:
Im ersten Teil geht es um eine Suchmaschine für die Selfhtml-Dokumentation, die erst in einer späteren Version verfügbar sein wird.
Hinweise zu Installation und Benutzung der Suchmaschine für das Forum stehen jetzt unter
http://dejure.org/self/suche.html
Gruß,
Oliver
Hallo!
Ich lade mir die Suchmaschine von Oliver G. herunter und habe von der
genuegend Zeit, hier in aller Ruhe was zu schreiben:
Roman:
Ein anderer Oliver, naemlich der Oliver García (js@ogu.de), hat
schon eine JS-offline-suche realisiert (sorry for that) ...
ooch, das sehe ich anders, neben dem Nutzen durch die Suchmaschine
selber wollte ich dabei auch noch etwas lernen, und das Ziel habe ich eindeutig erreicht! - Think positive!! :-)
Oliver G.:
Hallo Roman,
Danke für den Hinweis auf meine Suchmaschine.
Meine Erläuterungen, die Du zitiert hast, sind aber teilweise überholt und aus sich heraus nicht ganz klar:
Im ersten Teil geht es um eine Suchmaschine für die Selfhtml-Dokumentation, die erst in einer späteren Version verfügbar sein wird.
Hinweise zu Installation und Benutzung der Suchmaschine für das Forum stehen jetzt unter
http://dejure.org/self/suche.html
Da Deine Suchmaschine eine Volltextsuche darstellt, kann mein kleines
Programm damit natuerlich nicht konkurrieren, da es nur die einzelnen
Threadtitel durchsucht, dafuer braucht es allerdings auch nur rund
200k gepackt ;-)
Sollte sich aber doch noch jemand meine Suchmaschine runterladen und
austesten, so faend' ich Kritik/Anregungen/Anmerkungen toll!
Bis bald
Oliver