Oliver: (ZU DIESEM FORUM) Offline Suchmaschine für das Forum in JavaScript

Hallo allerseits,

seit geraumer Zeit benutze ich SELFHTML und finde es klasse. :o)
Besonders dieses Forum hat mir immer wieder bei kniffeligen
Fragen helfen können, da viele spezielle Probleme bereits
das eine oder andere mal angesprochen wurden. Darum habe
ich mir auch immer schön fleissig das Forumsarchiv runtergeladen,
um lokal auf meiner HD damit arbeiten zu können. - Leider gibt es
dafür keine einfache Suchmaschine, zwar ein CGI-Script, auf das
in älteren Threads schon einmal hingewiesen wurde, aber dafür
muß man so etwas erst einmal installiert haben. Und die Online-Suche
ist auch immer mit Kosten verbunden. Somit gestaltete
sich für mich die Archiv-Suche immer noch sehr umständlich.

Um diese Schwachstelle für mich zu umgehen, habe ich eine kleine
Suchmaschine in JavaScript realisiert, die die Threadtitel,
wie sie in den Indexdateien im Archiv stehen, durchsucht.

Wer von Euch an so etwas Interesse hat, kann sie sich unter

http://www.tu-bs.de/~y0004525/selfhtmlforumsearch.zip

downloaden und austesten. Die Datei ist 213k gross.

Die Suchmaschine berücksichtigt im Augenblick alle vorhandenen Quartale,
also von 3/1998 bis 1/2000 und muß im Unterverzeichnis "selfhtml/sfarchiv/"
entpackt werden. Dabei wird die bestehende "index.htm" überschrieben,
da die neue Version einen Link zur Suchmaschine enthält.
Getestet habe ich sie auf IE5 und NN4.61 und läuft, allerdings nicht
auf Opera 3.6.

Die Performance ist IMHO OK. Auf meinem K6 mit 233Mhz und 64MB braucht
eine Suchanfrage, die rund 2000 Treffer hat (z.b:'javascript') auf dem
IE knapp 3 Sek. und auf dem NN ca. 7 Sek. Dabei ist der entscheidende Faktor
die Trefferanzahl, nicht die Anzahl der zu durchsuchenden Beiträge, d.h.
Anfragen mit weniger Treffern gehen deutlich fixer.

Viel Spass und ein effizientes Suchen

Oliver

  1. Hi Oliver!

    Ein anderer Oliver, naemlich der Oliver García (js@ogu.de), hat schon eine JS-offline-suche realisiert (sorry for that) - am besten poste ich einfach mal - was er dazu geschrieben hat:

    <cite>
    ich habe jetzt die Netscape-Version der Selfhtml-Suche fertiggestellt und
    nebenbei die bisherige Version (fuer IE und Netscape <=4.04) etwas verbessert.
    Beides kann heruntergeladen werden unter
    http://dejure.org/jvts/selfsuche2.zip (18 KB)

    Die Zip-Datei bitte ins Selfhtml-Verzeichnis entpacken, die bisherigen
    Programmdateien der Suchmaschine werden ersetzt, der Index (aus
    http://dejure.org/selfsuche.zip) bleibt der gleiche.
    Zur Benutzung der Suchmaschine wird wie bisher aufgerufen "suche.html"
    fuer IE und Netscape bis einschliesslich Version 4.04.
    Netscape darueber laeuft nunmehr mit "suchen.html".

    Ich hatte eigentlich vor, eine automatische Weiterleitung zu integrieren, die
    so funktioniert haette, dass "suche.html" die allgemeingueltige Startseite ist,
    und von dort aus je nach Browser "suchen.html" geladen wird.
    Leider hat das nicht geklappt, da aus irgendeinem Grund Netscape 4.6 mit dem
    Code:
    if (document.layers && navigator.appVersion.substr(2).match(/[1]^0[5-9]/)) location.href="suchen.html"
    abstuerzt. Der Code ist in Ordnung und isoliert laeuft er auch, nur in der
    konkreten Datei "suche.html" gibt es offenbar keine Stelle, wo ich ihn
    hinlegen kann, ohne dass es zum Absturz kommt.
    Stattdessen wird man spaeter die Verteilung von einer Seite aus machen muessen,
    die beiden Suchmasken vorgelagert ist.

    Die neue Netscape-Version hat die gleichen Leistungsmerkmale wie die
    bisherige IE-Version. Allerdings hat Netscape in diesen hoeheren Versionen
    einige Probleme mit seinem Zeichensatz. Deshalb wird die _Phrasensuche_
    erst richtig funktionieren, wenn ich den Index neu erstellt habe.

    Was weiter aussteht ist die Anpassung des Layouts. Vorschlaege sind immer
    noch erbeten.

    Zum zweiten:
    Es ist der Wunsch nach einer Version der Offline-Suchmaschine fuer das
    Forumsarchiv laut geworden. Deshalb habe ich die Vervollstaendigung der
    Opera-Version zurueckgestellt und die Forumsarchivsuche fertiggemacht.
    Der Index kann nun heruntergeladen werden unter
    http://personal1.iddeo.es/tma4/selfindx.zip (15 MB!)
    Die uebrigen erforderlichen Dateien liegen unter
    http://dejure.org/jvts/selfarchiv.zip (282 KB)
    Erfasst ist der Zeitraum bis zum 18.1.2000.

    Es bestehen zwei Moeglichkeiten der "Installation":

    • entweder werden die beiden ZIP-Dateien in das Verzeichnis "sfarchiv", das
      direkt ueber den Quartalsverzeichnissen liegt, entpackt (der Index landet
      in einem Unterverzeichnis namens "vt-index"). Dann kann die
      Suchmaschine gleich ohne weitere Anpassung benutzt werden.

    • oder man entpackt in ein Verzeichnis seiner Wahl (was die einzige
      Moeglichkeit ist, falls man das Archiv auf CD hat). Dann muss man in den
      Dateien "vt.js" und "vt2.js" in der ersten Zeilen die Variable "archiv"
      mit der entsprechenden lokalen Basis-URL belegen, z.B.
      archiv = "file:///D/Selfhtml/sfarchiv/"

    Auch hier gilt:

    • "suche.html" ist zustaendig fuer Internet Explorer und
      Netscape <= 4.04,
    • "suchen.html" fuer Netscape > 4.04.
      Letztere Version verschluckt allerdings noch ein paar Ergebnisse bei
      der Phrasensuche - aus dem oben genannten Grund.

    Der hauptsaechliche technische Unterschied zwischen der Archivsuche und der
    Selfhtml-Suche liegt darin, dass bei der Archivsuche die Angaben mit den
    Dateititeln nicht zu Beginn der Suchsitzung komplett geladen werden,
    sondern immer nur in dem Augenblick, in dem sie zum ersten Mal gebraucht
    werden. Das hat den Vorteil, dass keine Wartezeit vor der ersten Suchanfrage
    entsteht. Dafuer verlaengert sich die Wartezeit der Ausgabe der
    Suchergebnisse diskret etwas bei den ersten Suchanfragen. Sind die
    erforderlichen Angaben aber einmal im Speicher, dann bleiben sie auch dort
    ueber die ganze Sitzung hinweg. Je mehr Suchanfragen gestellt werden,
    umso schneller wird die Suchmachine.
    </cite>

    CU Roman


    1. 1-9 ↩︎

    1. Hallo Roman,

      Danke für den Hinweis auf meine Suchmaschine.
      Meine Erläuterungen, die Du zitiert hast, sind aber teilweise überholt und aus sich heraus nicht ganz klar:
      Im ersten Teil geht es um eine Suchmaschine für die Selfhtml-Dokumentation, die erst in einer späteren Version verfügbar sein wird.
      Hinweise zu Installation und Benutzung der Suchmaschine für das Forum stehen jetzt unter
      http://dejure.org/self/suche.html

      Gruß,

      Oliver

      1. Hallo!

        Ich lade mir die Suchmaschine von Oliver G. herunter und habe von der
        genuegend Zeit, hier in aller Ruhe was zu schreiben:

        Roman:

        Ein anderer Oliver, naemlich der Oliver García (js@ogu.de), hat
        schon eine JS-offline-suche realisiert (sorry for that) ...

        ooch, das sehe ich anders, neben dem Nutzen durch die Suchmaschine
        selber wollte ich dabei auch noch etwas lernen, und das Ziel habe ich eindeutig erreicht! - Think positive!! :-)

        Oliver G.:

        Hallo Roman,

        Danke für den Hinweis auf meine Suchmaschine.
        Meine Erläuterungen, die Du zitiert hast, sind aber teilweise überholt und aus sich heraus nicht ganz klar:
        Im ersten Teil geht es um eine Suchmaschine für die Selfhtml-Dokumentation, die erst in einer späteren Version verfügbar sein wird.
        Hinweise zu Installation und Benutzung der Suchmaschine für das Forum stehen jetzt unter
        http://dejure.org/self/suche.html

        Da Deine Suchmaschine eine Volltextsuche darstellt, kann mein kleines
        Programm damit natuerlich nicht konkurrieren, da es nur die einzelnen
        Threadtitel durchsucht, dafuer braucht es allerdings auch nur rund
        200k gepackt ;-)

        Sollte sich aber doch noch jemand meine Suchmaschine runterladen und
        austesten, so faend' ich Kritik/Anregungen/Anmerkungen toll!

        Bis bald
        Oliver