Joachim W.: Suchmaschine optimieren

hi

mir hat sich noch nicht so richtig der unterschied zwischen "id" und "class" erklärt, letztendlich ist es doch das selbe, nur einmal weise ich halt mit id und das andere mal mit class zu, oder?

'ne id darf es pro dokument nur einmal geben, class dagegen mehrfach.

mfg, jan aus dresden-land unter

Grüße aus Bleckede ['nen Ende Elb-Ab]

Kai

  1. Hallo,

    In der letzten Woche hab ich mir eine Suchmaschine für meine selfhtml-dateien zusammengebastelt! Leider braucht sie beim Suchen
    einen Wortes in 8000 Dateien 130 Sekunden. Dashalb frage ich euch um Optimierung meiner Suchmaschine.

    Viel Spaß beim Fehlersuchen!!
    P.S. Diese Suchmaschine funktioniert einwandfrei, aber die Wartezeit ...!!

    Vielen Dank für Ihren Auftrag :)

    Zur Optimierung empfehlen wir die Installation eines Index-DB-System.
    Für diese Beratung berechnen wir Ihnen zzgl. Feiertagstarif und Märchensteuer
    einen Betrag von 240,56 DM.

    Mit freundlichen Grüßen,
      Wolfgang Wiese

    P.S.: Les mal die FAQ!

  2. Hallo,

    Dashalb frage ich euch um Optimierung meiner Suchmaschine.

    Viel Spaß beim Fehlersuchen!!
    P.S. Diese Suchmaschine funktioniert einwandfrei, aber die Wartezeit ...!!

    Ok. ich will mich jetzt gar nicht auf viele Details einlassen, sonst macht es ja Dir keinen Spaß mehr. Nur ein paar Fragen als Anregungen zum nachdenken.

    -- Warum join um den Dateinamen zusammenzusetzen? Perl kennt interpolierte Strings

    -- Warum chomp?

    -- Warum überhaußt die ganze Datei einlesen, zusammenstöpseln und dann erst analysieren? Du willst ja sowieso nur wissen, ob in der Datei das suchmuster gefunden wird. Lese nur soweit, wie es unbedingt notwendig ist.

    -- Die Titelermittlung könnten auch etwas optimiert werden.

    Na ja, ist ja schon was, oder?

    Grüße
      Klaus

  3. Hi,

    In der letzten Woche hab ich mir eine Suchmaschine für meine selfhtml-dateien zusammengebastelt!
    Leider braucht sie beim Suchen einen Wortes in 8000 Dateien 130 Sekunden.

    SELFHTML alleine hat keine 8000 Dateien.
    Was genau durchsuchst Du also?

    Unterstützt Deine Maschine etwas, das ich in http://www.teamone.de/cgi-local/self/search/sfasuch.pl noch einbauen sollte?

    Du scheinst HTML-Dateien zu parsen - die genannte Suchmaschine erwartet eine Vorverarbeitung (HTML-Tags raus, Entities-Codierung u.v.a.m) und sucht nur noch in den Ergebnisdateien.
    Das sind dann zwar immer noch 80+MB, aber eine Komplettsuche dauert (auf dem Teamone-Server) nur 10-20 Sekunden. (Auf einem Pentium-III/500MHz mit 128 MB Speicher übrigens wesentlich weniger, nur so um die 3 Sekunden.)

    mfG - Michael

    1. Hi nochmal,

      Unterstützt Deine Maschine etwas, das ich in http://www.teamone.de/cgi-local/self/search/sfasuch.pl noch einbauen sollte?

      ups - verzockt (da soll sie mal hin, ist sie aber noch nicht):

      Also: http://www.teamone.de/cgi-local/self/search/2.98/sfasuch.pl meinte ich natürlich.
      (*Den* Link mußte ich korrigieren, sonst könnt ihr ja nix testen ... ;-)

      mfG - Michael