pixxma: Suchmaschine für Intranet gesucht

Hallo,

ich suche eine Suchmaschine für ein kleineres Intranet (ca. 100 HTML/PHP-Seiten mit ca. 1000 verlinkten .pdf-/.doc-/.xls-/.ppt-Dokumenten). Die Suchmaschine sollte möglichst einfach zu implementieren sein.

Es würde schon ausreichen, wenn man nur die HTML/PHP-Seiten durchsuchen könnte.

Fantastisch, aber nicht unbedingt notwendig wäre die Option, die Suche auf die verlinkten Dokumente erweitern zu können.

Hat jemand eine Idee was man benutzen könnte bzw. gute Erfahrungen mit einem entsprechenden Produkt gemacht?

MfG

pixxma

  1. Hat jemand eine Idee was man benutzen könnte bzw. gute Erfahrungen mit einem entsprechenden Produkt gemacht?

    Google?

    1. Google?

      Kommando zurück, da ist selbst die kleinste Variante der absolute Overkill.

  2. moinmoin pixxma

    was soll sie denn können?
    so ohne Anhaltspunkte kann man dir schwer nen Ratschlag geben.

    vielleicht kuckst du mal hier
     (http://www.homepagesearchengine.com/features_de.phtml)
    oder hier (http://www.php4-forum.de/beispiele/suchmaschine.htm)
    oder bei den diversen pearl-Portalen, da sollte sich einiges finden lassen

    Gruß Krischi

    1. Moin Moin!

      Ich setze gelegentlich Swish-E ein, mir reicht das in den meisten Fällen.

      Ohne Zusätze verdaut Swish-E nur Plain Text, HTML und XML, aber wenn man ein paar Konverter dazu packt, kann Swish-E prinzipiell alles in den Index aufnehmen.

      Für *.doc gibt's z.B. word2x, *.xls könnte man mit Spreadsheet::ParseExcel angehen und als XML ausspucken, *.ppt notfalls in PDF konvertieren, PDF zu Postscript (pdf2ps), Postscript zu Plain Text (ps2ascii). Die neueren *.docx, *.xlsx, *.pptx(?) sind ebenso wie die OpenOffice-Formate ohnehin nur gezippte XML-Sammlungen, da reicht unzip und etwas Scripting.

      Alexander

      --
      Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".