Sven Rautenberg: Mini-Suchmaschine für Webseite

Beitrag lesen

Könnt Ihr mir eventuell bei einem Ansatz helfen? Ich blicke echt nicht durch bei den ganzen Download-Skripts und möchte lieber versuchen es selbst zu erarbeiten und zu entwickeln.

Ansatz fehlt? Das ist einfach:

Du öffnest das Verzeichnis und liest alle vorhandenen Dateinamen (oder nur die auf *.html - je nachdem). Dann öffnest du jede gefundene Datei und liest deren Inhalt ein. Du vergleichst jede Textzeile mit dem Suchwort, wobei du (Aufgabe für später) natürlich den Text in HTML-Tags nicht suchen solltest, aber (Aufgabe für viel später) vielleicht die Relevanz von gefundenen Suchbegriffen innerhalb von <title>, <meta>, <h1..7> oder sonstigen, von dir als Titel oder Kennzeichnung benutzten Tags erhöhst.

Im Prinzip rechnest du für jede Seite eine Zahl aus. Jeder gefundene Suchbegriff ist einen Punkt wert - damit kommen gefundene Seiten mit mehreren Treffern weiter nach vorn, als Seiten mit nur einem Treffer.

Treffer in der Überschrift könnten z.B. drei Punkte wert sein, und so weiter.

Wenn du eine Liste der gefundenen Seiten hast, gibst du als Ergebnis die Links zu den Seiten und vielleicht noch ein wenig Teaser-Text aus - fertig ist die kleine Suchmaschine.

Ich finde diese Aufgabe zum Üben von Perl sehr schön, und durchaus nicht zuviel. Klein anfangen, erstmal überhaupt was finden, und später dann das Finden ausfeilen. Ist im Ergebnis bestimmt besser, als wenn du irgendein gefundenes Skript nimmst, was seine eigene Bewertung hat, die man nicht ändern und auf die eigene Seite anpassen kann...

- Sven Rautenberg