Philipp Hasenfratz: Dateien beim Suchen ausschließen

Beitrag lesen

Halihallo

Nun sollen aber einige html-Dateien nicht durchsucht werden, weil es Frames oder Navigationsframes sind.

Als erstes kam mir eine Art ini-Datei in den Sinn. Dort kann man Kategorien angeben, Unterkategorien und die dazugehörigen html-Dateien. So kann man auch schön das Ergebnis sortiert angeben. Das mit der ini-Datei habe ich probiert. Die ini-Datei muß hier genau bearbeitet werden, keine Tippfehler bei den Dateinamen etc.

Das gibt aber ganz schön was zu schreiben, nicht?

Als zweites, in jede Datei, die durchsucht werden darf, mit z.B. <!--suche--> in der ersten Zeile zu versehen. Ich schaue dann immer zuerst ob der Parameter eingetragen ist. Die Titel der Seite hole ich mir dann aus dem title-Tag, nach dem ich dann auch die Suchergebnisse sortieren kann.

Wäre es nicht wesentlich einfacher und schneller zu realisieren, wenn man:

---

in der INI-Datei RegularExpressions definiert, welche Dateien ausgeschlossen werden sollen?

z. B.

/nav/
/frameset/
/^/test/index.html$/

natürlich stellt dies einige Anforderungen an die Benennung der Dateien. Z. B. müssen alle HTML-Dateien, welche ein Frameset enthalten den String frameset enthalten (eg. /test/topframeset.html)

---

man könnte auch eine INI-Datei erstellen, wo die Verzeichnisse eingetragen sind, welche Nutzdaten enthalten (dann müssen sich einfach alle anderen Dateien in anderen Verzeichnissen befinden).

---

oder man stellt durch einige RegularExpressions fest, ob die Datei einen navigationstypische bzw. framesettypische Daten enthält.

/<frameset>(*.?)</frameset>/
/<script>(*.?)function show_nav()(*.?)</script>/

---

warum muss den noch überprüft werden, ob es sich um ein Frameset/Navbar handelt, wenn diese Dateien doch gar kein <!--suche--> enthalten müssen? - Diese werden dann doch automatisch vor einer Durchsuchung befreit, oder?

---

Man kann die Ergebnisse auch durch die path-Angaben/Erstelldatum/(Anzahl zutreffender Worte) sortieren. Je tiefer die Verschachtelung, desto unwichtiger ist das Ergebnis

---

Viele Grüsse

Philipp

PS: Entschuldigung, falls ich die Frage nicht richtig verstanden habe. Mir scheint, als ob ich nicht wirklich helfen kann. Aber versuchen kann ich es ja trotzdem...