Hallo
würde gerne ein kleines Script, welches anhand der Source einer Seite einen möglichst sinnvollen Satz zusammenschnippselt aus den Texten in der Source, der die Seite in einem oder in wenigen Sätzen beschreibt.
Hat sich schonmal jemand Gedanken dazu gemacht oder gibt es irgendwelche Projekte dazu?
Lese die Datei aus, extrahiere aus dem Inhalt den Text und wähle daraus einige Sätze aus, die den Inhalt der Seite beschreiben. Dein Problem dürfte sich dann auf den letzten Punkt beschränken. Denn: Welche der Textteile beschreiben den Inhalt der ganzen Seite hinreichend?
Es soll eben nicht so sein, dass "einfach" nur ein beliebiger Satz aus der Source herausgesucht wird und dann so übernommen wird.
Eben, eben. Woher soll das Skript wissen, welche Textteile relevant sind? Dazu müsstest du sie, die Textteile, auf der zu indizierenden Seite markieren. Beispielsweise mit einem <span class="beschreibung">...text...</span>
, nach dem/denen du im Suchskript fahndest.
Wenn es wirklich nicht anders geht, müsste halt doch wieder das hässliche Prinzip der Keywords herhalten, sodass Standardsätze wie "Dieses Seite behandelt die Themen "..."und befasst sich mit"... etc. aber das ist ja auch nicht das gelbe vom ei, oder?
Wäre auch eine Möglichkeit. Dann lässt du das Skript nach ~~~html
<meta name="description" content="...text...">
Tschö, Auge
--
Die Musik drückt aus, was nicht gesagt werden kann und worüber es unmöglich ist zu schweigen.
(Victor Hugo)
[Veranstaltungsdatenbank Vdb 0.1](http://termindbase.auge8472.de/)