Veränderung einer Seite feeden - vgl. page2rss
erig
- php
Moin,
ich möchte per Skript auf meinem eigenen Webspace die Möglichkeit haben, einen Feed aus einer sich ändernden Seite zu erstellen. Denn auch meinem Webspace könnte ich ein kürzeres Aktualisierungs-Interval wählen, um nicht wie bei page2rss oder feedbeater einen Tag auf Updates warten zu müssen oder zu merken, dass der Feed sich doch nicht so verhält, wie ich möchte.
Gibt es für so eine Anforderung schon ein Projekt, ein Framework, um das einfach auf seinem Webspace zu implementieren?
Wenn nicht, wie sind die grundsätzlichen Ansätze soetwas zu realisieren?
Zunächst wird der md5 der kompletten Seite gespeichert, sodass beim nächsten Ablauf des Skripts eventuell schon hier auf Grund von gleicher md5s festgestellt werden kann, dass es keine Änderung gab.
Dann soll die Möglichkeit bestehen über eine Klasse oder Id, die sich im html ändernden bzw. auf Änderung zu überwachenden Teile zu selektieren. Diese müssen nun also aus der Seite extrahiert werden und wieder mit einem md5 dieses Seitenteils des vorherigen Aufrufs verglichen werden.
Hat sich etwas verändert, soll es irgendwie die Möglichkeit geben, Änderungen, die in bestimmten Bereichen auftreten, zu ignorieren, dabei weiß ich nicht nicht, wie genau ich das umsetze. Eventuell schon vorher aus dem Seitenteil die zu ignorierenden Teile ausschneiden und diese md5s vergleichen, das ist ja dann nur noch der Teil, der auf Änderungen überwacht werden soll.
Dann bin ich im Moment am Überlegen, wie ich dann aus diesen 2 Seitenauszügen den wirklich veränderten Teil/Absatz/div/etc. herausfinden kann und eliminieren kann, sodass im Feed später nur zum Beispiel der geänderte Absatz oder das neu hinzugefügte Kommentar landet.
Cheers for ideas,
erig