Henryk Plötz: Script: dynamisch Seiten zu statische Seiten

Beitrag lesen

Moin

Ich denke, dass für dieses Problem Perl besser geeignet wäre, da Perl bereits Module hierzu anbietet:

Nein, besser geeignet sind Tools wie wget: http://www.gnu.org/software/wget/wget.html

Mit php wirst du wohl alles selber programmieren müssen ;-(

Nein, du _kannst_ alles selber programmieren. Beispiele waren zumindest früher in den User notes zu fsockopen() in der PHP-Doku (keine Ahnung wo die jetzt hin sind).
Es geht aber mit fopen viel einfacher: fopen("http://blablabla"). Dann einfach alles einlesen, alles rausgreifen was nach URL klingt (schau mal im Archiv nach dem Regexp dafür) oder als href-Attribut in einem <a>-Element ist (natürlich musst du dann auch nach <script> <link> etc. schauen) und rekursiv verfolgen.

Eine dritte Möglichkeit die ich manchmal einsetze, wenn es nur darum geht den Aufbau von größtenteils statischen Seiten zu beschleunigen: Die Ausgabe cachen. Dazu schaust du am Anfang des Skriptes nach, ob bereits eine Cache-Datei existiert, und wenn ja, ob sie noch aktuell ist (im einfachsten Fall ist sie aktuell, wenn die Änderungszeit der Cache-Datei neuer ist, als die Änderungszeit der Skriptdatei, ggbf. musst du aber noch externe Datenquellen beachten) und wenn ja, gibst du einfach die Cache-Datei mit readfile() aus und beendest dich. Ansonsten startest du Output-Buffering mit ob_start(), lässt das Skript durchlaufen, holst dir den Inhalt des Puffers mit ob_get_contents(), schreibst den Inhalt in die Cache-Datei und sendest den Puffer an den Browser mit ob_end_flush().

--
Henryk Plötz
Grüße aus Berlin