spider: Externe Internetseite parsen

Hallo zusammen!

Ich bin ein absoluter Newbie in Sachen PHP ;), also bitte schön
"einfach" antworten.

Folgendes Probelm:

Ich soll aus einer externen Internetseite www.misco.de
alle Produkte herausfiltern, die auf der Startseite vorhanden sind.
Nur, wie mache ich dass? Also, wie komme ich an das "File" heran,
um es dementsprechend nach den nötigen Informationen zu durchsuchen?
Ich habe keinerlei zugriffsberechtigung zum Server oder der gleichen, nur die Internetseite.

Ich würde mich über Antworten wirklich sehr freuen...
Gruß

  1. Hallo,

    das sollte dir helfen:

    <?php
    $fp = fsockopen("www.example.com", 80, $errno, $errstr, 30);
    if (!$fp) {
       echo "$errstr ($errno)<br />\n";
    } else {
       $out = "GET / HTTP/1.1\r\n";
       $out .= "Host: www.example.com\r\n";
       $out .= "Connection: Close\r\n\r\n";

    fwrite($fp, $out);
       while (!feof($fp)) {
           echo fgets($fp, 128);
       }
       fclose($fp);
    }
    ?>

    1. Hallo,

      $out = "GET / HTTP/1.1\r\n";

      fwrite($fp, $out);
         while (!feof($fp)) {
             echo fgets($fp, 128);
         }

      das Script kommt mit Trasfer-Encoding "chunked" nicht zurecht.
      http://forum.de.selfhtml.org/archiv/2006/4/t128318/#m829037

      Gruß aus Berlin!
      eddi

      1. hallo an alle!

        Vielen Dank schon einmal für eure Antworten!
        Ich bin gerade auf dem Sprung und werde mir morgen
        das alles mal in ruhe ansehen :)
        Vielen vielen Dank!!!!

        Gruß

  2. Hallo,

    Ich soll aus einer externen Internetseite www.misco.de
    alle Produkte herausfiltern, die auf der Startseite vorhanden sind.

    Mit der PHP Funktion file() kannst du auch auf Inhalte auf anderen Servern zugreifen. Also mit
    $source=file("http://www.misco.de/");
    kommst du an den Quelltext. Nun musst du dir überlegen wie du den Quelltext auswertest. Die Überschrift eines Produkts wird z.B. durch
    <h1 class="SpotHeader">...</h1>
    eingeschlossen, die Beschreibung dann von <h2 class="SpotCopy">...</h2>.

    Viele Grüße

    --
    Nichts auf der Welt ist so gerecht verteilt wie der Verstand. Denn jedermann ist überzeugt, dass er genug davon habe.
    René Descartes