Externe Internetseite parsen
spider
- php
Hallo zusammen!
Ich bin ein absoluter Newbie in Sachen PHP ;), also bitte schön
"einfach" antworten.
Folgendes Probelm:
Ich soll aus einer externen Internetseite www.misco.de
alle Produkte herausfiltern, die auf der Startseite vorhanden sind.
Nur, wie mache ich dass? Also, wie komme ich an das "File" heran,
um es dementsprechend nach den nötigen Informationen zu durchsuchen?
Ich habe keinerlei zugriffsberechtigung zum Server oder der gleichen, nur die Internetseite.
Ich würde mich über Antworten wirklich sehr freuen...
Gruß
Hallo,
das sollte dir helfen:
<?php
$fp = fsockopen("www.example.com", 80, $errno, $errstr, 30);
if (!$fp) {
echo "$errstr ($errno)<br />\n";
} else {
$out = "GET / HTTP/1.1\r\n";
$out .= "Host: www.example.com\r\n";
$out .= "Connection: Close\r\n\r\n";
fwrite($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
fclose($fp);
}
?>
Hallo,
$out = "GET / HTTP/1.1\r\n";
fwrite($fp, $out);
while (!feof($fp)) {
echo fgets($fp, 128);
}
das Script kommt mit Trasfer-Encoding "chunked" nicht zurecht.
http://forum.de.selfhtml.org/archiv/2006/4/t128318/#m829037
Gruß aus Berlin!
eddi
hallo an alle!
Vielen Dank schon einmal für eure Antworten!
Ich bin gerade auf dem Sprung und werde mir morgen
das alles mal in ruhe ansehen :)
Vielen vielen Dank!!!!
Gruß
Hallo,
Ich soll aus einer externen Internetseite www.misco.de
alle Produkte herausfiltern, die auf der Startseite vorhanden sind.
Mit der PHP Funktion file() kannst du auch auf Inhalte auf anderen Servern zugreifen. Also mit
$source=file("http://www.misco.de/");
kommst du an den Quelltext. Nun musst du dir überlegen wie du den Quelltext auswertest. Die Überschrift eines Produkts wird z.B. durch
<h1 class="SpotHeader">...</h1>
eingeschlossen, die Beschreibung dann von <h2 class="SpotCopy">...</h2>
.
Viele Grüße