Mit php Position in Google auslesen
Dieter Hillen
- php
Hallo,
ich suche eine Möglichkeit anhand eines vorgegebenen Suchworts in Google herauszufinden, an welcher Stelle eine URL, also Website, das erste Mal auftaucht.
Wie ich per Parsen das ganze einigermaßen basteln könnte ist mir klar, aber evtl. hat jemand von euch einen besseren Tipp, oder kennt eine Open-Source Lösung.
Bin für jeden Tipp dankbar.
Gruß Dieter
Mal bei Google nach ner API Schnittstelle gefragt?
Hallo,
bei google kannst Du einen GET Request machen für die Suche mit entsprechenden Suchbegriffen. Diese Liste nimmst Du entgegen für den Parser, der die Position der URL sucht.
Die zweite Sache ist die, dass google das Ergebnis mit einem bestimmten Limit ausgibt. Diesen Limit musst Du auch noch setzen, so wie ich gesehen habe, wird der in einem Cookie gespeichert. Den musst Du manipulieren (auf 100 oder mehr, wenn möglich, testen...) und im request-header mitschicken.
Andererseits gehts auch so, dass Du den Limit auf 1 setzt und das Script solange an google schickst, bis Deine URL als Treffer angezeigt wird (google wird sich freuen ;-) )
Viel Glück,
--roro
Hallo,
bei google kannst Du einen GET Request machen für die Suche mit entsprechenden Suchbegriffen. Diese Liste nimmst Du entgegen für den Parser, der die Position der URL sucht.
Die zweite Sache ist die, dass google das Ergebnis mit einem bestimmten Limit ausgibt. Diesen Limit musst Du auch noch setzen, so wie ich gesehen habe, wird der in einem Cookie gespeichert. Den musst Du manipulieren (auf 100 oder mehr, wenn möglich, testen...) und im request-header mitschicken.
Andererseits gehts auch so, dass Du den Limit auf 1 setzt und das Script solange an google schickst, bis Deine URL als Treffer angezeigt wird (google wird sich freuen ;-) )
Viel Glück,
--roro
Danke für die Tipps!
Die Google API gibt es, nur leider liefert sie wohl andere Positionen, da sie einen etwas anderen Datenbestand nutzt... Das ist natürlich wenig sinnvoll.
Zum Request und den Cookies, diese sehen von Google leider so ein:
__utma
173272373.1316806501.1155724758.1155724758.1156326853.2
google.com/
1600
2350186496
32111674
377028944
29804186
*
__utmz
173272373.1156326853.2.2.utmccn=(referral)|utmcsr=code.google.com|utmcct=/|utmcmd=referral
google.com/
1600
3536728192
29840898
377028944
29804186
*
PREF
ID=fa4499516ae1fea5:TM=1155803541:LM=1155803541:S=1I6ChU-weiI7owEI
google.com/
1536
2618878336
32111634
2825602768
29802967
*
SID
DQAAAGwAAAAgFUp1mec84NWh-otGKx26MApwlcMIYHQXqr2UlLaaH9yMGf3gKO9R9jVi7mSmzGUSqipCaxa_ytW_3YWTeDNKZIIH57vSmTLLyPqouFs8PdcaP24VDkHGGOJFfTdCoJRajFzWEIdCDHf87ORg7btw
google.com/
1536
1255090176
30538469
2477354656
29804214
*
Dieter