Dieter Hillen: Mit php Position in Google auslesen

Hallo,

ich suche eine Möglichkeit anhand eines vorgegebenen Suchworts in Google herauszufinden, an welcher Stelle eine URL, also Website, das erste Mal auftaucht.

Wie ich per Parsen das ganze einigermaßen basteln könnte ist mir klar, aber evtl. hat jemand von euch einen besseren Tipp, oder kennt eine Open-Source Lösung.

Bin für jeden Tipp dankbar.

Gruß Dieter

  1. Mal bei Google nach ner API Schnittstelle gefragt?

  2. Hallo,

    bei google kannst Du einen GET Request machen für die Suche mit entsprechenden Suchbegriffen. Diese Liste nimmst Du entgegen für den Parser, der die Position der URL sucht.

    Die zweite Sache ist die, dass google das Ergebnis mit einem bestimmten Limit ausgibt. Diesen Limit musst Du auch noch setzen, so wie ich gesehen habe, wird der in einem Cookie gespeichert. Den musst Du manipulieren (auf 100 oder mehr, wenn möglich, testen...) und im request-header mitschicken.

    Andererseits gehts auch so, dass Du den Limit auf 1 setzt und das Script solange an google schickst, bis Deine URL als Treffer angezeigt wird (google wird sich freuen ;-) )

    Viel Glück,
    --roro

    1. Hallo,

      bei google kannst Du einen GET Request machen für die Suche mit entsprechenden Suchbegriffen. Diese Liste nimmst Du entgegen für den Parser, der die Position der URL sucht.

      Die zweite Sache ist die, dass google das Ergebnis mit einem bestimmten Limit ausgibt. Diesen Limit musst Du auch noch setzen, so wie ich gesehen habe, wird der in einem Cookie gespeichert. Den musst Du manipulieren (auf 100 oder mehr, wenn möglich, testen...) und im request-header mitschicken.

      Andererseits gehts auch so, dass Du den Limit auf 1 setzt und das Script solange an google schickst, bis Deine URL als Treffer angezeigt wird (google wird sich freuen ;-) )

      Viel Glück,
      --roro

      Danke für die Tipps!

      Die Google API gibt es, nur leider liefert sie wohl andere Positionen, da sie einen etwas anderen Datenbestand nutzt... Das ist natürlich wenig sinnvoll.

      Zum Request und den Cookies, diese sehen von Google leider so ein:
      __utma
      173272373.1316806501.1155724758.1155724758.1156326853.2
      google.com/
      1600
      2350186496
      32111674
      377028944
      29804186
      *
      __utmz
      173272373.1156326853.2.2.utmccn=(referral)|utmcsr=code.google.com|utmcct=/|utmcmd=referral
      google.com/
      1600
      3536728192
      29840898
      377028944
      29804186
      *
      PREF
      ID=fa4499516ae1fea5:TM=1155803541:LM=1155803541:S=1I6ChU-weiI7owEI
      google.com/
      1536
      2618878336
      32111634
      2825602768
      29802967
      *
      SID
      DQAAAGwAAAAgFUp1mec84NWh-otGKx26MApwlcMIYHQXqr2UlLaaH9yMGf3gKO9R9jVi7mSmzGUSqipCaxa_ytW_3YWTeDNKZIIH57vSmTLLyPqouFs8PdcaP24VDkHGGOJFfTdCoJRajFzWEIdCDHf87ORg7btw
      google.com/
      1536
      1255090176
      30538469
      2477354656
      29804214
      *

      Dieter