Wie oft kommt Google vorbei?
Tom
- zu diesem forum
0 Mathias Bigge0 Stefan Muenz0 molily
0 molily0 Der Martin
Hello,
nur mal so aus Interesse frage ich mal:
wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?
Harzliche Grüße aus http://www.annerschbarrich.de
Tom
Hi Tom,
wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?
Wie Du an dem fehlenden Pagerank der neuen URL sehen kannst, lassen die sich mit der Erfassung unserer neuen Seiten durchaus Zeit....
Viele Grüße
Mathias Bigge
Hallo Tom,
nur mal so aus Interesse frage ich mal:
wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?
Wie oft genau, kann ich dir nicht sagen. Aber immerhin belegte er im Juni 2004 Platz 13 der User-Agent-Hitliste mit 893 Hits. Siehe http://stats.selfhtml.org/webalizer/forum.de.selfhtml.org/usage_200406.html#TOPAGENTS
viele Gruesse
Stefan Muenz
Hallo,
nur mal so aus Interesse frage ich mal:
wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?Wie oft genau, kann ich dir nicht sagen. Aber immerhin belegte er im Juni 2004 Platz 13 der User-Agent-Hitliste mit 893 Hits. Siehe http://stats.selfhtml.org/webalizer/forum.de.selfhtml.org/usage_200406.html#TOPAGENTS
Wenn ich das richtig sehe, ist dort nur die Statistik eines Tages, nämlich des 30. Junis, verzeichnet. Zudem denke ich nicht, dass der User-Agent »Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.co...« tatsächlich der Googlebot ist. Meines Wissens nennt sich der Googlebot ausschließlich »Googlebot/2.1 (+http://www.googlebot.com/bot.html)«. Als solcher ist er dort auch mit 247 Hits verzeichnet. Die Logs bestätigen das, der Googlebot war z.B. heute morgen um halb vier mit dieser Kennung hier und hat sich die robots.txt geholt, /faq/ und /archiv/. Das ist wahrscheinlich der Freshbot, der nicht weiter ins Archiv absteigt.
Vom Juli sind zumindest zwei Tage erfasst: http://stats.selfhtml.org/webalizer/forum.de.selfhtml.org/usage_200407.html#TOPAGENTS
Mathias
Hi Mathias,
Zudem denke ich nicht, dass der User-Agent »Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.co...« tatsächlich der Googlebot ist. Meines Wissens nennt sich der Googlebot ausschließlich »Googlebot/2.1 (+http://www.googlebot.com/bot.html)«.
er identifiziert sich tatsächlich meistens so. Allerdings verzeichne ich, wenn auch sehr selten, Besuche von Google über die erste UserAgent Kennung bei meinen Seiten. Dies sind definitiv Anfragen von Google, zu erkennen an der Google-IP, der Tatsache, daß er sich stets die robots.txt holt, stets nur ganz bestimmte Dateien aufruft, die absolut keine Einstiegsseiten sind und auch keinen Links direkt folgt.
Interessant in diesem Zusammenhang: wie der ebenso echte Google-Spider "Googlebot/Test", der März/April sehr aktiv war, interessiert sich dieser Googlebot sehr für Javascript-Dateien. Ich vermute stark, daß Google dabei ist, Javascript zu lernen um entweder künftig auch Javascript-"Links" zu folgen oder/und um SEO-Tricks besser zu durchschauen.
freundliche Grüße
Ingo
Hallo,
wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?
Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ. Und aufgrund der riesigen Datenmenge im Archiv nehme ich an, dass Google die Dokumente des Archivs größtenteils höchstens einmal im Monat neu indiziert. Es dauert auch einige Zeit, bis neu archivierte Threads in den Index kommen, siehe z.B. http://www.google.at/search?q=site:forum.de.selfhtml.org+2004+juni.
Mathias
Hallo molily,
Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ.
Doch, wird sie. Sie wird nur nicht gecached und die enthaltenen Links werden nicht weiterverfolgt.
Beste Gruesse
Jan
Hallo,
Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ.
Doch, wird sie. Sie wird nur nicht gecached und die enthaltenen Links werden nicht weiterverfolgt.
Ich meinte auch die Postings, dass / abgefragt wird, habe ich gesehen.
Erstaunlich aber ist es schon, dass der Googlebot die Allow-Regeln wie Links wertet. Trotz nofollow wäre ich mir nicht sicher, ob das Verlinken von /faq/ und /archiv/ auf der Hauptseite nicht doch eine Rolle spielt. Wieso z.B. wird gerade /my/ vom Freshbot abgefragt?
Mathias
Hallo molily,
Wieso z.B. wird gerade /my/ vom Freshbot abgefragt?
Vermutlich, weil es auf http://aktuell.de.selfhtml.org/ verlinkt ist.
Beste Gruesse
Jan
Hallo.
Die Forumshauptseite wird übrigens nicht indiziert, falls du das mit »sich durch die Threads lesen« meintest, lediglich das Archiv und die FAQ. Und aufgrund der riesigen Datenmenge im Archiv nehme ich an, dass Google die Dokumente des Archivs größtenteils höchstens einmal im Monat neu indiziert. Es dauert auch einige Zeit, bis neu archivierte Threads in den Index kommen, siehe z.B. http://www.google.at/search?q=site:forum.de.selfhtml.org+2004+juni.
Momentan ist übrigens der 24.6 der letzte Tag zu dem man in Google noch Postings vom SELFForum lesen kann.
Hier habe ich nach folgendem gesucht:
site:forum.de.selfhtml.org SELFHTML "Forumsarchiv / 2004 / Juni" ", 24. 06. 2004,"
http://www.google.at/search?hl=de&ie=UTF-8&q=site%3Aforum.de.selfhtml.org+SELFHTML+"Forumsarchiv+%2F+2004+%2F+Juni"+"%2C+24.+06.+2004%2C"&btnG=Suche&meta=
Und hier habe ich nach folgendem gesucht:
site:forum.de.selfhtml.org SELFHTML "Forumsarchiv / 2004 / Juni" ", 25. 06. 2004,"
http://www.google.at/search?hl=de&ie=UTF-8&q=site%3Aforum.de.selfhtml.org+SELFHTML+"Forumsarchiv+%2F+2004+%2F+Juni"+"%2C+25.+06.+2004%2C"&btnG=Suche&meta=
Und bei der zweiten Eingabe hat Google nichts mehr gefunden.
Schönen Tag noch, H2O
Hallo Tom,
ich kann das natürlich nicht mit Bestimmtheit sagen, aber...
wie oft kommt Google in diesem Forum (seit dem Umzug und früher) vorbei und liest sich durch die Threads?
Ich vermute, doch sehr häufig. Denn ich habe von ein paar Tagen eine Frage hier im Forum gepostet und dabei die URL der Seite angegeben, um die es mir ging. Bis zu diesem Zeitpunkt war diese URL theoretisch nur mir bekannt - zumindest hatte ich sie noch nicht publik gemacht.
Aber in den folgenden zwei Tagen hatte ich plötzlich über 30 (in Worten: über dreißig) Hits vom Googlebot mit dem UA "Googlebot/2.1 (+http://www.googlebot.com/bot.html)", und meine Seite ist jetzt bei Google bekannt. Ob ich das wirklich will, ist eine ganz andere Frage.
Ich werte das jedenfalls als starkes Indiz dafür, dass der Googlebot auch die aktuellen Postings durchliest und von dort aus weitersucht. ;)
Have a nice day,
Martin