Hallo,
Egal welchen Zähler ich nutze, es ist nicht möglich herauszufinden, ob es sich bei dem jeweiligen Besucher um eine natürliche Person oder um irgend etwas anderes gehandelt hat z.B. Robot einer Suchmaschine o.ä.. ...
das würde ich so nicht sehen. Jedes Programm, das eine Resource (z.B. eine HTML-Datei oder ein Bild) vom Server anfordert, gibt sich mit einem Identifikationsstring zu erkennen. Dieser kann ehrlich sein, oder auch nicht. Robots können sich als normaler Browser tarnen, "normale" Besucher können ihren Browserstring ändern und sich als Suchmaschine ausgeben.
also taugt der User Agent als Erkennungsmerkmal schon nicht mehr. Zumindest nicht allein.
Außerdem erkenne ich Robots in meinen LOG-Files auch daran, dass sie nur HTML-Dokumente anfordern, nicht aber die css-Datei oder die Bilder.
In der Regel ist das wohl so.
Und ein "normaler" User wird kaum mehrere oder sogar alle Seiten in weniger als einer Sekunde anfordern.
Ein Bot auch nicht. In meinen Logs sind Bots von Google, Yahoo und MSN auch regelmäßige Besucher - aber sie holen sich immer nur ein Dokument, selten mal zwei kurz nacheinander, und sind dann wieder für ein paar Stunden weg.
Daher glaube ich schon, das man Personen und Robots schon unterscheiden kann, wenn auch nicht mit 100%iger Genauigkeit.
Dann muss man aber schon eine sehr komplexe Auswertung machen. Ja, wenn ich meine Logs selbst durchsehe, kann ich für jeden Eintrag mit relativ großer Sicherheit sagen, ob es ein Bot oder ein "richtiger" Besucher war. Aber ich könnte meine Entscheidungsgrundlagen nicht eindeutig genug formulieren, um daraus einen Algorithmus abzuleiten. Zuviel "Bauchgefühl".
Ciao,
Martin
Wenn alle das täten, wass sie mich können,
käme ich gar nicht mehr zum Sitzen.