Ralf: Neue Besucher ermitteln?

Gumo!

Man liest ja immer wieder auf Seitenstatistiken Punkte wie "neue Besucher".
Hierbei frage ich mich, ob solche Angaben nicht reiner Humbug sind, denn nach meinem Verständnis kann ich nicht nachvollziehen, wie "neue" Besuche überhaupt zu ermitteln sein sollen.
Was beim senden von Suchanfragen über Formulare etc. meines Wissens überhaupt übermittelt werden kann, sind doch nur (und das auch mit Einschränkungen) die IP-Adresse, Angaben über den Browser und- falls javascript aktiv ist vielleicht auch noch die Auflösung.
Wenn man jetzt mal das vermeindlich wichtigste Kriterium, also die Ip-Adresse, zur Hand nimmt, so wird diese ja von den meisten Besucher nicht statisch sondern dynamisch verwendet. Zumindest eben wenn man von Otto-Normalbesuchern, die über ihren t-online-etc.-Anschluß ins Netz gehen.

Meine Frage deshalb:
Fehlt mir nur das technische Verständnis dafür einigermaßen verlässig "neue" Besucher erfassen zu können, oder sind solche Angaben tatsächlich reine Augenwischerei?

  1. Hi!

    Fehlt mir nur das technische Verständnis dafür einigermaßen verlässig "neue" Besucher erfassen zu können, oder sind solche Angaben tatsächlich reine Augenwischerei?

    Du hast Cookies vergessen. Aber ansonsten: Ja zum letzten Punkt.

    Es ist eigentlich unmoeglich zu wissen ob die 4 Besucher wirklich 4 Leute waren ,oder 4 x ich: 1x von der Arbeit, 1x mit Windows, 5 Minuten spaeter 1x mit Linux und dann mitm Notebook. Von verschiedenen Browsern die ich nutze ganz zu schweigen.

    'Neue Besucher' sind lediglich nicht identifizierte Besucher. Das klingt aber ja eher nach Versagen der Software.

    --
    Vergesst Chuck Norris.
    Sponge Bob kann unter Wasser grillen!
    1. Es ist eigentlich unmoeglich zu wissen ob die 4 Besucher wirklich 4 Leute waren ,oder 4 x ich: 1x von der Arbeit, 1x mit Windows, 5 Minuten spaeter 1x mit Linux und dann mitm Notebook. Von verschiedenen Browsern die ich nutze ganz zu schweigen.

      Danke, so ist (bislang) auch mein Verständnis. Auszuschliessen sein müßten demnach dann ja auch User, die über Proxys, Addons die Cookies verhindern etc., und javascript deaktiviert haben ins Netz gehen.

  2. Fehlt mir nur das technische Verständnis dafür einigermaßen verlässig "neue" Besucher erfassen zu können, oder sind solche Angaben tatsächlich reine Augenwischerei?

    Man kann einen "Besucher" ziemlich eindeutig über seine Konfiguration seines Systems ermitteln auch wenn sich seine IP-Adresse ändert oder er Cookuis nicht zulässt, sogar wenn er seinen Browser wechselt - z.B. über die installierten Schriftarten oder über seine Schreibstil oder die Mausbewegungen.

    In diesem Kontext würde mich brennend interssieren, was Codemonster wie Google Analytics hier machen - oder große werbetreibende wie z.B. Amazon.

    1. Man kann einen "Besucher" ziemlich eindeutig über seine Konfiguration seines Systems ermitteln auch wenn sich seine IP-Adresse ändert oder er Cookuis nicht zulässt, sogar wenn er seinen Browser wechselt - z.B. über die installierten Schriftarten oder über seine Schreibstil oder die Mausbewegungen.

      Kannst mir mal etwas genauer verraten, wie bzw. über welche Mechanismen "installierte Schriftarten" sich ermitteln lassen sollen und in wie fern z.B. auf Standard-Windows-Rechnern sich diese überhaupt von anderen Standard-Systmen unterscheiden? Es ist ja nicht so, dass die meisten User sich zusätzliche Fonts runterladen- es sei denn man macht irgendetwas im grafischen Bereich.
      Was z.B. google und seine analytics angeht, da fallen doch erst recht Dinge wie "Schreibstil" bei einfachen Suchbegriffen flach, oder?

      1. Hi,

        Kannst mir mal etwas genauer verraten, wie bzw. über welche Mechanismen "installierte Schriftarten" sich ermitteln lassen sollen und in wie fern z.B. auf Standard-Windows-Rechnern sich diese überhaupt von anderen Standard-Systmen unterscheiden? Es ist ja nicht so, dass die meisten User sich zusätzliche Fonts runterladen

        oh doch, nach meiner Erfahrung stimmen selten zwei Windows-PCs in den verfügbaren Schriften überein, es ei denn diejenigen, die in Unternehmen "von der Stange" eingerichtet und konfiguriert werden. Beim üblichen User kommen aber im Lauf des Windows-Lebens immer wieder aus unterschiedlichen Quellen mal neue Schriften dazu, so dass der entstehende Fundus im Lauf der Zeit doch recht individuell wird.

        Was z.B. google und seine analytics angeht, da fallen doch erst recht Dinge wie "Schreibstil" bei einfachen Suchbegriffen flach, oder?

        AFAIS ja.

        Ciao,
         Martin

        --
        PCMCIA: People Can't Memorize Computer Industry Acronyms
        Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
      2. Kannst mir mal etwas genauer verraten, wie bzw. über welche Mechanismen "installierte Schriftarten" sich ermitteln lassen

        Das Prinzip ist ganz einfach :

        du schreibst einen Text und formatierst in per CSS in einer bestimmten Schriftart, Schriftgröße, Laufweite usw und vergleichst das Ergebnis mit deinem Erwartungswert (also die Abmessungen der Box).

        Hat der Benutzer die Schrift installiert, stimmt der Erwartungswert mit dem Ergebnis überein (sofern man keinen False-Positive-Treffer hat).

        Natürlich müssen in diese Gleichung auch unterschiedliche Renderverhalten der Browser und Betriebssysteme miteinbezogen werden.

    2. Hallo,

      Man kann einen "Besucher" ziemlich eindeutig über seine Konfiguration seines Systems ermitteln

      ja, unter bestimmten Bedingungen schon. Die müssen aber erstmal vorliegen.

      z.B. über die installierten Schriftarten

      ... die du serverseitig wie genau herausfinden möchtest?

      oder über seine Schreibstil

      ... den du erst beurteilen kannst, wenn der Besucher tatsächlich einen Beitrag schreibt; möglichst einen langen, frei formulierten, und nicht nur zwei, drei Worte.

      oder die Mausbewegungen.

      ... die du serverseitig wie genau herausfinden möchtest?

      In diesem Kontext würde mich brennend interssieren, was Codemonster wie Google Analytics hier machen

      Google macht bekanntlich viel mit Javascript rum, wo das erlaubt ist.

      oder große werbetreibende wie z.B. Amazon.

      Amazon verlässt sich zur Wiedererkenneung AFAIK nur auf Cookies: Nachdem ich die Cookies gelöscht habe, bin ich für Amazon wieder ein Unbekannter.

      Ciao,
       Martin

      --
      Man soll den Tag nicht vor dem Abend loben.
      Und den Mann nicht vor dem Morgen.
        (alte Volksweisheit)
      Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
      1. ... die du serverseitig wie genau herausfinden möchtest?

        Wer sagt was von Serverseitig?

        oder über seine Schreibstil

        ... den du erst beurteilen kannst, wenn der Besucher tatsächlich einen Beitrag schreibt; möglichst einen langen, frei formulierten, und nicht nur zwei, drei Worte.

        Auch das eintippen eines captchas kann hier schon rückschlüsse ermöglichen - eine Benutzer lesen zuerst das Captcha und geben es im 10-Finger-System durchgehend ein, andere lesen Zeichen für Zeichen und tippen, wieder andere lesen Zeichen für Zeichen und müssen die Tasten auf der Tastatur erst suchen.

        oder die Mausbewegungen.

        ... die du serverseitig wie genau herausfinden möchtest?

        Siehe oben ;)

        In diesem Kontext würde mich brennend interssieren, was Codemonster wie Google Analytics hier machen

        Google macht bekanntlich viel mit Javascript rum, wo das erlaubt ist.

        Siehe oben :D

        Amazon verlässt sich zur Wiedererkenneung AFAIK nur auf Cookies: Nachdem ich die Cookies gelöscht habe, bin ich für Amazon wieder ein Unbekannter.

        Die wissen Aufgrund sehr weniger Informationen trotzdem aber erschreckend genau was ich kaufen möchte :)

        1. Hallo,

          ... die du serverseitig wie genau herausfinden möchtest?
          Wer sagt was von Serverseitig?

          wie sonst? Clientseitig -also mit Javascript- kann nur ein optionales Goodie sein, das möglicherweise zur Verfügung steht; außerdem ist die Frage sicher nicht zufällig im Themenbereich PHP gestellt.

          oder über seine Schreibstil
          ... den du erst beurteilen kannst, wenn der Besucher tatsächlich einen Beitrag schreibt; möglichst einen langen, frei formulierten, und nicht nur zwei, drei Worte.
          Auch das eintippen eines captchas kann hier schon rückschlüsse ermöglichen

          Ach so, du meinst quasi die persönlichen Eigenheiten beim Tippen, okay. Ich hatte "Schreibstil" auf die sprachliche Ebene bezogen - Sprachniveau, Formulierungen, Recht- oder nicht Rechtschtschreibung.

          oder die Mausbewegungen.
          ... die du serverseitig wie genau herausfinden möchtest?
          Siehe oben ;)

          Siehe oben. :-)

          Google macht bekanntlich viel mit Javascript rum, wo das erlaubt ist.
          Siehe oben :D

          Siehe oben. :-)

          Amazon verlässt sich zur Wiedererkenneung AFAIK nur auf Cookies: Nachdem ich die Cookies gelöscht habe, bin ich für Amazon wieder ein Unbekannter.
          Die wissen Aufgrund sehr weniger Informationen trotzdem aber erschreckend genau was ich kaufen möchte :)

          Die wissen bei mir nur, solange ich meine Cookies nicht lösche, was ich bisher bei Amazon gekauft habe und welche Artikel ich mir angesehen habe. Und daraus leiten sie offensichtlich auch ihre Empfehl^WWerbung ab.
          Lösche ich die Cookies, bekomme ich zunächst keine Werbung mehr angezeigt - bis ich wieder ein paar Amazon-Artikelseiten aufgerufen habe und die Jungs dadurch wieder einen Eindruck von meinen Interessen haben.

          So long,
           Martin

          --
          Bitte komme jemand mit einem *g* zum Wochenende, damit nicht über mich gelacht wird.
            (Gunnar Bittersmann)
          Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
          1. wie sonst? Clientseitig -also mit Javascript- kann nur ein optionales Goodie sein, das möglicherweise zur Verfügung steht; außerdem ist die Frage sicher nicht zufällig im Themenbereich PHP gestellt.

            Im Ausgangsposting war von "Auflösung mit JavaScript ermitteln" die Rede - zudem haben nur noch sehr wenige Besucher JavaScript dekativiert.

            Ach so, du meinst quasi die persönlichen Eigenheiten beim Tippen, okay. Ich hatte "Schreibstil" auf die sprachliche Ebene bezogen - Sprachniveau, Formulierungen, Recht- oder nicht Rechtschtschreibung.

            Ja, schlecht formuliert :)

        2. Hi!

          Die wissen Aufgrund sehr weniger Informationen trotzdem aber erschreckend genau was ich kaufen möchte :)

          Bei mir gar nicht. Hast Du keine Schwester, die sich dort z.B. Kratzbaeume fuer ihre Katze anschaut und dir Links dafuer schickt?

          --
          Vergesst Chuck Norris.
          Sponge Bob kann unter Wasser grillen!
          1. Die wissen Aufgrund sehr weniger Informationen trotzdem aber erschreckend genau was ich kaufen möchte :)

            Bei mir gar nicht. Hast Du keine Schwester, die sich dort z.B. Kratzbaeume fuer ihre Katze anschaut und dir Links dafuer schickt?

            Nein, aber eine Freundin die gelegentlich meinen Rechner highjackt um nach Kochtopfen und Kindersachen zu schauen :) trotzdem wissen die das irgendwie weil scheinbar der Kauf mehr in die Gewichtung der Empfehlung einbezogen wird als das Anschauen.

            1. Hi!

              Nein, aber eine Freundin die gelegentlich meinen Rechner highjackt um nach Kochtopfen und Kindersachen zu schauen :) trotzdem wissen die das irgendwie weil scheinbar der Kauf mehr in die Gewichtung der Empfehlung einbezogen wird als das Anschauen.

              Dann kauf ich wohl zuwenig. Was ich da immer fur Schrott angezeigt und per Mail praesentiert bekomme ist ja schlimm. Vielleicht sollte Amazon mal meinem AG mitteilen, dass ich mehr Geld bekommen soll, damit ich da jeden Monat 1x was kaufe.

              --
              Vergesst Chuck Norris.
              Sponge Bob kann unter Wasser grillen!
            2. Hi!

              Nein, aber eine Freundin die gelegentlich meinen Rechner highjackt um nach Kochtopfen und Kindersachen zu schauen :)

              Oho, darf man schon gratulieren?

              FG Ulysses

              1. Nein, aber eine Freundin die gelegentlich meinen Rechner highjackt um nach Kochtopfen und Kindersachen zu schauen :)

                Oho, darf man schon gratulieren?

                Schon? Zum 2. Geburtstag im März vielleicht :p

                1. Hi!

                  Nein, aber eine Freundin die gelegentlich meinen Rechner highjackt um nach Kochtopfen und Kindersachen zu schauen :)
                  Oho, darf man schon gratulieren?
                  Schon? Zum 2. Geburtstag im März vielleicht :p

                  Bub, oder Mädchen?

                  FG Ulysses

                  1. Bub, oder Mädchen?

                    Bub.

                    1. Hi!

                      Schon? Zum 2. Geburtstag im März vielleicht :p
                      Bub, oder Mädchen?
                      Bub.

                      Im Moment bist du also noch auf "Duploniveau" - aber dann wirds echt lustig!

                      FG Ulysses, der gerade auf starwars.lego.com gustiert...

                    2. Om nah hoo pez nyeetz, suit!

                      Bub, oder Mädchen?

                      Bub.

                      Ich pflege auf solche Fragen immer mit "ja" zu antworten.

                      Matthias

                      --
                      Wer ein Problem beschreiben kann, hat es schon halb gelöst.                                             (Julian Huxley) http://www.billiger-im-urlaub.de/kreis_sw.gif
                      1. Hi!

                        Ich pflege auf solche Fragen immer mit "ja" zu antworten.

                        Sogar dann, wenn dich niemand darum fragt? ;-) SCNR

                        Ich geh dann mal in's Elternforum

                        FG Ulysses

          2. Hello,

            Die wissen Aufgrund sehr weniger Informationen trotzdem aber erschreckend genau was ich kaufen möchte :)

            Bei mir gar nicht. Hast Du keine Schwester, die sich dort z.B. Kratzbaeume fuer ihre Katze anschaut und dir Links dafuer schickt?

            Ich hatte bei einem Kunden eines morgens immer diese Pornoanzeigen im Browser. Das war mir schon etwas peinlich.

            Noch peinlicher war es dann aber dem Mitarbeiter der Firma, der 'meinen' Rechner nach dem normalen Feierabend genutzt hatte und der dann aufgrund der Logs und der Zeiterfassung feststellbar war. Nicht, dass wir das wollten (und durften), aber es ging in den Sitzugnen gerade um Logging usw.

            Er hat es dann mit hochrotem Kopf aber doch mit Humor genommen.

            Liebe Grüße aus dem schönen Oberharz

            Tom vom Berg

            --
             ☻_
            /▌
            / \ Nur selber lernen macht schlau
            http://bergpost.annerschbarrich.de
  3. Moin,

    Wenn man jetzt mal das vermeindlich wichtigste Kriterium, also die Ip-Adresse, zur Hand nimmt,

    Nein, die ist überhaupt nicht wichtig in solchen Fragen. Die hat nämlich nur eine kurze Gültigkeit, im Extremfall nur für einen Request, in besseren Fällen einen Tag und in ganz seltenen Fällen ist sie immer gleich.

    Fehlt mir nur das technische Verständnis dafür einigermaßen verlässig "neue" Besucher erfassen zu können, oder sind solche Angaben tatsächlich reine Augenwischerei?

    Die Zuverlässigkeit solcher Erhebungen hat weite Grenzen und ist an bestimmte Bedingungen gebunden. Bedingungen sind z.B. die Art und Weise, wie die Datenerfassung erfolgt, etwa mit JavaScript oder lediglich mit serverseitigen Techniken oder Cookie. Die Grenzen liegen darin, dass Besucher Cookies löschen/ändern sowie JS abschalten können.

    Serverseitig hast Du nur wenige Informationen vom Browser: $ENV{HTTP_ACCEPT}; $ENV{HTTP_ACCEPT_LANGUAGE}; $ENV{HTTP_ACCEPT_ENCODING}; $ENV{HTTP_USER_AGENT}; um die Wichtigsten zu nennen, die reichen jedoch nicht für eine eindeutige Checksumme und im Serverlog findest Du noch weniger.

    Nimmst Du JS hinzu, könntest Du einige Informationen mehr kommen, wie die lokale Zeitzone, Bildschirmauflösung, installierte Plugins usw., das geht aber dann auch nur, wenn der Besucher JS nicht abschaltet.

    Andererseits hat eine reine JS-Lösung den Vorteil, dass Bots von den statistischen Erhebungen ausgeschlossen sind, es ist jedoch eine Frage der Zeit, ob sich das ändert.

    Hotti