Onkel Schnitzel: Wie schnell ist ein Spamrobot?

Hallo,

wie lange braucht eigentlich ein Spamrobot, bis er eine Seite - nehmen wir jetzt mal eine 0815-Impressums-Seite - auf Mail-Adressen hin untersucht hat? Das läuft doch wahrscheinlich innerhalb von Zehntelsekunden ab, immerhin soll die Maschine ja was schaffen. Und nach diesen 0,XXX Sekunden verschwindet der doch wieder von der Seite, ist das richtig?

Schöne Grüße,
Onkel Schnitzel

  1. hallo,

    wie lange braucht eigentlich ein Spamrobot, bis er eine Seite - nehmen wir jetzt mal eine 0815-Impressums-Seite - auf Mail-Adressen hin untersucht hat? Das läuft doch wahrscheinlich innerhalb von Zehntelsekunden ab, immerhin soll die Maschine ja was schaffen. Und nach diesen 0,XXX Sekunden verschwindet der doch wieder von der Seite, ist das richtig?

    Du mußt dir einfach mal den log-Eintrag anschauen, den so ein bot hinterläßt. Das sieht beispielsweise so aus:
      69.31.80.114 - - [11/Oct/2006:08:34:20 +0200] "GET /kontakt/gastb.php?add HTTP/1.0" 200 3773 "http://www.christoph-schnauss.de/kontakt/gastb.php?add" "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)"
      203.177.231.209 - - [11/Oct/2006:08:35:06 +0200] "POST /kontakt/gastb.phptemp HTTP/1.0" 404 2106 "http://www.christoph-schnauss.de/kontakt/gastb.php?add" "-"
    Er hat hier immerhin volle 46 Sekunden gebraucht, wollte mein Gästebuch vollmüllen, hat am Ende aber doch nur einen 404er zurückbekommen.

    Grüße aus Berlin

    Christoph S.

    --
    Visitenkarte
    ss:| zu:) ls:& fo:) va:) sh:| rl:|
    1. Er hat hier immerhin volle 46 Sekunden gebraucht, wollte mein Gästebuch vollmüllen, hat am Ende aber doch nur einen 404er zurückbekommen.

      Wow! Die geben sich so viel Mühe? Dann kann ich meine Idee wohl wieder fallen lassen. Ich wollte, so wie wahsaga, die Mail-Adressen erst nach dem Klick auf einen Formular-Button sichtbar machen. Wollte das aber mit einer Zeitsperre kombinieren, weil ich angenommen hatte, dass so ein Robot nach spätestens einer Sekunde wieder weg ist, während der Mensch ja doch ein paar Sekunden länger braucht, bis er sich den Text des Buttons usw. durchgelesen hat. Schade...

      Beste Grüße,
      Onkel Schnitzel

      1. gbt es iwnet eine seite über spambots? würde mcih iunteressieren wie diese funktionieren (grobgeshen ;)
        MFG
        bleicher

        --
        __________________________-
        Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
        1. hallo bleicher,

          gbt es iwnet eine seite über spambots?

          Selbstverständlich.

          Grüße aus Berlin

          Christoph S.

          --
          Visitenkarte
          ss:| zu:) ls:& fo:) va:) sh:| rl:|
          1. woo.. die sind aber Zynisch "auch bei der Angabe der Mail adressen in Bild und Ton wären Taubstumme ausgeschlossen" ;(
            MFG
            bleicher

            --
            __________________________-
            Menschen an sich , sind nicht schlecht - es sind nur ihre Taten (c).
      2. Hallo,
        ich mach das immer so: Ich erstell eine Grafik mit dem Text meiner Email-Addy und transparentem Hintergrund. Dabei ist die Grafik genauso hoch wie eine normale Textzeile.

        Dann in der Imp-Seite steht: Email: <img src="mein_mail.gif">

        Sieht für den User aus, als wäre es normal Text, aber ich denke mal nicht, dass Bots sich die Mühe machen, und Grafiken nach Email Addys durchsuchen.

        MFG

        1. Dann in der Imp-Seite steht: Email: <img src="mein_mail.gif">

          Sieht für den User aus, als wäre es normal Text, aber ich denke mal nicht, dass Bots sich die Mühe machen, und Grafiken nach Email Addys durchsuchen.

          Die Lösung mit den Bildern ist natürlich möglich, aber nicht ganz sauber bzw. barrierefrei. Und streng genommen müsste man ja auch einen Alternativ-Text mit angeben.

          1. Hallo,

            Die Lösung mit den Bildern ist natürlich möglich, aber nicht ganz sauber bzw. barrierefrei. Und streng genommen müsste man ja auch einen Alternativ-Text mit angeben.

            das ist klar, allerdings sind nur wenige Möglichkeiten wirklich barrierefrei, die ein Spambot nicht sofort knacken kann.

            MFG

            1. Die Lösung mit den Bildern ist natürlich möglich, aber nicht ganz sauber bzw. barrierefrei. Und streng genommen müsste man ja auch einen Alternativ-Text mit angeben.
              das ist klar, allerdings sind nur wenige Möglichkeiten wirklich barrierefrei, die ein Spambot nicht sofort knacken kann.

              Barrierefreiheit wird immer dann verletzt, wenn man die vermuteten Bots zu Aufgaben zwingen will, die nur Menschen lösen können. Die beiden Konzepte (Barrierefreiheit und Bot-Isolierung) beissen sich.

              1. Hallo Hamster,

                Die beiden Konzepte (Barrierefreiheit und Bot-Isolierung) beissen sich.

                Nicht unbedingt: Man kann den Client z. B. eine kleine Rechenaufgabe lösen lassen oder ein Auswahlfeld machen, wo man auswählen kann "ich will nur spammen" / "ich will wirklich was schreiben".
                Wenn auch Bots manchmal besser Bilder lesen können als manche Menschen; denken können Menschen weitaus besser als jeder Computer.

                Viele Grüße aus Freiburg,
                Marian

                --
                Microsoft broke Volkswagen's world record: Volkswagen made only 22 million bugs!
                <!--[if IE]><meta http-equiv="refresh" content="0; URL=http://www.getfirefox.com"><[endif]-->
                1. Die beiden Konzepte (Barrierefreiheit und Bot-Isolierung) beissen sich.
                  Nicht unbedingt: Man kann den Client z. B. eine kleine Rechenaufgabe lösen lassen

                  Es soll auch Nichtrechner unter uns geben, so zu sagen Antinumeriker.

                  oder ein Auswahlfeld machen, wo man auswählen kann "ich will nur spammen" / "ich will wirklich was schreiben".

                  Auch daran kann jemand scheitern.

                  Wenn auch Bots manchmal besser Bilder lesen können als manche Menschen; denken können Menschen weitaus besser als jeder Computer.

                  Nicht ganz klar, die Playstation z.B. soll schon die Rechenkapazität des Menschen in einem einstelligen Prozentbereich leisten können.

                  1. Hallo Hamster,

                    Nicht unbedingt: Man kann den Client z. B. eine kleine Rechenaufgabe lösen lassen
                    Es soll auch Nichtrechner unter uns geben, so zu sagen Antinumeriker.

                    Es geht hier um Aufgaben à la 'sieben plus drei minus fünf', aber auch das kann man notfalls in einen Taschenrechner eingeben.

                    oder ein Auswahlfeld machen, wo man auswählen kann "ich will nur spammen" / "ich will wirklich was schreiben".
                    Auch daran kann jemand scheitern.

                    Wenn man ein ganz normales Formular aufüllen kann, kriegt man das ja wohl grad noch hin.

                    Auf jeden Fall können mehr Menschen die beiden genannten Aufgaben lösen als ein Captcha.

                    Viele Grüße aus Freiburg,
                    Marian

                    --
                    Microsoft broke Volkswagen's world record: Volkswagen made only 22 million bugs!
                    <!--[if IE]><meta http-equiv="refresh" content="0; URL=http://www.getfirefox.com"><[endif]-->
        2. hi,

          ich mach das immer so: Ich erstell eine Grafik mit dem Text meiner Email-Addy und transparentem Hintergrund. Dabei ist die Grafik genauso hoch wie eine normale Textzeile.

          Woher willst du wissen, wie hoch bei mir eine Zeile ist?

          Sieht für den User aus, als wäre es normal Text

          Spätestens, wenn der Nutzer diese Mailadresse verwenden will, wird er merken, dass sie eben doch nur ein Bild und kein Text ist - weil er mit an Sicherheit grenzender Wahrscheinlichkeit zuerst versuchen wird, sie zu kopieren, anstatt sie abzutippen.

          gruß,
          wahsaga

          --
          /voodoo.css:
          #GeorgeWBush { position:absolute; bottom:-6ft; }
      3. Das muss nicht wirklich langsam oder gründlich sein. es kann auch einfach nur ein zeitintervall für die pausen zwischen den seitensprüngen integriert sein. solche bots werden vermutlich mehr als nur eine seite parallel durchsuchen..

        beste grüße
        Chris

      4. Moin!

        Dann kann ich meine Idee wohl wieder fallen lassen. Ich wollte, so wie wahsaga, die Mail-Adressen erst nach dem Klick auf einen Formular-Button sichtbar machen. Wollte das aber mit einer Zeitsperre kombinieren, weil ich angenommen hatte, dass so ein Robot nach spätestens einer Sekunde wieder weg ist, während der Mensch ja doch ein paar Sekunden länger braucht, bis er sich den Text des Buttons usw. durchgelesen hat. Schade...

        Wären Spider so schnell, wie du glaubst, dann würden sie jeden Webserver in kurzer Zeit mit einer Masse an Requests überlasten - und sich dadurch identifizierbar und sperrbar machen, weil sie den tatsächlichen Betrieb des Servers beeinträchtigen würden. Das würde man merken können.

        - Sven Rautenberg

        --
        "Love your nation - respect the others."
      5. hallo,

        Wow! Die geben sich so viel Mühe? Dann kann ich meine Idee wohl wieder fallen lassen. Ich wollte, so wie wahsaga, die Mail-Adressen erst nach dem Klick auf einen Formular-Button sichtbar machen. Wollte das aber mit einer Zeitsperre kombinieren, weil ich angenommen hatte, dass so ein Robot nach spätestens einer Sekunde wieder weg ist

        Es ist ein weitverbreitetes Mißverständnis, daß die "Spione" auf Webseiten nach irgendwelchen mail-Adressen suchen. Sicher, manche tun das, viel wichtiger sind ihnen aber Formularfelder, die irgendwie "mail" oder "name" oder "submit" heißen. Die versuchen sie auszufüllen bzw. solche buttons auszulösen. Ich habe nochmal aktuelle log-Beispiele von einer anderen Adresse:

        203.87.210.218 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        203.131.159.251 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        60.52.50.90 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        202.156.9.2 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        219.92.92.236 - - [13/Oct/2006:10:37:13 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        210.213.174.215 - - [13/Oct/2006:10:37:14 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        219.95.235.84 - - [13/Oct/2006:10:37:14 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693
        202.133.219.90 - - [13/Oct/2006:10:37:22 +0200] "POST /prog/php/mail.php HTTP/1.0" 200 2693

        Ich habe die Referer gekürzt, auf die kommt es hier nicht an. Interessant ist hier, daß der Spion ein anderes Formular gefunden hat - und diesmal gibts eine 200er Meldung, es ist also was passiert. Allerdings nichts Schlimmes, er hat lediglich eine Aufforderung erhalten, ein anderes Formular zu benutzen, was ihn überfordert. Mehr ist nicht abgeschickt worden (das Script muß ich trotzdem revidieren, weil auch das nicht gewünscht ist). Aber du siehst hier bereits ansatzweise, was Sven angesprochen hat: würde der bot nun munter in sehr kurzen Abständen weitermachen, wird die Serverlast höher, und obwohl sehr schnell die IP gewechselt wird, steigt damit die Gefahr der Identifizierung für den Spion. Also hört er wieder auf, wenn er meint, ausreichend Erfolg erzielt zu haben. Es nutzt übrigens wenig, hier nachschauen zu wollen, wohin die angegebenen IP-Adressen gehören (Australien, Malaysia, Philippinen).

        Wenn die Spamer mail-Adressen erfahren wollen, nutzen sie vorzugsweise andere Mechanismen.

        Grüße aus Berlin

        Christoph S.

        --
        Visitenkarte
        ss:| zu:) ls:& fo:) va:) sh:| rl:|
    2. Er hat hier immerhin volle 46 Sekunden gebraucht, wollte mein Gästebuch vollmüllen, hat am Ende aber doch nur einen 404er zurückbekommen.

      Bei einem gut geschützten Gästebuch braucht ein Bot natürlich wesentlich länger als bei einem Wald und Wiesengästebuch.

      Ich habe mal von einem Gästebuch gehört, da kam ein Bot jeden Tag aufs Neue vorbei und versuchte was anderes.

      1. hallo Hamster,

        Ich habe mal von einem Gästebuch gehört, da kam ein Bot jeden Tag aufs Neue vorbei und versuchte was anderes.

        Interessant. Es ist natürlich vollkommen ausgeschlossen, daß damit meins gemeint sein konnte.

        Grüße aus Berlin

        Christoph S.

        --
        Visitenkarte
        ss:| zu:) ls:& fo:) va:) sh:| rl:|
  2. Hi,

    Und nach diesen 0,XXX Sekunden verschwindet der doch wieder von der Seite, ist das richtig?

    was meinst Du mit "von der Seite verschwinden"?

    Cheatah

    --
    X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. was meinst Du mit "von der Seite verschwinden"?

      Nunja, ich weiß ja nicht, wie diese Robots arbeiten. Ich dachte, die nehmen sich eine Seite vor, durchsuchen sie nach Mailadressen und ziehen dann, wenn sie den Quelltext durchgearbeitet haben, zur nächsten Seite weiter.

      1. was meinst Du mit "von der Seite verschwinden"?
        Nunja, ich weiß ja nicht, wie diese Robots arbeiten. Ich dachte, die nehmen sich eine Seite vor, durchsuchen sie nach Mailadressen und ziehen dann, wenn sie den Quelltext durchgearbeitet haben, zur nächsten Seite weiter.

        Im Prinzip stellt man sich im allgemeinen unter einem Spam-Bot einen unmoralischen Robot wie zum Beispiel Bender vor, der einfach mal so unaufgefordert eine Seite besucht, darauf ein wenig (10 Minuten sollten aber reichen) herumvagabundiert und dann entweder unverrichteter Dinge weiterzieht oder für seinen ebenfalls unmoralischen Bruder, der bspw. Sexseiten betreit, ein wenig Reklame macht.