Man könnte also mittels Javascript einen Teil der Spiders abhalten.
Sofern du in der Traumwelt lebst, in der E-Mail-Spammer noch mit Crawler arbeiten, ja.
https://forum.selfhtml.org/?t=202608&m=1368785
Jetzt mal langsam. Dort belegst du nirgends, dass nicht mehr mit Crawlern gearbeitet werden würde.
Das ist auch nicht der Fall - es gibt sicher noch crawler die ein paar Seiten durchsuchen und ein paar Adressen finden, aber wie ich bereits schrieb ist es der Aufwand imho nicht wert, einem echten Benutzer auf den Senkel zu sehen um selbst weniger Spam zu bekommen - die paar Prozent weniger Spam sind im Vergleich zu dem was sonst auf anderen wegen reinkommt nicht relevant.
Spammer crawlen vielleicht nicht selbst, sondern kaufen Listen mit Adressen.
Oder laden sie herrunter, wenn man wieder irgend eine größere Site ein paarhundertausden Benutzerdaten verliert. Woltlab und Häfft sind zwei deutsche die mir Spontan einfallen. Gawker hab' ich ebenfalls bereits genannt.
Und mal ehrlich: viele von uns kommen problemlos an Hundertausende echte adressen ran, weil sie zugriff auf entsprechende Datenbanken haben. Wenn ich genug kriminelle energie hätte, könnte ich problemlos ein paar millionen Adressen in wenigen Minuten zusammenstellen.
Den bekommen sie schnell, sobald die Adresse im Web publiziert ist.
Das publizieren im Web findet idR. aber durch die Benutzer selbst statt indem sie sich einfach irgendwo registrieren oder bei einem Gewinnspiel mitmachen. Irgendwie gelangen die Adressen dann schon in die weiten des Netz - ich bin mir sicher, es ist nicht jeder mit Zugriff auf entsprechende Daten so brav wie ich.
Seit die Kapazitäten der Spamversender ins unermessliche gestiegen sind, wird generiert was das Zeug hält und anschließend ausgewertet.
Aus Sicht einer Firma, die tatsächliche E-Mail-Adressen zum Weiterverkauf an Spammer sammelt, ist das mathematisch gesehen wenig ertragreich.
Du vermischt Adresskauf und Fire-and-Forget-Spamming. Ein Spammer wird sich nicht einen Haufen generierter Adressen kaufen, das ist sicher wenig produktiv. Und wenn doch, wird es sicher entsprechend Schlaue leute geben, die ausrechnen, wieviel Wrfolgsquote solch generierte adressen haben.
Bei rebell.at ist es ziemlich dämlich an franziska.schuhmann zu mailen, bei ggmx wette ich aber, dass es mit hoher wahrscheinlichkeit eine gibt.
Wie kann eine Generierung z.B. auf mathias.schaefer@9elements.com kommen? Brute-Force?
Ja, genau so. Vermutlich auch noch mit Wahrscheinlichkeit - welche Namen kommen häufig vor? ein Michael Schmitt unter eine .de-Domain ist sicher wahrscheinlicher als ein Pierre Dupont unterhalb einer .ru-Domain.
Im englischsprachigen Wikipedia-Artikel zum Thema Botnet gibts eine Liste mit historischen Botnets - der Kapazitätsspitzenreiter ist Cutwail mit 74 Millarden Mails am Tag.
Da müsste man vorher eine Trilliarde Mails versenden, bis der Algorithmus darauf kommt. Oder indem der Algorithmus (sämtliche Vornamen).(sämtliche Nachnamen) prüft?
Warum nimmt man nicht einfach ein Telefonbuch? da stehen genug echte Vor- und Nachnamenkombinationen drin.
Da müsste man auch Milliarden Mails versenden. Wenn er sich auf häufige deutsche Vor- und Nachnamen begrenzt (wieso sollte er?), wären es immer noch eine Millionen.
Millionen sind angesicht der genannten Zahlen nicht mehr viel. Das bereits Genannte Cutwail kann 57 Millionen Mails pro Minute rausfeuern, das reicht für ein bisschen Spam.
Das ist alles sehr ineffektiv.
Laut der genannten Studie werden überhaupt nur 25 % der verschickten Mails an einen MTA übergeben, der Rest geht ins Nirvana. Und in dieser Studie haben die mit "echten Adressen" gearbeitet.
Eine Generierung ist vielleicht bei riesigen Anbietern wie GMail, Hotmail, Live.com, Yahoo, GMX/Web.de usw. ertragreich. Da ist die Wahrscheinlichkeit, dass selbst die unmöglichsten Adressen existieren, sehr hoch. Andererseits haben diese Anbieter ausgereifte Methoden, um Spam zu blocken.
Ausgereifte Methoden Spam zu blocken haben bereits viele Mailserver. Es ist kein Argument. GMX-Accounts bekommen z.B. regelmäßig Spam, so ausgereift sind die Methoden also auch nicht.