Hallo Roland,
r l o @ r o l a n d l o e f f l e r . d e
Da es in Emailadressen kein Leerzeichen gibt, ignorieren alle Spider und
sonstige Suchmaschinen Tools diesen Eintrag. Im Quellcode wird immer die
Adresse mit den Leerzeichen stehen.
Würde ich einen Spider programmieren, wäre das erste, den Quellcode der
Seite nach den Strings nach dem "<a href="mailto:" zu durchsuchen. Da
sollte die Mailadresse in Reinform drinstehen. Kurzes Konvertieren zu
einem verwendbaren Text mit den in den meisten Programmiersprachen
problemlos verfügbaren Befehlen, die solche Entitykodierung rückgängig
machen.
Brauche ich noch mehr Mailadressen, dann wird der Text der Seite nach dem
At-Zeichen durchsucht und der davor und der dahinterliegende Text genommen
und auf richtiges Mailadressenformat überprüft. Wenn man ganz pfiffig ist,
kann man versuchen, diesen Text bestimmten Suchmustern zu unterwerfen,
beispielsweise nach Textmustern wie "nospam" oder ähnliches. Selbst für
Deine Lösung, wenn sie denn eine größere Verbreitung findet, kann man
geeignete Suchmuster, beispielsweise auf statistischen Methoden, entwerfen, behaupte ich.
Und selbst wenn es dabei Fehltreffer gibt - für den Spammer ist das egal.
Bei maschineller Durchsuchung und maschinellem Versand von Mail ist das
den Aufwand nicht wert. Ja. Benutzerfreundliche Lösungen wie die Angabe
der Mailadresse als Verweis unterliegen immer den Methoden der Spammer.
Und andere Lösungen, seien es Flash (wurks), Bilder (wurkser), oder
auch Formmailer (leichtes wurks).
Was man machen kann, wenn man sich dieses Medium nicht kaputt machen will,
sind andere Möglichkeiten, dazu zählen Filtern, Blacklists, Teergruben
oder gar die Möglichkeit einer Whitelist. So etwas muß man kalkulieren,
wie freundlich man zu seinen potentiellen Kontakten sein will.
man kann ja email-Adressen auch mit Sonderschreibweise "kodieren" (z.B.
&89;&87;@&78;...)
Können Spammer solche Adresse indexieren?
Siehe oben. Ein paar Zeilen Quellcode.
Tim