Zitat selfhtml zum Thema robots.txt:
"Ordentlich programmierte Robots beachten die Datei, aber Robots, die mit bösen Absichten das Web durchsuchen, halten sich vermutlich nicht daran."
Warum schrieb ich: "Ferner benutzen viele Spammer zunächst ganz normale Suchmaschinen."?
Ich kann also davon ausgehen, dass jemand, der für Spam alle auffindbaren Emailadressen klauen will, sich eh nicht dran hält und seinen Robot die robots.txt ignorieren lässt.
Ja, klar, aber viele eben erst nachdem diese den eignen Robot mit Ergebnissen der kostenlos zur Verfügung stehenden und leistungsfähigeren Suchmaschinen gefüttert haben ...
Heißt: ich kann meine Impressumseite Mickey-Mouse nennen und hoffen, dass er sie nicht standardmäßig trotzdem durchsucht.
Wenn er's - wovon ich jetzt mal pessimistisch ausgehe - trotzdem tut, findet er die Emailadresse wegen des @ im Quellcode und es hat mir nix gebracht?
Was sonst? Du kannst es _erschweren_, Du kannst es _nicht_ verhindern.
... Daher kann ich jetzt mit dem Kommentar
"nutzer<script type="text/javascript">document.write('@');</script><noscript style="display:inline">@</noscript>server.netz"
leider grad gar nix anfangen.
Du willst mir sagen, Du hast nicht erkannt, was das ist? Ok. dann muss ich das noch deutlicher ausführen:
<html>
<p>nutzer<script type="text/javascript">document.write('@');</script><noscript style="display:inline">@</noscript>server.netz</p>
</html>
1. Führt a) mit und b) ohne Javascript zur Anzeige von: nutzer@server.netz Das ist der geforderte komfortable Zugriff des Nutzers.
2. Ist mit einem regulären Ausdruck schwierig zu finden, vor allem, wenn es noch mit gewissen Abweichungen eingegeben wurde. Das erschwert die Arbeit des Spammers, respektive des Robots.
3. Ist automatisch leicht zu ersetzen (wichtig für dynamisch erstellte Websites) - erleichtert die Arbeit des Webdevelevopers.