Schutz gegen 'Crawler-Attacken' von Andreas Korthaus, 27.05.2003 18:17

Beitrag lesen

Schutz gegen 'Crawler-Attacken'

Andreas Korthaus 27.05.2003 18:17

zu diesem forum

Hi Michael!

ja, natürlich. Der Crawler weiß ja, nicht daß beide URLs zu "semantisch äquivalenten" Seiten führen werden - für ihn sind es "inhaltlich verschiedene" Seiten.

Wenn dem so wäre müssten sich aber alle Crawer derart verirren, das tun sie aber augenscheinlich nicht. Was macht googlebot denn anders?

Wozu soll man da unterschieden? IMHO fehlt eine Angabe bei Meta-Tags: "nofollow" oder besser "none", keine Robot soll in der Hauptdatei nach Links suchen, also warum ist das nicht entsprechend verboten?

Weil der Robot nur über die Hauptdatei die Links zu den Threads findet.

Das "nofollow" müßte also ein Attribut nicht der HTML-Datei, sondern des konkreten Links sein ... das ist in HTML aber leider nicht ausdrückbar.

Nein. Robots haben im aktuellen Forum absolut nichts verloren, was bringt es normale Threads zu indizieren? Die gelten doch eh nur ein paar Tage. Also kann man den Zugriff doch am besten für crawler sperren, besser wäre eine robots.txt, nur geht das dann nicht mit dem Archiv.

Grüße
Andreas

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Andreas Korthaus: Schutz gegen 'Crawler-Attacken'

Beitrag lesen

Schutz gegen 'Crawler-Attacken'

Verbreitung von Schriftarten, Browsern, etc. im Internet?

37 GB Traffic an einem Tag?

Schutz gegen 'Crawler-Attacken'