Andreas Korthaus: Schutz gegen 'Crawler-Attacken'

Beitrag lesen

Hi Michael!

ja, natürlich. Der Crawler weiß ja, nicht daß beide URLs zu "semantisch äquivalenten" Seiten führen werden - für ihn sind es "inhaltlich verschiedene" Seiten.

Wenn dem so wäre müssten sich aber alle Crawer derart verirren, das tun sie aber augenscheinlich nicht. Was macht googlebot denn anders?

Wozu soll man da unterschieden? IMHO fehlt eine Angabe bei Meta-Tags: "nofollow" oder besser "none", keine Robot soll in der Hauptdatei nach Links suchen, also warum ist das nicht entsprechend verboten?

Weil der Robot nur über die Hauptdatei die Links zu den Threads findet.

Das "nofollow" müßte also ein Attribut nicht der HTML-Datei, sondern des konkreten Links sein ... das ist in HTML aber leider nicht ausdrückbar.

Nein. Robots haben im aktuellen Forum absolut nichts verloren, was bringt es normale Threads zu indizieren? Die gelten doch eh nur ein paar Tage. Also kann man den Zugriff doch am besten für crawler sperren, besser wäre eine robots.txt, nur geht das dann nicht mit dem Archiv.

Grüße
Andreas

0 44

Verbreitung von Schriftarten, Browsern, etc. im Internet?

Elessar
  • sonstiges
  1. 0
    Johannes Zeller
    1. 0

      37 GB Traffic an einem Tag?

      Stefan Einspender
      • zu diesem forum
      1. 0
        MudGuard
        1. 0
          Stefan Einspender
        2. 0
          Andreas Korthaus
      2. 0
        Sven Rautenberg
        1. 0
          Stefan Einspender
          1. 0
            Ole
          2. 0
            Thomas J.S.
          3. 0
            Frank Schönmann
        2. 0
          Andreas Korthaus
          1. 0
            Stefan Einspender
          2. 0
            MudGuard
            1. 0
              Andreas Korthaus
              1. 0
                Andreas Korthaus
                1. 0
                  Thomas J.S.
                  1. 0
                    Michael Schröpl
                    1. 0

                      Schutz gegen 'Crawler-Attacken'

                      Andreas Korthaus
                      1. 0
                        Michael Schröpl
                        1. 0
                          Andreas Korthaus
                          1. 0
                            Andres Freund
                            1. 0
                              Michael Schröpl
                              1. 0
                                Andreas Korthaus
                              2. 0
                                Andres Freund
                                1. 0
                                  Michael Schröpl
                          2. 0
                            Michael Schröpl
      3. 0
        Andreas Korthaus
        1. 0
          Stefan Einspender
          1. 0
            Stefan Einspender
          2. 0
            Christian Seiler
            1. 0
              Stefan Einspender
              1. 0
                Christian Seiler
                1. 0
                  Stefan Einspender
                2. 0
                  Michael Schröpl
      4. 0
        MudGuard
  2. 0
    Christian Seiler
    1. 0
      Thomas J.S.
      1. 0
        Christian Seiler
        1. 0
          Thomas J.S.
          1. 0
            Johannes Zeller
            1. 0
              Thomas J.S.
          2. 0
            Johannes Zeller
            1. 0
              Tim Tepaße