Singsang: robots.txt-Funktionsweise

Beitrag lesen

  • Verbiete also z.B. nicht den Zugriff auf die /kontakt.php sondern auf /kont*

Das Sternchen ist a) eine Google-eigene Erweiterung (vielleicht akzeptieren es mittlerweile auch andere, sollte aber IMHO trotzdem vermieden werden) und b) am Ende des Musters sowieso sinnlos, weil die Einträge in der robots.txt immer mit dem Anfang des betreffenden Pfades verglichen werden; der Eintrag /kont bedeutet "ein Pfad, der mit /kont beginnt".
Der Vergleich erfolgt zudem rein zeichenbasiert, Pfade werden nicht beachtet; /kont passt auf /kontakt genauso wie auf /kont/tra oder /kont.ur.

Und bei der Gelegenheit ein Punkt, den ebenfalls viele Leute an der robots.txt nicht verstanden haben: Sie wird eigentlich von oben nach unten abgearbeitet, der erste passende Eintrag bestimmt das weitere vorgehen. Wird "Disallow: /bla" von "Allow: bla/fasel" gefolgt, ist entsprechend letzteres wirkungslos, weil ein Pfad /bla/faseldidumm schon bei /bla passt.

Google ignoriert allerdings auch hier die ursprüngliche robots.txt-Definition und arbeitet IIRC erst die Allow-Zeilen ab, dann die Disallow-Zeilen.

0 52

Seiten über robots.txt sperren

Jürgen
  • sonstiges
  1. 0
    Christian Kruse
    1. 0
      beatovich
      1. 1
        Christian Kruse
        1. 0
          beatovich
          1. 0
            Christian Kruse
  2. 0
    beatovich
    1. 0
      Matthias Apsel
      1. 0
        beatovich
        1. 0
          Regina Schaukrug
          1. 1
            Tabellenkalk
  3. 2
    Regina Schaukrug
    1. 1

      robots.txt-Funktionsweise

      Singsang
      1. 0
        Regina Schaukrug
  4. 0
    pl
    1. 0
      Mitleser
      1. 0
        pl
        1. 0
          Mitleser
          1. 0
            Mitleser
            1. 2
              Mitleser
            2. 0
              beatovich
              1. 0
                Mitleser
              2. 0
                pl
          2. 0
            pl
            1. 0
              Mitleser
              1. -1
                pl
                1. 0
                  Matthias Apsel
                  1. 0

                    Bots unterstützen!

                    pl
                    1. 0
                      Matthias Apsel
                      1. 0
                        pl
                2. 0
                  Mitleser
                  1. 0
                    pl
                    1. 0
                      Mitleser
                      1. 0
                        Christian Kruse
                        1. 0
                          Mitleser
                          1. 0
                            pl
                            1. 0
                              beatovich
                              1. -2
                                pl
                            2. 0
                              Mitleser
                              1. 0
                                pl
                          2. 0
                            Christian Kruse
  5. 0
    Jürgen
    1. 0
      beatovich
    2. 0
      pl
      • suchmaschinen
      1. 0
        Jürgen
      2. 0
        beatovich
    3. 2
      Singsang
      1. 0
        pl
        1. 2
          Singsang
          1. 0
            Regina Schaukrug
            1. 0
              pl
      2. 1

        Alles was interessant ist heißt "Pfui!"

        Regina Schaukrug