Peter: Nicht gefundene Seiten

Hallo!

In der grafischen Logfile-Auwertung bei Puretec erscheinen immer wieder nicht gefundene Seiten. Die habe ich schon vor mehreren Monaten gelöscht und es gibt keine defekten Links dorthin innerhalb der Homepage. Der Linkchecker von Webmasterplan findet auch keine externen Links direkt auf diese nicht mehr existenten Unterseiten.
Dass die gespeicherten Adresse in der Adressleiste des Browsers oder die History/Verlauf sich über meherer Monate hält, kann ich mir kaum vorstellen.
Hat jemand sonst eine Idee, wo diese Seitenaufrufe herkommen könnten?

Für Tipps bin ich sehr dankbar!

Hezliche Grüße!

Peter

  1. Hallo,

    bei mir kommt das auch immer wieder vor.  Ein Blick in die logs hat es mir verraten:

    aus (mir auch) unerfindlichen Gründen hat z.B. Google alte Pfade gespeichert. Wenn dann jemand aufgrund seiner Suchanfrage das Angebot von Google anklickt, kann er auf einen Pfad geführt werden, der bei mir schon längst (4 Wochen) nicht mehr existiert.

    Es entsteht die Fehlermeldung "nicht gefunden" obwohl die SEite ja noch da ist, eben nur in einem anderen Verzeichnis.

    Was man dagegen tun kann, weiß ich leider auch nicht.

    Grüßle,
    Marion

  2. Hat jemand sonst eine Idee, wo diese Seitenaufrufe herkommen könnten?

    Hallo,

    ja... das liegt sicherlich an den Robots der Suchmaschinen.
    Hast Du Deine Unterseiten indizieren lassen (index,follow)?

    Wenn ja besucht der Spider die Seite (und damit auch die nicht vorhandene Datei) des öfteren. Schau Dir Deine Log Files doch mal genauer an. Was steht denn da unter verwendeter Browser.

    Abhilfe schafft eine robots.txt in welcher Du den Zugriffe auf die nicht mehr vorhandenen Dateien verbietest.

    Bene

    1. Hallo Benedikt,

      Abhilfe schafft eine robots.txt in welcher Du den Zugriffe auf die nicht mehr vorhandenen Dateien verbietest.

      hilft in diesem Fall nicht oder nur wenig, da z.Bsp. Google diese
      Sache (robots.txt) nur höchst unzureichend beachtet.
      Besser ist es imho, dem anfragenden Client den korrekten Errorcode
      zurückzuliefern, siehe </?m=44750&t=8078>

      Viele Grüße,
      Stefan

  3. Hallo Peter,

    In der grafischen Logfile-Auwertung bei Puretec erscheinen immer wieder nicht gefundene Seiten. Die habe ich schon vor mehreren Monaten gelöscht und es gibt keine defekten Links dorthin innerhalb der Homepage.
    Hat jemand sonst eine Idee, wo diese Seitenaufrufe herkommen könnten?

    z.Bsp. von http://www.archive.org/ oder http://www.google.com/, am
    Einfachsten wird es sein, wenn Du einfach mal einen Blick in den
    Logfile wirfst, da steht sowas drin.

    Wenn Du eine solche Seiten gefunden hast, dann schreibe in die
    .htaccess einen Redirect rein, in diesen Fall eine der zwei
    folgenden Varianten:

    die Inhalte dieser Seite sind unter einer anderen Adresse

    RedirectPermanent /seite.html http://domain.xy/neu/seite.html

    diese Seite und die alten Inhalte gibt es nicht mehr

    Redirect gone /seitealt.html

    Es wird dann der korrekte Errorcode zurückgeliefert und Du hast
    die Sache nicht mehr als 404 im Logfile stehen.

    Viele Grüße,
    Stefan