Wurzelzwerg: Fehler 404 und google

Hallo allerseits,

ich habe vor ca. 2 Wochen meine HP komplett umstrukturiert. Die eigentlichen Daten liegen jetzt in der Datenbank und werden von einigen php-Scripten ausgelesen. Funktioniert auch alles, dank einiger Hinweise hier aus dem Forum :) Eine Folge dieser Aktion ist, daß alle html-Seiten weggefallen sind, die google nun aber kennt und immer noch anbietet. Klickt man nun drauf, dann kriegt man eine Fehler-404-Seite (also keinen Fehler sondern eine Seite, die statt dessen angezeigt wird). Soweit so gut. Kann google nun erkennen, daß das eine Fehlerseite ist und nimmt er den html-Verweis irgendwann aus dem Index, oder "denkt" google jetzt, daß auf der Seite xyz.htm steht, daß diese Seite nicht mehr auf dem Server existiert?? Oder muß ich in die Fehler-404-Seite einen speziellen Meta-Tag schreiben, damit die Suchmaschinen wissen, daß die Seite nicht mehr existiert und aus dem Index geworfen werden soll ??

vielen Dank schonmal ;)

  1. Spontaner Gedanke, ohne die Vorgehensweise von Google so genau zu kennen. Erstelle doch eine .htaccess mit dem Status 301 (Moved Permanently) für die nicht mehr existierenden Seiten.

  2. hi,

    Klickt man nun drauf, dann kriegt man eine Fehler-404-Seite (also keinen Fehler sondern eine Seite, die statt dessen angezeigt wird).

    Das eine schließt das andere nicht aus (sollte es auch gar nicht).

    Soweit so gut. Kann google nun erkennen, daß das eine Fehlerseite ist

    Wenn der Request ordnungsgemäß mit dem HTTP Status Code 404 Not Found beantwortet wurde, ja.

    und nimmt er den html-Verweis irgendwann aus dem Index,

    Jein.
    Sollte es schon, aber in der Praxis funktioniert das nicht immer zuverlässig.

    oder "denkt" google jetzt, daß auf der Seite xyz.htm steht, daß diese Seite nicht mehr auf dem Server existiert??

    Google "denkt" sich bei den Textinhalten von Fehlerseiten relativ wenig.
    Nochmal: Auf den HTTP Status Code kommt es an.

    Oder muß ich in die Fehler-404-Seite einen speziellen Meta-Tag schreiben, damit die Suchmaschinen wissen, daß die Seite nicht mehr existiert und aus dem Index geworfen werden soll ??

    Nee, Metatags reichen da m.W. nicht.

    Aber Hennes Vorschlag, möglichst günstig von den alten URLs auf die neuen Weiterzuleiten, ist vermutlich die beste Alternative.
    Damit sagst du dem SuMa-Bot nicht nur, "das gibt's hier nicht mehr" - sondern "das, was du willst, gibt's jetzt stattdessen dort".

    gruß,
    wahsaga

    --
    /voodoo.css:
    #GeorgeWBush { position:absolute; bottom:-6ft; }
    1. Ja, die Idee hat was. Allerdings viel Arbeit, bei ca. 350 weggefallenen Seiten:(
      Mir schwebt da eine Datenbanktabelle vor, in der die alte URL und die passende neue URL stehen. Habe ich die Möglichkeit, in der Fehler 404-Seite z.B. über eine PHP-Umgebungsvariable festzustellen, wo der Betreffende eigentlich hin wollte ?? Wenn das klar ist, dann ist der Rest nur noch Programmierarbeit. Man könnte ja da sogar noch mit einem Zeitstempel arbeiten und Eintraege löschen, die ein Jahr lan nicht aufgerufen wurden ;)

      viele Grüße vom Zwerg

      Aber Hennes Vorschlag, möglichst günstig von den alten URLs auf die neuen Weiterzuleiten, ist vermutlich die beste Alternative.
      Damit sagst du dem SuMa-Bot nicht nur, "das gibt's hier nicht mehr" - sondern "das, was du willst, gibt's jetzt stattdessen dort".

      1. hi,

        Habe ich die Möglichkeit, in der Fehler 404-Seite z.B. über eine PHP-Umgebungsvariable festzustellen, wo der Betreffende eigentlich hin wollte ??

        Natürlich, schau in $_SERVER nach.

        gruß,
        wahsaga

        --
        /voodoo.css:
        #GeorgeWBush { position:absolute; bottom:-6ft; }