THX9: foo.bar/site.php/site2 Problem

Guten Morgen :-)

Ich hab ein großes Problem mit einer Webseite. Bei einer meiner Seiten musste ich feststellen, dass Google von einer Unterseite etliche Kopien in den Index aufgenommen hat.

Also foo.bar/site.php wäre ok. Nun existieren 20 weitere Seiten nach dem Muster foo.bar/site.php/irgendwas (weitere reale Seitennamen). Allerdings alle mit dem Inhalt von site.php
Ich hab das Problem erstmal so mittels .htaccess Rule gelöst:

RewriteCond %{REQUEST_URI} (.*).php/(.*)$
RewriteRule (.*).php/(.*)$ /$1.php [R=301,L]

Nun sehe ich neue Duplikate nach dem Muster:

foo.bar/site.php?id=123bla

Meine zwei Fragen:

1. Wie kann das passieren?
2. Wie kann ich das zuverlässig ausschliessen.

Bin da leider kein Experte, hoffe Ihr könnt mir helfen...

Grüße Tom

  1. moin,

    Bin da leider kein Experte, hoffe Ihr könnt mir helfen...

    Freilich, gerne: Sorge für eine 1:1 Beziehung zwischen Content(s) und URI(s) und überarbeite dazu ggf. Deine Projektverwaltung.

    Hotti

  2. Hallo Tom

    1. Wie kann das passieren?

    Wenn Du Inhalte online anbietest und nicht explizit den Zugriff darauf verbietest, ist die Moeglichkeit immer da, dass eine Suchmaschine diese Inhalte auch findet. Je nach Inhalt deiner Seiten kann das zum Beispiel ueber den Referrer geschehen, oder jemand linkt auf eine dieser Seiten oder Du hast Google Analytics auf den Seiten oder ...

    1. Wie kann ich das zuverlässig ausschliessen.

    Vorzugsweise durch hottis Vorschlag - sortiere Deinen Inhalt so, dass jeder einzelne Seite genau eine eindeutige Url hat. Falls das nicht moeglich sein sollte, schau Dir mal robots.txt und robots meta-tags an. Eventuell waere auch der meta-tag fuer canonical links interessant.

    Viel Erfolg

    Claudia