foo.bar/site.php/site2 Problem
THX9
- webserver
Guten Morgen :-)
Ich hab ein großes Problem mit einer Webseite. Bei einer meiner Seiten musste ich feststellen, dass Google von einer Unterseite etliche Kopien in den Index aufgenommen hat.
Also foo.bar/site.php wäre ok. Nun existieren 20 weitere Seiten nach dem Muster foo.bar/site.php/irgendwas (weitere reale Seitennamen). Allerdings alle mit dem Inhalt von site.php
Ich hab das Problem erstmal so mittels .htaccess Rule gelöst:
RewriteCond %{REQUEST_URI} (.*).php/(.*)$
RewriteRule (.*).php/(.*)$ /$1.php [R=301,L]
Nun sehe ich neue Duplikate nach dem Muster:
foo.bar/site.php?id=123bla
Meine zwei Fragen:
1. Wie kann das passieren?
2. Wie kann ich das zuverlässig ausschliessen.
Bin da leider kein Experte, hoffe Ihr könnt mir helfen...
Grüße Tom
moin,
Bin da leider kein Experte, hoffe Ihr könnt mir helfen...
Freilich, gerne: Sorge für eine 1:1 Beziehung zwischen Content(s) und URI(s) und überarbeite dazu ggf. Deine Projektverwaltung.
Hotti
Hallo Tom
- Wie kann das passieren?
Wenn Du Inhalte online anbietest und nicht explizit den Zugriff darauf verbietest, ist die Moeglichkeit immer da, dass eine Suchmaschine diese Inhalte auch findet. Je nach Inhalt deiner Seiten kann das zum Beispiel ueber den Referrer geschehen, oder jemand linkt auf eine dieser Seiten oder Du hast Google Analytics auf den Seiten oder ...
- Wie kann ich das zuverlässig ausschliessen.
Vorzugsweise durch hottis Vorschlag - sortiere Deinen Inhalt so, dass jeder einzelne Seite genau eine eindeutige Url hat. Falls das nicht moeglich sein sollte, schau Dir mal robots.txt und robots meta-tags an. Eventuell waere auch der meta-tag fuer canonical links interessant.
Viel Erfolg
Claudia