Moin,
ich weiß letztens schreibe ich noch das SEO ein Buch mit Sieben siegeln ist und sich da niemand gerne in die Karten gucken lässt und heute stelle ich selbst eine Frage :D.
Die Frage ist eigentlich recht simpel - wie erkennt Google doppelten Inhalt (doublicated Content)?
Als Hintergrund:
Wir haben da eine Seite die hat News (Anzahl 100). Die werden als Liste dargestellt. Bei diesen Beispiel sagen wir mal gibt es keine Blätterunfktion, also sind alle 100 auf einmal sichtbar. Da man 100 News nicht überblicken kann gibt es eine Filter Funktion. Man kann z.B. nur News von heute anzeigen lassen (als Beispiel bleiben 20 News stehen). Also hat man 2 (verschiedene?) Seiten - einmal mit 100 News und einmal mit 20 News.
Mein Kollege meint, dass wir alle Seiten welche eine Filterfunktionalität haben aus dem Google Index rausnehmen müssen aufgrund doppelter Inhalte. Sprich er meint, dass Google die Seite mit 100 News und die Seite mit 20 News als doppelten Content ansieht und die komplette Domain abstraft.
Meines Wissens nach bildet Google einen Hash um so doppelten Inhalt zu kontrollieren. Wenn man also einen kompletten Newsblock entfernt, dann kann der Hash nicht mehr stimmen. Ergo sind die zwei Seiten für Google komplett unterschiedlich.
Bitte um etwas Licht.
Gruß
Anti Maulwurf
T-Rex