Suchmaschinen und PHP
Susanne
- sonstiges
0 dk0 Raffi
0 Jan0 Sönke Tesch0 Michael Schröpl
Hi,
sagt mal, ist es wirklich so, daß php-Seiten nicht von Suchmaschinen gefunden werden??? Also z. B. eine index.php als Startseite auch nicht?
CU
Susanne
Das halt ich für n Gerücht..
Das halt ich für n Gerücht..
Ja ich auch...Das PHP File gibt ja beim Browserzugriff HTML Tags aus. Eine Suchmaschine verhält sich wie ein "Browser" Die Seiten werden also auch indexiert!
Gruss
Raffi
Hi,
es gibt Suchmaschinen, die nur die Dateiendung .htm[l] indizieren. Welche was wie macht, erfaehrst Du auf der 'About' Seite der jeweiligen Suchmaschine.
Einen ganzen HAufen interessantes und wissenswertes ueber Suchmaschinen findet man bei http://www.suchfibel.de
Jan
--
sagt mal, ist es wirklich so, daß php-Seiten nicht von Suchmaschinen gefunden werden??? Also z. B. eine index.php als Startseite auch nicht?
Nein. Suchmaschinen indizieren grundsätzlich erstmal alles, was als sie HTML vor die Nase gesetzt bekommen. Ob es sich um HTML handelt oder nicht, bestimmt dabei (aus Sicht der Suchmaschine) nicht die Dateiendung, sondern die Angabe in der Content-Type-Zeile, die der Server schickt.
Das Problem (nicht nur, aber gerade) mit PHP-Seiten ist, daß viele Leute fälschlicherweise an die URL ein Fragezeichen anhängen, um damit die Navigation zu vollziehen (index.php?seite=1, index.php?seite=2, etc). Dafür ist das Fragezeichenanhängsel aber nie gedacht gewesen, sondern einzig und allein für Benutzereingaben, d.h. dort, wo für die Eingabe eines Benutzers eine ganz speziell für ihn zugeschnittene Seite erscheint. Bestes Beispiel für so etwas sind die Ergebnisseiten von Suchmaschinen (suche.cgi?query=suchmirwas).
Da solche (per Definition) benutzerspezifischen Seiten aber keinen Wert für die Allgemeinheit besitzen, werden sie von vielen (wenn nicht den meisten) Suchmaschinen nicht oder nur unvollständig indiziert.
Es hat also nichts mit PHP zu tun, sondern mit der Art und Weise, wie PHP-Skripte häufig gesteuert werden.
Du kannst dieses Problem umgehen, indem Du statt des Fragezeichens einfach einen Pfad an die Skript-URL anhängst, zum Beispiel index.php/kontakt oder index.php/ueber_mich. Der Teil hinter dem Skriptnamen erscheint in einer Variable namens $_SERVER["PATH_INFO"].
Siehe auch [http://forum.de.selfhtml.org/?t=34022&m=185184] hier im Forum.
Gruß,
soenk.e
Hi Susanne,
sagt mal, ist es wirklich so, daß php-Seiten nicht von Suchmaschinen gefunden werden??? Also z. B. eine index.php als Startseite auch nicht?
in dieser Allgemeinheit ist die Behauptung sicherlich falsch. Und Sönkes Beschreibung ist zunächst einmal richtig: Der URL ist theoretisch Schall und Rauch, eigentlich sollte die Suchmaschine sich nur am Content-Type orientieren.
Praktisch ist es jedoch so, daß viele Webserver die Konfiguration zwischen Dateityp und serverseitiger Interpretation an bestimmte, bekannte Namensmuster (meist Endungen) knüpfen. Die Theorie, daß eine index.php-Seite auf dem Server PHP-Code enthält und damit dynamischer Natur ist, hat jedenfalls zumindest statistisch betrachtet etwas für sich.
Mit den erwähnten Parametern eines URL ist es genauso. Letzten Endes macht so etwas ja vor allem dann Sinn, wenn diese Informationen genutzt werden können, um damit den Inhalt der "eigentlichen" Seite dynamisch zu beeinflussen.
Nun bedenke aber, was eine Suchmaschine eigentlich tun will: Sie will dem Suchenden Seiten vermitteln, über deren Inhalt sie etwas weiß.
Echt dynamischer, also variabler Inhalt ist also der natürliche Feind der Suchmaschine und deren statischer Indexstrukturen: Nichts wäre für den Besucher der Suchmaschine häßlicher, als eine Seite als Treffer angeboten zu bekommen, deren Inhalt gar nicht (mehr) zu der gestellten Suchanfrage paßt. So etwas ist einfach frustrierend für den Besucher - und damit schädlich für den Betreiber der Suchmaschine.
Insofern ist ein gewisses natürliches Mißtrauen einer Suchmaschine gegenüber erkennbar dynamischen Seiten angebracht. Und wenn Deine Seite tatsächlich inhaltlich sehr variabel ist, dann würdest Du die Suchmaschine an der Erfüllung ihrer natürlichen Aufgabe hindern, wenn Deine Seite geindext würde.
Solltest Du also sicher sein, daß Deine Seite zwar dynamisch ist, aber im Wesentlichen einen statischen, gut indexierbaren Inhalt besitzt, dann kannst Du Dich entsprechend verhalten und eine statische Seite "glaubhaft simulieren".
Das beginnt mit einem entsprechenden URL-Schema (die Abbildung von index.htm auf Deinen PHP-Interpreter kannst Du ja ggf. verzeichnislokal definieren oder sogar über Content Negotiation dynamisch realisieren, im Apache also Multiviews einschalten und die Datei "index.htm.php" nennen, aber mit "index.htm" ansprechen) und endet noch lange nicht bei der Auslieferung eines Datums der letzten Änderung des ausgelieferten Inhalts (HTTP-Header "Last-Modified"), der ansonsten bei dynamischen Seiten normalerweise fehlt (und der Suchmaschine ebenfalls 'unangenehm auffallen' könnte).
Mach doch mal mit
http://www.schroepl.net/cgi-bin/http_trace.pl
jeweils einen Zugriff auf eine statische und eine dynamische Seite Deines Angebots - und vergleiche, was ein ggf. mißtrauischer Robot in beiden Fällen zu sehen bekommt.
Wer sich wirkungsvoll verstecken will, muß durch die Augen des Feindes blicken können ...
Viele Grüße
Michael