Karin: Google findet nur Startseite

Hallo,

da ich seit einigen Tagen vor einem Rätsel stehe und nicht weiter komme, bin ich nun auf der Suche nach Rat. Ich habe eine umfangreiche Website aufgebaut, die seit einem halben Jahr im Netz ist. Bis vor einem Monat waren die Seiten nur über eine Weiterleitung in einen Frame zugänglich (www.neutronenforschung.de), jetzt landet man durch die Weiterleitung bei www.physik.uni-kiel.d/kfn/. Ich hatte erwartet, daß nun die Seiteninhalte von Suchmaschinen gefunden werden, das ist aber leider nicht so. Die Startseite wird gefunden, es gibt auch einige Links von Außen auf die Seite, die meisten allerdings auf www.neutronenforschung.de. Das Ergebnis von eine Gooogle-Suche "link:www.physik.uni-kiel.d/kfn/" ist allerdings identisch mit dem der Suche "link:www.neutronenforschung.de". Vermutlich lag es also vorher schon nicht an der Weiterleitung?

Meine Seiten sind php-Dokumente ohne angehängte Parameter in der URL. Ich habe angefangen, php zu verwenden, weil ich die Links damit verwalten wollte. Dazu habe ich eine Datei angelegt, in der alle Links (externe und interne) als Variablen definiert sind, so daß ich sie zentral ändern kann. Kann das eventuell eine Barriere für die Suchmaschinen sein? Ich kann mir das nicht vorstellen, denn ich benutze php ja nur, um damit HTML-Code zu erzeugen, im Quelltext der Seite stehen ja alle URLS wieder drin.

Inzwischen bin ich auch dazu übergegangen, einige Seiteninhalte als php-Funktionen zu definieren, so z.B. die Navigationsleiste oder wechselnde Inhalte auf der Startseite. Aber auch dabei wird ja ganz normaler HTML-Code erzeugt. Oder kommt es darauf nicht an für die Suchmaschinen?

Ansonsten habe ich versucht, kurze, relevante Titel und Descriptions zu verfassen usw., aber ich denke, hier muß ein prinzipielles Problem vorliegen, dann es wird ja absolut gar nichts aus meinen Seiten gefunden. Hat jemand eine Idee, woran das liegen könnte? Habe ich genug Informationen gegeben, um dazu etwas sagen zu können?
Ich bin gespannt auf Antworten...

  1. hi,

    Ich habe eine umfangreiche Website aufgebaut, die seit einem halben Jahr im Netz ist. Bis vor einem Monat waren die Seiten nur über eine Weiterleitung in einen Frame zugänglich (www.neutronenforschung.de),

    frames waren noch nie der suchmaschinen liebste kinder, also nicht unbedingt verwunderlich, wenn google & co. die seite bisher nicht mochten.

    jetzt landet man durch die Weiterleitung bei www.physik.uni-kiel.d/kfn/. Ich hatte erwartet, daß nun die Seiteninhalte von Suchmaschinen gefunden werden, das ist aber leider nicht so.

    ein monat ist noch nicht so lange ...
    hast du denn z.b. zugriff auf die server logs, um mal zu schauen, ob der google-bot "schon da war"?
    (aber auch nach seinem besuch kann es noch länger dauern, bis die seiten im index auftauchen. google aktualisiert seinen index ja schliesslich nicht täglich komplett - bei dem umfang eh unmachbar - sondern in bestimmten intervallen.)

    Die Startseite wird gefunden, es gibt auch einige Links von Außen auf die Seite, die meisten allerdings auf www.neutronenforschung.de.

    diese seite leitet ja auch die uni-kiel-seite weiter - allerdings ungünstiger weise per meta-refresh - auch etwas, was die SuMas nicht besonders mögen.

    wenn möglich, solltest du hier gleich einen serverseitigen redirect per entsprechendem HTTP-header machen, mit statuscode "301 Moved Permanently".

    Das Ergebnis von eine Gooogle-Suche "link:www.physik.uni-kiel.d/kfn/" ist allerdings identisch mit dem der Suche "link:www.neutronenforschung.de". Vermutlich lag es also vorher schon nicht an der Weiterleitung?

    darüber finde ich gerade die seite http://dmoz.org/World/Deutsch/Wissenschaft/Naturwissenschaften/Physik/Teilchen/, wo deine _neue_ seite http://www.physik.uni-kiel.de/kfn/ schon verlinkt ist.
    gerade web-verzeichnisse wie dmoz haben idR. einen sehr positiven einfluss auf das ranking bei google.
    aber ich weiß ja nicht, wie lange dmoz schon auf deine "neue" seite verlinkt(?).
    vermutlich musst du dich einfach noch ein wenig gedulden, bis google seinen index aktualisiert.

    btw: ich sehe gerade, dass dieser katalogeintrag auch bei google selbst gelistet wird, unter http://directory.google.com/Top/World/Deutsch/Wissenschaft/Naturwissenschaften/Physik/Teilchen/. die analogie zur struktur des dmoz-eintrages ist ja unverkennbar.
    also "kennt" google die seite wohl schon - dürfte wirklich nur noch eine geduldsfrage sein, bis du im index bist.

    Meine Seiten sind php-Dokumente ohne angehängte Parameter in der URL. Ich habe angefangen, php zu verwenden, weil ich die Links damit verwalten wollte. Dazu habe ich eine Datei angelegt, in der alle Links (externe und interne) als Variablen definiert sind, so daß ich sie zentral ändern kann. Kann das eventuell eine Barriere für die Suchmaschinen sein?

    nein, der SuMa-bot sieht genau das gleiche wie jeder andere client/browser auch.
    von den serverseitigen vorgängen bekommt er absolut null mit.

    gruß,
    wahsaga

    --
    I'll try being nicer if you'll try being smarter.
    1. Hallo wahsaga,

      vielen dank für die Antwort! Ich habe noch einige Fragen dazu...

      hast du denn z.b. zugriff auf die server logs, um mal zu schauen, ob der google-bot "schon da war"?<<

      Teilweise - ich bekomme über ein script die IP-Adresse, Zeit, Pfad und Status Codes ausgelesen. Kann ich daraus schließem, ob Google schon da war?

      (aber auch nach seinem besuch kann es noch länger dauern, bis die seiten im index auftauchen. google aktualisiert seinen index ja schliesslich nicht täglich komplett - bei dem umfang eh unmachbar - sondern in bestimmten intervallen.)<<

      Kommt mir aber schon recht lange vor - die Startseite, das hatte ich vergessen zu erwähnen, hatte ich auch angemeldet.

      wenn möglich, solltest du hier gleich einen serverseitigen redirect per entsprechendem HTTP-header machen, mit statuscode "301 Moved Permanently".<<

      Funktioniert das dann für alle Browser? So hat man ja noch die Möglichkeit, selbst auf den Link zur Seite zur klicken, falls die Weiterleitung nicht funktioniert.

      Karin.

      1. Hi,

        Teilweise - ich bekomme über ein script die IP-Adresse, Zeit, Pfad und Status Codes ausgelesen. Kann ich daraus schließem, ob Google schon da war?

        Ja. Zum einen fordert google i.d.R. /robots.txt an und zum anderen kommen die Spider meist über bestimmte IP-Bereiche.

        Kommt mir aber schon recht lange vor - die Startseite, das hatte ich vergessen zu erwähnen, hatte ich auch angemeldet.

        Eigenanmeldung dauert meist viel länger als wenn eine Seite extern verlinkt ist.

        wenn möglich, solltest du hier gleich einen serverseitigen redirect per entsprechendem HTTP-header machen, mit statuscode "301 Moved Permanently".<<

        Funktioniert das dann für alle Browser? So hat man ja noch die Möglichkeit, selbst auf den Link zur Seite zur klicken, falls die Weiterleitung nicht funktioniert.

        Ich verstehe die Frage nicht; Du solltest auf eine meta-refresh Weiterleitung auf jeden Fall verzichten, weil dies absolut schädlich in Bezug auf Suchmaschinen ist. Ein serverseitiger Redirect funktioniert AFAIK sehr zuverlässig und bewirkt auch, daß Backlinks auf die Weiterleitungsadresse wirken.
        Nebenbei kannst Du so auch sämtliche Unterseiten mit Weiterleiten.

        Zum Grundsätzlichen vielleicht noch: Google spidert in Etappen. Erst die Startseite, dann die direkt von hier verlinkten Seiten und irgendwann (nicht immer) auch die in tieferen Ebenen verlinkten Seiten. Beachte aber, daß bei ca. 100 Links auf einer Seite Schluß ist.
        Außerdem sind Deine Seiten alles andere als suchmaschinen-optimiert. Hier steckt noch sehr viel Potential, um nicht nur eine Indizierung zu erreichen, sondern auch, daß die Seiten unter den gewünschten Keywords nicht unter ferner liefen angezeigt werden.
        Was Google u.U. "abstraft" sind Plagiate. Z.B. finden sich der Text von http://www.physik.uni-kiel.de/kfn/whyneutrons/Teilchenphysik auch unter http://www.frm2.tu-muenchen.de/kfn/strategie/node4.html.

        freundliche Grüße
        Ingo

        1. Hallo Ingo,

          vielen Dank für die Tipps. Das Hauptproblem habe ich inzwischen gelöst - es lag daran, daß der Administrator (ohne mein Wissen) in robots.txt den Zugriff für Suchmaschinen nicht zugelassen hatte. Das ist nun behoben, und google war auch schon auf der Seite unterwegs. Ich habe einen Site Index gemacht, um das zu erleichtern, allerdings ist er wohl ein bißchen lang (ca. 350 Links).

          Gruß,

          Karin.