Hans-Herbert: HILFE: Robots / Meta Tags / Index hat nur Javascript

Guten Morgen zusammen.

Ich komme nochmal zurück auf mein Problem von gestern Abend.
( http://forum.de.selfhtml.org/?m=28853&t=5172 )

Ich bin bei folgender Frage stehengeblieben:

Wenn ich meine Seite bei z.B. Google anmelde, dann wird der crawler zunächst das oberste Verzeichniss, also die Index.html durchsuchen.

Nur besteht diese Datei ausschließlich aus Javascript für eine Flash-Detektion, mit den entsprechenden Weiterleitungen. (vornehmlich zu einer swf datei, von da aus gehts dann erst zu unserer eigentlichen Hauptseite.)
Hier wird der crawler also wohl steckenbleiben und somit nichts von unserer Homepage indizieren.

Wie mache ich dem crawler trotzdem klar das es hier noch weitergeht,
oder ist es nicht noch besser und auch einfacher, gleich bei der Anmeldung den Pfad zu unserer Hauptseite anzugeben?
( www.holzundstahl.de/index2.html) Und akzeptiert z.B. Google diese Vorgehensweise.

Aus diesen robots.txt werde ich noch nicht so ganz schlau und weiß auch nicht ob das in meinem Fall wirklich notwendig ist. Er darf ja ruhig alles durchforsten.

Vielen Dank, Hans-Herbert

  1. hi hans,

    <!-- hier die dokumenttype angabe -->
    <html>
    <head>
    <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
    <!-- hier metags -->
    <title>test</title>
    <!-- hier java script -->
    </head>

    <body bgcolor="#FFFFFF" text="#000000">
    <!-- hier dein flash -->
    </body>
    </html>

    wenn du das so wie hier beschrieben machst ist jede suchmaschine zufrieden.
    das war es was ich gestern gemeint habe.

    mfg
    sven

    1. hi hans,

      <!-- hier die dokumenttype angabe -->
      <html>
      <head>
      <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
      <!-- hier metags -->
      <title>test</title>
      <!-- hier java script -->
      </head>

      <body bgcolor="#FFFFFF" text="#000000">
      <!-- hier dein flash -->
      </body>
      </html>

      wenn du das so wie hier beschrieben machst ist jede suchmaschine zufrieden.
      das war es was ich gestern gemeint habe.

      Lieber Sven,
      Vielen Dank das du so beharrlich versuchst mir zu helfen,
      Aber bei mir ist es doch alles ein wenig anders:

      Ich habe keine .html Datei in der Flash eingebunden ist.
      Meine Index.html leitet weiter auf eine reine .swf Datei.

      In der Index.html befindet sich nur ein javascript für eben diese Weiterleitung.
      Sicherlich könnte ich in die Index.html die meta tags einfügen, aber soweit ich das ganze Prinzip dieser crawler verstanden habe, brauchen die auch links / pfade um an meine anderen Seiten zu kommen und diese auch zu indizieren. Und diese Links gibt es halt nicht auf meiner Index.html.

      Tut mir leid wenn ich in deinen Augen vieleicht immer wieder von vorne anfange.

      Nochmals vielen Dank, ha-he

      1. Hallo,

        Sicherlich könnte ich in die Index.html die meta tags einfügen, aber soweit ich das ganze Prinzip dieser crawler verstanden habe, brauchen die auch links / pfade um an meine anderen Seiten zu kommen und diese auch zu indizieren. Und diese Links gibt es halt nicht auf meiner Index.html.

        Wieso fügst du den Link nicht die index.html ein? Wenn man die Seite aufruft, wird man per JavaScript zur Flash-Datei weitergeleitet, ist Javascript deaktiviert, hat man einen Link um trotzdem zu deiner Seite zu kommen. Und genau diesem Link kann dann auch der robot folgen.

        Gruß Markus

        1. Hallo,

          Wieso fügst du den Link nicht die index.html ein? Wenn man die Seite aufruft, wird man per JavaScript zur Flash-Datei weitergeleitet, ist Javascript deaktiviert, hat man einen Link um trotzdem zu deiner Seite zu kommen. Und genau diesem Link kann dann auch der robot folgen.

          Gruß Markus

          Hallo Markus,

          Genau das wollte ich eigentlich nur wissen. Ob man das so macht und das dann auch funktioniert. Vielen Dank für deinen Beitrag.
          Werde es jetzt wohl so einrichten.

          Vieleicht weißt du auch ob diese robots es lieber haben wenn da der komplette href steht (http://www.holzundstahl.de/index2.html) oder ob es denen reicht wenn da nur index2.html steht.

          Ich danke dir sehr herzlich, Hans-Herbert

          1. hi hans,
            da hab ich dich dann wohl falsch verstanden, tut mir leid :-(
            nein,(http://www.holzundstahl.de/index2.html) das brauchst du dem robot nicht sagen, der findet den weg alleine, wenn du das so machst wie dir vorgeschlagen wurde.
            ich mache es zwar ungerne, aber du solltest dir auch vielleicht noch das hier ansehen:

            http://selfhtml.teamone.de/html/kopfdaten/index.htm

            dann fallen dir bestimmt einige dinge leichter.

            trotzdem, wie schon gesagt: hast ne richtig klasse seite gebaut, hab mir die gestern noch reingetan.

            mfg
            sven

  2. Du kannst auch unsichtbare Verweise eingeben, d.h. ohne für den Nutzer sichtbaren Text; die meisten Suchmaschinen sollen, so sagt die Sage, auch solchen Verweisen folgen. Dann kannst DU auch lustig mehrere Verweise eintippen, da's der Nutzer eh nicht sieht, fast so etwas wie ein Liebesbrief an die Suchmaschine.
    Mattes

  3. Hi Hans-Herbert,

    Nur besteht diese Datei ausschließlich aus Javascript für
    eine Flash-Detektion, mit den entsprechenden Weiterleitungen.

    wenn Du in Deinem <script>-Bereich eine dynamische Weiterleitung machst,
    dann ist Dein Dokument für einen crawler, der kein JavaScript beherrscht,
    leer.
    Für einen Browser-Besitzer, der JavaScript abgeschaltet hat, übrigens auch.

    Beiden würdest Du einen Gefallen tun, wenn Du in einem <noscript>-Bereich
    etwas anbietest, dazu über konventionelles HTML zu weiteren Seiten führt
    (vorausgesetzt, Du hast überhaupt solche weiteren Seiten in einer Sprache,
    die sich sinnvoll indexieren läßt).
    Das könnte beispielsweise ein normaler Link zu einer serverseitig programm-
    generierten Liste sämtlicher Dokumente Deiner Domain sein - außer dem Craw-
    ler wird kaum jemand dieses Dokument jemals zu Gesicht bekommen, aber die-
    ser findet dann (schon in Link-Traversierungstiefe 2!) alles, was er sucht.

    Viele Grüße
          Michael

    1. Hi Hans-Herbert,

      Nur besteht diese Datei ausschließlich aus Javascript für
      eine Flash-Detektion, mit den entsprechenden Weiterleitungen.

      wenn Du in Deinem <script>-Bereich eine dynamische Weiterleitung machst,
      dann ist Dein Dokument für einen crawler, der kein JavaScript beherrscht,
      leer.
      Für einen Browser-Besitzer, der JavaScript abgeschaltet hat, übrigens auch.

      Beiden würdest Du einen Gefallen tun, wenn Du in einem <noscript>-Bereich
      etwas anbietest, dazu über konventionelles HTML zu weiteren Seiten führt
      (vorausgesetzt, Du hast überhaupt solche weiteren Seiten in einer Sprache,
      die sich sinnvoll indexieren läßt).
      Das könnte beispielsweise ein normaler Link zu einer serverseitig programm-
      generierten Liste sämtlicher Dokumente Deiner Domain sein - außer dem Craw-
      ler wird kaum jemand dieses Dokument jemals zu Gesicht bekommen, aber die-
      ser findet dann (schon in Link-Traversierungstiefe 2!) alles, was er sucht.

      Viele Grüße
            Michael

      Lieber Michael,
      Vielen Dank, ich hab es jetzt bereits genau auf diese Weise gemacht.
      Hab in den noscript Bereich Informationen für Besucher ohne Java geschrieben und zusätzlich Links zu den weiteren Seiten eingefügt.
      Ist zwar dann wirklich kein Spaß mehr die Seite zu besuchen, aber auf jeden Fall wird der crawler damit glücklich.

      Ich Danke allen die mir geholfen haben,
      Grüße, Hans-Herbert

      1. Hallo!

        Vielen Dank, ich hab es jetzt bereits genau auf diese Weise gemacht.
        Hab in den noscript Bereich Informationen für Besucher ohne Java geschrieben und zusätzlich Links zu den weiteren Seiten eingefügt.

        http://www.holzundstahl.de/profil.html
        http://www.holzundstahl.de/dokumentation.html
        http://www.holzundstahl.de/aktuelles.html
        http://www.holzundstahl.de/kontakt.html
        http://www.holzundstahl.de/spielplatz.html

        Diese fünf Seiten sind ein Beispiel, was der Besucher später bei Google finden wird. Sollte der Besucher die Homepage als Suchergebnis vor sich haben, dann mit der folgenden Beschreibung:

        "Javascript ist deaktiviert Sie müssen Javascript aktivieren um unsere Seite vernünftig darstellen zu können DANACH WEITER HIER Ohne Java Aktivierung können sie die unten stehenden Links benutzen. PROFIL DOKUMENTATION AKTUELLES KONTAKT SPIELPLATZ"

        Es wäre wohl sinnvoller gewesen, auf das Flash-Intro, JavaScript (zur Navigation!) und auf die Verwendung von Frames zu verzichten, dann passieren solche Pannen nicht und man hat wesentlich mehr Chancen gute Suchergebnisse und zufriedenere Besucher.

        Ist zwar dann wirklich kein Spaß mehr die Seite zu besuchen, aber auf jeden Fall wird der crawler damit glücklich.

        Ja, aber dieses "glücklich sein" beschränkt sich auf auf den Crawler, der Besucher wird sich sicher sehr schnell dem nächsten Suchtreffer zuwenden.

        Tschuess

        Steve