Tylor: Unterseiten werden bei Google nicht mehr aufgenommen

Hallo zusammen,

ich habe ein Problem mit dem Ranking einer Seite die ich vor ca. 1/2 Jahr bei Google angemeldet hatte. Die Seite wurde nach wenigen Wochen für meine Keywords in Topppositionen gerankt. Google mag ja bekanntlich die Keywords im Verzeichnis und Dateinamen. Und so sind alle die Unterseiten der Site auch mit den entsprechenden Datei- und Verzeichnisnamen von mir versehen worden. Hat gut geklappt, die Sache. Doch kürzlich Schaue ich bei Google vorbei und finde meine Seite unter "Fernerliefen". Warum? Sämtliche Unterseiten mit den Keyworddateinamen wurden nicht mehr ausgegeben, sondern nur noch meine Index im Root der Website, die ebenfalls mit den Hauptkeywords versehen ist, aber natürlich nur index.html heißt. Die Seite ist somit nicht mehr gut gerankt. Hat Google meine sämtlichen Unterdateien nicht mehr im Cache? Ich habe dann bei Google nach meinen Datein gesucht und einen Verzeichnisnamen und einen Dateinamen mit sammt .html als Suchabfrage gestartet ('architekt' 'fassadenplanung.html')
und siehe da: Der Pfad zu meiner Datei wurde ausgegeben. Ich bekam den kompletten Pfad als Link zu meiner Seite, jedoch ohne headline und Suchtextergebnis, wie bei einem normalen Suchergebnis bei Google üblich. Google kannte den Pfad zu den Unterseiten also noch. Da Google ja bekanntlich eine Textsuchmaschine ist und eben so ein Text für die Unterseiten nicht mehr im Cache zu sein scheint, werden die Unterseiten nicht mehr gerankt. Warum? Ein Fehler des Googlebot?

Gibt es irgendwelche Kriterien die ein Einlesen der Unterseiten durch den Spider verhindern. Ich habe index,follow gesetzt. Die Seite wurde ja auch ein halbes Jahr mit allen Unterseiten aufgenommen.

meine Seite ist http://www.emotionalarchitecture.de

danke

Tylor

  1. Hallo,

    meine Seite ist http://www.emotionalarchitecture.de

    => </faq/#Q-19>
    http://www.emotionalarchitecture.de/

    Diese Seite enthaelt tonnenweise "versteckten" Text
    (winzige Schrift, Vorder- und Hintergrundfarbe identisch).
    Das ist Suchmaschinen-Spamming der schlechten alten Schule.

    Der einzige Link auf der Seite ist ein Bild
    <a href="architekt/hamburg.html"><img src="..." alt="emotional architecture"></a>

    Diese naechste Seite ist genau nach dem gleichen
    Schema gestrickt.
    Versteckter Text, nur zwei Bilder als Links.

    Wenn Du _das_ (sowie "angepasste Dateinamen") unter
    "Suchmaschinenoptimierung" verstehst, wundert mich
    _gar nichts_.

    Schreib lieber anstaendiges HTML mit anstaendigen Inhalten.

    Gute (deutschsprachige) Infos zu Suchmaschinen gibt es bei:
    http://www.kso.co.uk/
    http://www.suchfibel.de/
    Ausfuehrliche Infos zu Googles Page Rank
    und dem Algorithmus dahinter:
    http://pr.efactory.de/d-index.shtml

    Gruesse,

    Thomas

    --
    Bitte keine Mails mit Fachfragen - dafuer gibt es das Forum!
    Oft gestellte PHP-Fragen beantwortet die dclp-FAQ bestens: http://www.dclp-faq.de/
    1. Hi,

      Schreib lieber anstaendiges HTML mit anstaendigen Inhalten.

      genau! Und auch noch ein korrektes Impressum wäre empfehlenswert. Die dort als _Grafik_ eingebundenen Informationen sind ja völlig irrelevant und der unsichtbare - aber in Textbrowsern angezeigte - Inhalt

      "architekten, architekt, architekturbüro, bauplanung, wohnungsbau, gewerbebau, hausplanung, gebäudeplanung, hamburg Architekturbüro Emotional Architecture Hamburg architektur, architekten, architekt, architekturbüro, bauplanung, wohnungsbau, gewerbebau, hausplanung, gebäudeplanung, grundrissplanung, aussengestaltung, detailplanung, lichtplanung , visualisierung, themenarchitektur
      ... (achtmal wiederholt)"

      ist wirklich eine Zumutung und eigentlich gar keiner Verlinkung wert.

      freundliche Grüße
      Ingo

  2. Hallo Tylor,

    Google mag ja bekanntlich die Keywords im Verzeichnis und Dateinamen.

    Das würde ich eher für Altavista so sagen, bei Google ist es eher eine Mischung aus Keywords im Seitentext und dem Pagerank, in den u.A. eingeht, welche und wieviel Seiten auf Dich verlinken, und ob bzw. wo die Keywords in den verlinkenden Seiten vorkommen.

    Doch kürzlich Schaue ich bei Google vorbei und finde meine Seite unter "Fernerliefen". Warum?

    Ich habe zwar keinen Beleg, aber die Erfahrung mit eigenen Seiten, die seit mindestens zwei Jahren ein, mit geringen Schwankungen, konstant gutes Ranking haben, zeigt, daß regelmäßige Updates der Seite helfen. Nicht einfach nur das Datum ändern, sondern tatsächlich die Inhalte, auch wenn es nur eine Umformulierung ist.

    Sämtliche Unterseiten mit den Keyworddateinamen wurden nicht mehr ausgegeben, sondern nur noch meine Index im Root der Website,

    Das ist (immer schon?) der Normalfall bei Google. Bei meiner (und vielen anderen) Sites werden ein oder zwei Seiten gelistet und außerdem ein Link auf: "Weitere Seiten von www.domain.tld" geliefert.

    und siehe da: Der Pfad zu meiner Datei wurde ausgegeben. Ich bekam den kompletten Pfad als Link zu meiner Seite, jedoch ohne headline

    Die von Google angezeigte Headline ist doch das description-Tag im Header(?), ist das bei Dir leer?

    Unterseiten nicht mehr gerankt. Warum? Ein Fehler des Googlebot?

    Wenn Du Zugriff auf die Logdateien deines HTTP-Servers (bzw. den Deines Providers) hast, kannst Du nachvollziehen, wie oft Googlebot neu indiziert. Bei mir passiert das für fast alle Seiten mindestens einmal in der Woche (was nicht heißt, daß sich das Ranking jedesmal ändert)

    Gibt es irgendwelche Kriterien die ein Einlesen der Unterseiten durch den Spider verhindern. Ich habe index,follow gesetzt.

    Mehr kannst Du auch nicht machen. Ich habe das im <head> jeder HTML-Datei stehen und außerdem in der Domain-Root eine robots.txt mit "User-agent: *", was aber vermutlich so gut, wie überhaupt keine robots.txt ist.

    Die Seite wurde ja auch ein halbes Jahr mit allen Unterseiten aufgenommen.

    Ich vermute wirklich, daß regelmäßige Aktualisierung helfen kann. Vielleich ist aber auch die Keyword-Konkurrenz gewachsen?

    meine Seite ist http://www.emotionalarchitecture.de

    oh.. da sehe ich was:
    <font class="key1">architekten, architekt, architekturbüro,
    bauplanung, wohnungsbau, gewerbebau, hausplanung, gebäudeplanung, hamburg <b>Architekturbüro Emotional Architecture Hamburg architektur, architekten, architekt, architekturbüro,
    bauplanung, wohnungsbau, gewerbebau, hausplanung, gebäudeplanung, grundrissplanung, aussengestaltung, detailplanung, lichtplanung , visualisierung, themenarchitektur</b></font></td>    </tr>

    Mit font-color=Hintergrundfarbe. Sorry, aber das ist Keyword-Spamming.

    Gruß
    Roland

    1. Hallo,

      Die von Google angezeigte Headline ist doch das description-Tag im Header(?)

      Nein, es ist der Inhalt des TITLE-Elements.
      Darunter stehen dann die Ausschnitte (Snippets) aus
      dem Seiteninhalt.

      Gewisse andere Suchmaschinen zeigen auf der Resultate-Seite
      den Inhalt des Description-Meta-Tags an, z.B.
      http://www.alltheweb.com/ und
      http://www.search.ch/

      [...] wie oft Googlebot neu indiziert. Bei mir passiert das für fast alle Seiten mindestens einmal in der Woche (was nicht heißt, daß sich das Ranking jedesmal ändert)

      AFAIK aendert Google den Index (und wohl auch das Ranking)
      ca. monatlich beim sogenannten Google Dance.
      http://dance.efactory.de/d-index.php

      Mit font-color=Hintergrundfarbe. Sorry, aber das ist Keyword-Spamming.

      Sag ich doch! ;-)

      Gruesse,

      Thomas

      1. Hallo Thomas,

        AFAIK aendert Google den Index (und wohl auch das Ranking)
        ca. monatlich beim sogenannten Google Dance.
        http://dance.efactory.de/d-index.php

        Ja... etwa einmal im Monat geht der Dance los, aber zwischendurch sagt Googlebot immer mal wieder bei einzelnen Seiten "Guten Tag", ein System kann ich da nicht erkennen.

        Mit font-color=Hintergrundfarbe. Sorry, aber das ist Keyword-Spamming.

        Sag ich doch! ;-)

        Ich schreibe einfach zu langsam:-)

        Gruß
        Roland

      2. Die von Google angezeigte Headline ist doch das description-Tag im Header(?)

        Nein, es ist der Inhalt des TITLE-Elements.
        Darunter stehen dann die Ausschnitte (Snippets) aus
        dem Seiteninhalt.

        Hier ist zumindest ein Gegenbeispiel, wo Google die meta-description in der Headline anzeigt:

        http://www.google.de/search?q=Halbleiterphysik+Leipzig&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=
        (erstes Ergebnis)

        Und was einmal vorkommt, wird bestimmt noch woanders auftreten...

        Gruesse, Alex.

        1. Hi,

          Hier ist zumindest ein Gegenbeispiel, wo Google die meta-description in der Headline anzeigt:

          http://www.google.de/search?q=Halbleiterphysik+Leipzig&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=

          Nö, auch hier, wie Thomas sagte: Headline=<title>, aber der Ausschnitt darunter ist in der Tat die <description>, ich vermute, weil der <body> dieser Seite weitgehend textfrei ist (fast nur Links)

          Gruß
          Roland

          1. Moin!

            http://www.google.de/search?q=Halbleiterphysik+Leipzig&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=

            Nö, auch hier, wie Thomas sagte: Headline=<title>, aber der Ausschnitt darunter ist in der Tat die <description>, ich vermute, weil der <body> dieser Seite weitgehend textfrei ist (fast nur Links)

            Aber Google zeigt Meta-Description in den Suchergebnissen durchaus an.

            Siehe Platz 1: http://www.google.de/search?hl=de&ie=UTF-8&oe=UTF-8&q=plugin+phase+5&btnG=Google+Suche.

            Und dass das exakt die Meta-Description ist, und dass Google das schon lange mit anzeigt, weiß ich, weil ich meine Seite bei Google schon etwas länger beobachte. :)

            - Sven Rautenberg

            --
            "Habe den Mut, dich deines eigenen Verstandes zu bedienen!" (Immanuel Kant)
            1. Hallo Sven,

              Aber Google zeigt Meta-Description in den Suchergebnissen durchaus an.

              Nun, zwar nicht im Suchergebnis-*Titel*, ist aber auch egal. Deine Seite _hat_ Inhalte im body und trotzdem wird die Description gelistet.

              Verstehe einer die Googles...:-)

              Gruß
              Roland

              1. Moin!

                Aber Google zeigt Meta-Description in den Suchergebnissen durchaus an.
                Nun, zwar nicht im Suchergebnis-*Titel*, ist aber auch egal. Deine Seite _hat_ Inhalte im body und trotzdem wird die Description gelistet.

                Aber das kann natürlich auch mit dem DMOZ-Eintrag zusammenhängen, der direkt drunter angezeigt wird.

                Verstehe einer die Googles...:-)

                Das geht sowieso nicht.

                - Sven Rautenberg

                --
                "Habe den Mut, dich deines eigenen Verstandes zu bedienen!" (Immanuel Kant)
        2. Hallo,

          Hier ist zumindest ein Gegenbeispiel, wo Google die meta-description in der Headline anzeigt:

          Wir meinen offenbar verschiedenes mit "Headline". ;-)

          http://www.google.de/search?q=Halbleiterphysik+Leipzig&ie=UTF-8&oe=UTF-8&hl=de&btnG=Google+Suche&meta=

          Resultat #1:

          Halbleiterphysik
            (fett, blau bzw. violett, verlinkt)
             ist der Inhalt des TITLE-Elements

          Homepage der Abteilung Halbleiterphysik an der
          Universität Leipzig, Homepage of the Semiconductor
          Physics Group at Universität Leipzig. ...
            (schwarz, nicht verlinkt, anstelle der Snippets)
            ist der Inhalt des META-Description-Tags

          http://www.uni-leipzig.de/~hlp/
            (gruen, nicht verlinkt)

          Erstaunlich, hier zeigt Google tatsaechlich
          die Meta-Description an.
          => Keine "Regel" ohne Ausnahme! ;-)

          Eine moegliche Erklaerung: Der Suchbegriff "Halbleiterphysik"
          kommt nur im TITLE-Element sowie eben im (zweisprachigen)
          META-Description-Tag vor, aber nirgends im eigentlichen
          Inhalt (BODY) der Seite.

          Gruesse,

          Thomas

      3. Tach auch,

        [...] wie oft Googlebot neu indiziert. Bei mir passiert das für fast alle Seiten mindestens einmal in der Woche (was nicht heißt, daß sich das Ranking jedesmal ändert)

        AFAIK aendert Google den Index (und wohl auch das Ranking)
        ca. monatlich beim sogenannten Google Dance.
        http://dance.efactory.de/d-index.php

        Jain ;-)

        Der Gesamtindex und das Ranking werden monatlich (oder noch seltener) aktualisiert.

        Es gibt aber auch regelmaessige Updates, das sind die Links wo das Datum dabeisteht. Bei mir kommt der Googlebot fast taeglich vorbei, was aber wohl bei Weblogs nichts besonderes sein soll. Vielfach sind neue Postings die ich mache nach 1-2 Tagen bei Google zu finden.

        Diese Links/Seiten werden dann meistens beim Googledance in den "vollen" Index uebernommen falls es sie noch gibt.

        Gruss,
        Armin

        --
        Location: Swindon/Wiltshire/England/UK/Europe/Northern Hemisphere/Planet Earth/Solar System/Milky Way Galaxy/Universe
        http://www.ministryofpropaganda.co.uk/
    2. Hallo Roland,

      ich bin etwas spät. Das "Keywordspamming" wurde bei mir von Google noch nie sanktioniert. Ist das nun anders? Was bleibt einem, wenn der Autraggeber nur nichtssagende Texte und Bilderchen will. Außerdem sind die Keywords kein Spam in eigentlichen Sinne. Die Themen der verdeckten Keywords passen 100% zur Content.
      Aber zum Thema:
      Der Seitentitel ist meist die headline. Habe die anderen Postings gelesen.
      Das Problem der nicht mehr indizierten Unterseiten ist ein Problem der nicht geänderten Seiteninhalte?
      Ich habe bei früheren kleineren Projekten, die nicht über eine entsprechende Externverlinkung verfügten, auch nie beobachtet, dass die Unterseiten indiziert wurden. Diese Website (emotionalarchitecture) war die erste, die bis vor kurzem sämtliche Unterseiten im Google-Cache hatte. Dadurch waren die Themenseiten mit Ihren Dateinamen und der entsprechenden Optimierung auf die Keywords bei Google toppgerankt. Welche Bedingungen scheinen eine Website für die Indizierung aller Unterseiten zu prädestinieren. Kann man darüber überhaupt seriös eine Antwort geben ohne die Googlebot-Algorithmen zu kennen.

      Dank Dir

      Tylor

      1. Hallo,

        Das "Keywordspamming" wurde bei mir von Google noch nie sanktioniert.

        Jetzt offenbar schon.
        Es erstaunt mich mehr, dass die Startseite noch drin ist.

        Bei den "Spam Report" Formularen
        http://www.google.com/contact/spamreport.html
        http://www.google.de/webmasters/spamreport.html
        gibt es z.B. die zwei Punkte:
        [ ] Verborgener Text oder Links
        [ ] Irreführende oder sich wiederholende Wörter

        Noch Fragen?

        Was bleibt einem, wenn der Autraggeber nur nichtssagende Texte und Bilderchen will.

        • Ueberzegungsarbeit leisten.
        • Darauf hinweisen, dass sowas bei den Benutzern
            und bei den Suchmaschinen schlecht ankommt.

        Auch wenn halt mal ein Auftrag verlorengeht.
        (Ist mir auch schon passiert.)

        Außerdem sind die Keywords kein Spam in eigentlichen Sinne.

        Doch. Es handelt sich nicht um sinnvolle Inhalte in normaler Sprache,
        sondern um eine unnatuerliche Anhaeufung von Keywords.

        Und Du versteckst den Text.

        Beides ist eindeutig Spamming.
        http://www.kso.co.uk/glossar/Spam.html
        http://www.kso.co.uk/de/tutorial/7-13.html

        Das Problem der nicht mehr indizierten Unterseiten ist ein Problem der nicht geänderten Seiteninhalte?

        Ich glaube, das Hauptproblem ist, dass Ihr Spamming betreibt.
        Wenn Euch Google (nach einer Ueberarbeitung) nochmal eine
        Chance gibt, seid Ihr mit einem blauen Auge davongekommen.
        Wenn nicht: Selbst schuld.

        Ich habe [...] nie beobachtet, dass die Unterseiten indiziert wurden.

        Dann machst Du etwas falsch.
        Bei normalen Seiten (keine Frames, normale Text-Inhalte,
        normale Text-Links) ist es der Normalfall, dass Spider
        allen Links folgen und dass alle Seiten indiziert und
        (bei Treffern) auf den Resultateseiten aufgelistet werden.

        Welche Bedingungen scheinen eine Website für die Indizierung aller Unterseiten zu prädestinieren. Kann man darüber überhaupt seriös eine Antwort geben ohne die Googlebot-Algorithmen zu kennen.

        Es gibt in Deutsch ein Satzzeichen, um Fragen abzuschliessen:
        Das sogenannte Fragezeichen ("?").
        Bitte wende es an! Danke.

        Vergiss endlich die Idee, aufgrund von irgendwelchen
        "Bedingungen" oder Algorithmen, die
        1. nur "heute" gelten (bzw. "gestern" galten)
        2. nur fuer bestimmte Suchmaschinen gelten
        irgendwelche Trick-Seiten zu basteln.

        Wie ich schon sagte:
        Mach anstaendige Seiten in validem HTML mit sichtbarem,
        sinnvollem Text in natuerlicher Sprache.
        Das freut Besucher und Suchmaschinen gleichermassen.

        Alles andere ist Zeitverschwendung und z.T. sogar Betrug.

        Gruesse,

        Thomas

      2. Hi Tylor

        ich bin etwas spät.

        ach wo, so schnell veralten die meisten Threads hier nicht

        Gleich vorab: ich habe keine Lösung, nur Vermutungen bzw. Beobachtungen.

        Das "Keywordspamming" wurde bei mir von Google noch nie sanktioniert.

        Glück gehabt.

        Was bleibt einem, wenn der Autraggeber nur nichtssagende Texte und Bilderchen will.

        Überzeugungsarbeit, daß Inhalt sich besser verkauft als pure Oberfläche. Von Internetwerbung erwartet man halt etwas anderes, als von einer Litfaßsäule oder einem Spot bei RTL.

        Hmmm.. gehört das Suchmaschinen-Promoting denn zu Deinem Auftragsumfang?

        Das Problem der nicht mehr indizierten Unterseiten ist ein Problem der nicht geänderten Seiteninhalte?

        Beeinflußt m.E. vor allem das generelle Ranking, weniger die Anzahl Seiten einer Präsentation, die in Google einzeln gelistet werden.

        Deshalb würde ich mich auf die gelistete Indexseite (oder eine andere zentrale Seite der Präsentation) konzentrieren. Es würde doch vollkommen reichen, wenn diese top gerankt ist, oder nicht?

        (emotionalarchitecture) war die erste, die bis vor kurzem sämtliche Unterseiten im Google-Cache hatte. Dadurch waren die Themenseiten mit Ihren Dateinamen und der entsprechenden Optimierung auf die Keywords bei Google toppgerankt.

        Wenn ich so zurückdenke an meine Anfänge, muß ich Dir recht geben: Anfangs alle Seiten einzeln, jetzt "nur" noch 2-3 Treffer, aber mit diesem Link "Weitere Seiten von...". Da das Ranking der gefunden Seiten super ist, bin ich damit zufrieden.
        Vielleicht "merkt" Google erst im Laufe der Zeit, daß bzw. welche Seiten zusmmengehören?

        Welche Bedingungen scheinen eine Website für die Indizierung aller Unterseiten zu prädestinieren. Kann man darüber überhaupt seriös eine Antwort geben ohne die Googlebot-Algorithmen zu kennen.

        Indiziert werden die Unterseiten schon (bei mir jedenfalls), nur nicht separat gelistet.
        Das Grundprinzip des Google-Rankings ist ja bekannt, aber ich gehe davon aus, daß Feinheiten ständig geändert werden (u.A. um solche inhaltsleeren Keyword-Lawinen _nicht_ top zu ranken!).

        Ich kann Dir nur nochmal raten, das mit den Unterseiten nicht so eng zu sehen, sondern zu versuchen, daß Ranking allgemein zu verbessern.
        Die wichtigsten Mittel:

        • Echte Inhalte in Textform
        • Andere Seiten, die auf Dich linken, und bezüglich der relevanten Keywords selbst ein gutes Ranking haben.

        Ich verstehe Deine Situation (Wünsche des Auftraggebers), aber um ehrlich zu sein: In meinen Augen verdient die Seite in dieser Form auch kein gutes Ranking. Aber das ist natürlich rein subjektiv und nicht an Dich als Person gerichtet!

        Gruß
        Roland

  3. Moin Tylor,
    ich glaube Du hast Deinem Ranking bei Google mit dem Thread hier keinen Gefallen getan.
    Unter Umständen bist Du morgen aus dem index komplett raus.[1]
    Vielleicht hättest Du an der Stelle den Rat befolgen sollen der über dem Forum sthet.
    Nämlich selbst nach einer Lösung im Archiv zu suchen.
    Dann wären Dir diverse Artikel aufgefallen die sich genau mit diesem Thema beschäftigen.

    Naja vielleicht bist Du ja schneller als die Google Leute und entfernst das Spamming noch schnell.
    Sei Dir aber gewiss, dass deine Seite ab sofort regelmässig auf Spamming untersucht wird.

    [1] Mir sind mindestens 2 Stammposter bekannt die Google Spamming verfolgen und in jedem Fall Meldung an Google senden. Alle beide haben sich hier noch nicht geäussert.

    TomIRL