Seiten richtig[tm] aus dem Google-Index ausschließen von Christian Kruse, 25.07.2019 15:51

Seiten richtig[tm] aus dem Google-Index ausschließen

Christian Kruse Homepage des Autors 25.07.2019 14:51

+1 Informationen zu den Bewertungsregeln

Moin,

es gibt neue Erkenntnisse, wie man Seiten korrekt und ganz klar aus dem Google-Index ausschließen kann. Die bisher verwandte Methode, den Zugriff via robots.txt zu verbitten funktioniert nur sehr unzuverlässig: wenn der Google-Bot die URL z.B. via externer Verlinkung zu sehen bekommt, greift er die Seite trotzdem ab.

Die von Google beschriebene Methode sicherzustellen, dass etwas nicht im Google-Index landet, ist der noindex-Metatag. Und wenn man etwas aus dem Google-Index entfernen möchte, dann muss man den Zugriff in der robots.txt erlauben und via noindex-Metatag die Indizierung verbieten.

Quelle ist dieser Hackernews-Thread.

LG,
CK

--
https://wwwtech.de/about

Beitrag melden

+1 Informationen zu den Bewertungsregeln

Seiten richtig[tm] aus dem Google-Index ausschließen
Lisa 25.07.2019 15:37

google

zur info
– Informationen zu den Bewertungsregeln
Hallo,

mal abgesehen davon, dass ich seit Anbeginn immer noch der Meinung bin es müsste umgekehrt sein, also keine automatische Erlaubnis mit manueller Ablehnung, sondern stattdessen einen Metatag als explizite Einwilligung <indexcontent user="all"> oder so ähnlich, frage ich mich wie dein Artikel das bei anderen Anbietern sieht. Bing hat z.B. jahrelang (weiß nicht ob immer noch so) NoIndex in den Robotstxt ignoriert. Beachtet Bing denn den Metatag? Interessant dazu vielleicht auch dies hier.

lg.
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. Seiten richtig[tm] aus dem Google-Index ausschließen
  
  Christian Kruse Homepage des Autors 25.07.2019 15:39
  
  google
  
  zur info
  – Informationen zu den Bewertungsregeln
  Hallo Lisa,
  
  […] frage ich mich wie dein Artikel das bei anderen Anbietern sieht.
  
  Gar nicht. Deshalb schrieb ich ja explizit vom Google-Index. Die Erklärung stammt von Google bzw Google-Mitarbeitern, die können (oder wollen) zu Bing nichts sagen.
  
  LG,
  CK
  
  --
  https://wwwtech.de/about
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
Seiten richtig[tm] aus dem Google-Index ausschließen
Der Martin 25.07.2019 15:50

google

zur info
+1 Informationen zu den Bewertungsregeln
Hallo,

Die von Google beschriebene Methode sicherzustellen, dass etwas nicht im Google-Index landet, ist der noindex-Metatag. Und wenn man etwas aus dem Google-Index entfernen möchte, dann muss man den Zugriff in der robots.txt erlauben und via noindex-Metatag die Indizierung verbieten.

das ist aber eine auf HTML-Dokumente beschränkte Sicht. Was ist mit anderen Ressourcen? PDF, Audio, Video, Software-Downloads? Wie sollen Webmaster in diese Dateien ein noindex-Meta-Tag einbauen?

Ciao,
Martin

--
Computer müssen weiblich sein: Eigensinnig, schwer zu durchschauen, immer für Überraschungen gut - aber man möchte sie nicht missen.
Beitrag melden

+1
Informationen zu den Bewertungsregeln
1. Seiten richtig[tm] aus dem Google-Index ausschließen
  
  Christian Kruse Homepage des Autors 25.07.2019 15:51
  
  google
  
  zur info
  – Informationen zu den Bewertungsregeln
  Hallo Martin,
  
  Was ist mit anderen Ressourcen? PDF, Audio, Video, Software-Downloads?
  
  🤷‍♂️
  
  Wie sollen Webmaster in diese Dateien ein noindex-Meta-Tag einbauen?
  
  Vermutlich gar nicht. Darüber hat Google sich meines Wissens nach nicht geäussert.
  
  LG,
  CK
  
  --
  https://wwwtech.de/about
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
2. Seiten richtig[tm] aus dem Google-Index ausschließen
  
  Lisa 25.07.2019 15:56
  
  google
  
  zur info
  – Informationen zu den Bewertungsregeln
  Hallo,
  
  das ist aber eine auf HTML-Dokumente beschränkte Sicht. Was ist mit anderen Ressourcen? PDF, Audio, Video, Software-Downloads? Wie sollen Webmaster in diese Dateien ein noindex-Meta-Tag einbauen?
  
  Sehr interessanter Gedanke, da muss ich glatt auch mal meine Wunschvorstellung überdenken. 😀 Also tatsächlich auch bei mir keine Metatag, sondern doch eine txtdatei. Nur in meinem Fall natürlich eine die die Indexierung und erst recht Cachingveröffenlichung erlaubt, nur wenn explizit vorhanden.
  
  Danke für den berechtigten Hinweis.
  
  lg.
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
3. Seiten richtig[tm] aus dem Google-Index ausschließen
  
  1unitedpower 25.07.2019 16:25
  
  google
  
  zur info
  +2 Informationen zu den Bewertungsregeln
  das ist aber eine auf HTML-Dokumente beschränkte Sicht. Was ist mit anderen Ressourcen? PDF, Audio, Video, Software-Downloads? Wie sollen Webmaster in diese Dateien ein noindex-Meta-Tag einbauen?
  
  Mit dem X-Robots-Tag-HTTP-Header.
  Beitrag melden
  
  +2
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. Seiten richtig[tm] aus dem Google-Index ausschließen
    
    Der Martin 25.07.2019 18:12
    
    google
    
    zur info
    
    – Informationen zu den Bewertungsregeln
    Hallo,
    
    das ist aber eine auf HTML-Dokumente beschränkte Sicht. Was ist mit anderen Ressourcen? PDF, Audio, Video, Software-Downloads? Wie sollen Webmaster in diese Dateien ein noindex-Meta-Tag einbauen?
    
    Mit dem X-Robots-Tag-HTTP-Header.
    
    an sowas dachte ich auch schon, es ist technisch naheliegend.
    Schließt nur leider die Hobby-Webmaster aus, die froh sind, dass sie mit ihren Kenntnissen gerade so aus einem CMS oder einem "Homepage-Baukasten" etwas zaubern können. Die waren mit der robots.txt natürlich besser bedient.
    
    So long,
    Martin
    
    --
    Computer müssen weiblich sein: Eigensinnig, schwer zu durchschauen, immer für Überraschungen gut - aber man möchte sie nicht missen.
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
    1. Seiten richtig[tm] aus dem Google-Index ausschließen
      
      Auge 26.07.2019 08:42
      
      google
      
      zur info
      
      – Informationen zu den Bewertungsregeln
      
      Hallo
      
      das ist aber eine auf HTML-Dokumente beschränkte Sicht. Was ist mit anderen Ressourcen? PDF, Audio, Video, Software-Downloads? Wie sollen Webmaster in diese Dateien ein noindex-Meta-Tag einbauen?
      
      Mit dem X-Robots-Tag-HTTP-Header.
      
      an sowas dachte ich auch schon, es ist technisch naheliegend.
      Schließt nur leider die Hobby-Webmaster aus, die froh sind, dass sie mit ihren Kenntnissen gerade so aus einem CMS oder einem "Homepage-Baukasten" etwas zaubern können. Die waren mit der robots.txt natürlich besser bedient.
      
      Diese Gruppe will üblicherweise aber, dass all ihre Inhalte gefunden, indexiert und natürlich auf Seite 1 der Suchergebnisse angezeigt werden. Die brauche diese Technik also üblicherweise nicht.
      
      Tschö, Auge
      
      --
      Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
      Hohle Köpfe von Terry Pratchett
      
      Beitrag melden
      
      –
      Informationen zu den Bewertungsregeln
      
      Übersicht
      
      alle Foren
      
      SELFHTML-Forum
      
      anmelden
      
      Benutzerkonto erstellen
      
      Beitrag im Thread-Baum
      1. Seiten richtig[tm] aus dem Google-Index ausschließen
        
        Christian Kruse Homepage des Autors 26.07.2019 08:45
        
        google
        
        zur info
        
        – Informationen zu den Bewertungsregeln
        
        Hallo Auge,
        
        Diese Gruppe will üblicherweise aber, dass all ihre Inhalte gefunden, indexiert und natürlich auf Seite 1 der Suchergebnisse angezeigt werden. Die brauche diese Technik also üblicherweise nicht.
        
        Weiss nicht. Dass einzelne Seiten nicht im Such-Index auftauchen sollen, halte ich für ein durchaus wahrscheinliches Anfänger-Problem. In Ermangelung eines Zugriffsschutzes wird dann halt die URL nicht verlinkt, sondern nur weiter gegeben oder so und die Suchmaschine findet sie über $mechanismus und schon hat man den Salat.
        
        LG,
        CK
        
        --
        https://wwwtech.de/about
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
        
        Seiten richtig[tm] aus dem Google-Index ausschließen
        
        Auge 26.07.2019 09:27 (Versionen)
        
        google
        
        zur info
        
        – Informationen zu den Bewertungsregeln
        
        Hallo
        
        Diese Gruppe will üblicherweise aber, dass all ihre Inhalte gefunden, indexiert und natürlich auf Seite 1 der Suchergebnisse angezeigt werden. Die brauche diese Technik also üblicherweise nicht.
        
        Weiss nicht. Dass einzelne Seiten nicht im Such-Index auftauchen sollen, halte ich für ein durchaus wahrscheinliches Anfänger-Problem. In Ermangelung eines Zugriffsschutzes wird dann halt die URL nicht verlinkt, sondern nur weiter gegeben oder so und die Suchmaschine findet sie über $mechanismus und schon hat man den Salat.
        
        Ich glaube, wir definieren „Anfänger“ verschieden. Das was du beschreibst, kommt für mich nach dem Anfängersein. Dann, wenn die Seite steht, man sich zusätzliche Funktionen herbeiwünscht und so überhaupt keine Ahnung davon hat, wie man das umsetzen soll. Dann ist man quasi ein „fortgeschrittener Anfänger“. Die Wünsche gehen über das Anfängersein hinaus, aber die Kenntnisse verweilen im Anfängerstatus. 😀
        
        Aber natürlich ist das keine feststehende Definition und ich hatte ja in meiner Einschätzung der Notwendigkeit einer solchen Funktion für Personen des Status' „Anfänger“ nicht umsonst ein hervorgehobenes „üblicherweise“ benutzt.
        
        Tschö, Auge
        
        --
        Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
        Hohle Köpfe von Terry Pratchett
        
        Beitrag melden
        
        –
        Informationen zu den Bewertungsregeln
        
        Übersicht
        
        alle Foren
        
        SELFHTML-Forum
        
        anmelden
        
        Benutzerkonto erstellen
        
        Beitrag im Thread-Baum
Seiten richtig[tm] aus dem Google-Index ausschließen
Matthias Apsel Homepage des Autors 25.07.2019 17:55

google

zur info
– Informationen zu den Bewertungsregeln
Hallo Christian Kruse,

das könnten/sollten wir ins Wiki aufnehmen. Ebenso 1UPs Beitrag weiter unten.

Ich nehm mir ein <I>, in der Hoffnung, dass ich das nicht vergesse.

Bis demnächst
Matthias

--
Pantoffeltierchen haben keine Hobbys.
¯\_(ツ)_/¯
Beitrag melden

–
Informationen zu den Bewertungsregeln
Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?
TS Homepage des Autors 25.07.2019 22:25

google
– Informationen zu den Bewertungsregeln
Hello,

sind die IPs der Google-Bots eigentlich bekannt und verlässlich, oder sind die geheim und/oder wechseln ständig?

Ist es nicht sogar so, dass Google im Referer verlässlich mitteilt, dass es sich um einen Google-Bot handelt?

Was der Bot nicht zu sehen bekommt, kann er nicht parsen und daher auch nicht indizieren.

Glück Auf
Tom vom Berg

--
Es gibt nichts Gutes, außer man tut es!
Das Leben selbst ist der Sinn.
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?
  
  Christian Kruse Homepage des Autors 25.07.2019 22:28
  
  google
  +1 Informationen zu den Bewertungsregeln
  Hallo TS,
  
  sind die IPs der Google-Bots eigentlich bekannt und verlässlich, oder sind die geheim und/oder wechseln ständig?
  
  Beides.
  
  Ist es nicht sogar so, dass Google im Referer verlässlich mitteilt, dass es sich um einen Google-Bot handelt?
  
  Der Google-Bot nutzt bekannte IPs und schickt einen Header mit, der ihn identifiziert. Und er nutzt unbekannte IPs und schickt keinen Header mit. Hintergrund ist, dass er Betrügereien erkennen will.
  
  LG,
  CK
  
  --
  https://wwwtech.de/about
  Beitrag melden
  
  +1
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
2. Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?
  
  Matthias Apsel Homepage des Autors 26.07.2019 07:27
  
  google
  – Informationen zu den Bewertungsregeln
  Hallo TS,
  
  Was der Bot nicht zu sehen bekommt, kann er nicht parsen und daher auch nicht indizieren.
  
  Inhalte, die du öffentlich zur Verfügung stellst, werden die Suchmaschinen irgendwann zu sehen bekommen.
  
  Bis demnächst
  Matthias
  
  --
  Pantoffeltierchen haben keine Hobbys.
  ¯\_(ツ)_/¯
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Christian Kruse: Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen

Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?

Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?

Seiten richtig[tm] aus dem Google-Index ausschließen, aktive Alternative?