Rolf Wouters: Suchmaschinen und Character Entities

Hallo

Ich möchte gerne wissen, wie Character entities (z.B. ä oder &#1046) von Suchmaschinen betrachtet werden.

Wenn ich z.B. Seiten hab, die nur Entities enthalten, wirden die dann trotzdem richtig indiziert, oder werden die dann nicht mit Hilfe von einen Suchmaschine gefunden?

Ich hab schon den ganzen Tag im Web rumgesucht, hab aber leider keine Angaben dazu gefunden.

Selbst denke ich, das ein Suchmaschine so schlau ist bzw. sein muss/soll, das er dies berücksichtet und meine Seite also ganz normal indiziert und findet lässt, ob ich jetzt ä oder ä in meinen Quell-Code verwende.

Mit freundlichen Grüßen, und vielen herzlichen dank

Rolf Wouters

  1. Hello out there!

    Character entities (z.B. ä oder &#1046)

    Das zweite wäre auch mit abschließendem Semikolon keine Entity(-Referenz), sondern ist eine numerische Zeichen-Referenz (NCR).

    Eine Entity ist 'auml'; eine Zeichen-Entity-Referenz 'ä'.

    Eine Suchmaschine sollte – wie jeder andere Client auch – numerische und
    Entity-Referenzen auflösen: 'ä', 'ä', 'ä' und 'ä' sollten völlig äquivalent sein.

    See ya up the road,
    Gunnar

    --
    “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
    1. Moin!

      Eine Suchmaschine sollte – wie jeder andere Client auch – numerische und Entity-Referenzen auflösen: 'ä', 'ä', 'ä' und 'ä' sollten völlig äquivalent sein.

      Und ebenso dürften die meisten wichtigen Suchmaschinen in der Lage sein, statt "ä" auch Suchergebnisse mit "ae" auszugeben, bzw. umgekehrt die Suche nach "ae" auch nach "ä" durchzuführen.

      Es ist jedenfalls nicht so, dass Suchmaschinen nur dumme Stringvergleiche zwischen Suchworteingabe und Seiteninhalt vornehmen - die "verstehen" beim Indizieren der Seite schon (im Rahmen der angegebenen Zeichensätze), welche Buchstaben da verwendet wurden.

      - Sven Rautenberg

      --
      My sssignature, my preciousssss!
      1. hallo,

        ich hab eben mal den test gemacht.
        also google erkennt auch die codierten texte, zumindest kann ich sie über die suche finden.

        grüße Chris