Tim: UTF-8 Konflikt beheben?

Hi,

http://de.search.yahoo.com/search?p=Lex+Barker&y=Suche&fr=sfp&rd=r2

Ich hoffe ihr seht bei dem Link das Gleiche wie ich, weil könnte auch anders sein durch Cookie Parameter. Wenn, dann müsste der erste Eintrag auf Wikipedia verweisen. Und zwar in der Form:

Lex Barker â€" Wikipedia
Lex Barker war ein direkter Nachkomme des Gründers der ....

Yahoo ist UTF-8, Wikipedia ist UTF-8, wie kann dann sowas passieren?

Für mich sieht das aus wie mehrfach codiert und dadurch kapputt, oder gibt es doch eine Möglichkeit solche Einträge nur durch (irgendwieauchimmer)codieren wieder sauber zu bekommen?

Tim

  1. Yahoo ist UTF-8, Wikipedia ist UTF-8, wie kann dann sowas passieren?

    Die Suchmaschine speichert den Text intern ohnehin nochmal und rekodiert alle Texte dann spätestens beim Zusammenbauen der Suchergebnisse - insofern hilft es erstmal nichts, dass die spezifische Suchmaschinen-Ausgabe und die indizierte Websites dieselbe Kodierung verwenden.

    Für mich sieht das aus wie mehrfach codiert und dadurch kapputt, oder gibt es doch eine Möglichkeit solche Einträge nur durch (irgendwieauchimmer)codieren wieder sauber zu bekommen?

    Da ich den Fehler nicht bei der Wikipedia vermute, ist das vermutlich ein Fehler von Yahoos Suchmaschine, irgendwo wird die Kodierung falsch verarbeitet. In dem Fall würde ich Yahoo kontaktieren.
    Gehts dir um die Wikipedia oder um eine andere Site, bei der dasselbe der Fall ist? Ich vermute, die Wikipedia ist für Yahoo in irgendeiner Weise ein Sonderfall und wird nicht wie andere Websites indiziert.

    Mathias

    1. Hi,

      Die Suchmaschine speichert den Text intern ohnehin nochmal und rekodiert alle Texte dann spätestens beim Zusammenbauen der Suchergebnisse - insofern hilft es erstmal nichts, dass die spezifische Suchmaschinen-Ausgabe und die indizierte Websites dieselbe Kodierung verwenden.

      Ja, soweit schon klar. Nur wenn Yahoo eine UTF-8 Webseite indexiert, sollten soche Probleme nicht auftreteten, wenn Wikipedia jetzt eine andere Codierung hätte, dann könnte ich mir das vorstellen.

      Da ich den Fehler nicht bei der Wikipedia vermute, ist das vermutlich ein Fehler von Yahoos Suchmaschine, irgendwo wird die Kodierung falsch verarbeitet. In dem Fall würde ich Yahoo kontaktieren.

      Die interessieren sich nicht für User-Mails.

      Gehts dir um die Wikipedia oder um eine andere Site, bei der dasselbe der Fall ist? Ich vermute, die Wikipedia ist für Yahoo in irgendeiner Weise ein Sonderfall und wird nicht wie andere Websites indiziert.

      Nein, kein Sonderfall, lediglich einzelne Seiten, denn bei:
      http://de.search.yahoo.com/search?p=Römisches+reich&fr=sfp&rd=r2 gibt es keine Probleme mit Wikipedia.

      Aber die entscheidende Frage bleibt noch bestehen, lässt sich das wieder reparieren?

      Tim

      1. Aber die entscheidende Frage bleibt noch bestehen, lässt sich das wieder reparieren?

        Wie gesagt, ein Fehler in Yahoos Suchmaschine lässt sich nur von Yahoo beheben, ein Fehler seitens Wikipedia sehe ich nicht. Was sollte also wo zu reparieren sein?

        Mathias

        1. Aber die entscheidende Frage bleibt noch bestehen, lässt sich das wieder reparieren?

          Wie gesagt, ein Fehler in Yahoos Suchmaschine lässt sich nur von Yahoo beheben, ein Fehler seitens Wikipedia sehe ich nicht. Was sollte also wo zu reparieren sein?

          Ok, wohl falsch ausgedrückt. Das mit Yahoo ist nur ein Beispiel. Die Frage ist, wenn ein solch kaputter Text, egal woher, vorliegt, kann ich den irgendwie reparieren. Ich seh es mal so im Moment, yahoo könnte das nur durch RE-Indexierung reparieren, nicht aber den beriets vorliegenden Text, richtig?

          Tim

          1. Hallo,

            Wie gesagt, ein Fehler in Yahoos Suchmaschine lässt sich nur von Yahoo beheben, ein Fehler seitens Wikipedia sehe ich nicht. Was sollte also wo zu reparieren sein?

            Ok, wohl falsch ausgedrückt. Das mit Yahoo ist nur ein Beispiel. Die Frage ist, wenn ein solch kaputter Text, egal woher, vorliegt, kann ich den irgendwie reparieren.

            Am besten dadurch, dass man sich sauberen Originaltext sowie das Wissen um dessen Zeichenkodierung besorgt und selbst bei der Verarbeitung keinen Fehler macht.

            Ich seh es mal so im Moment, yahoo könnte das nur durch RE-Indexierung reparieren, nicht aber den beriets vorliegenden Text, richtig?

            Es kann sein, dass die Behebung des Fehlers in der Verarbeitung ausreicht. Es kann also falsch sein, es könnte auch richtig sein. Von außen benötigt man entweder den Sourcecode oder eine Glaskugel, um zu erkennen, wo Fehler gemacht werden.

            Freundliche Grüße

            Vinzenz