alex_: googles alternativvorschlag zur query

huhu

google-eingabe: datentpen -> googles-vorschlag: "Meinten Sie: datentypen"

hat jemand ne ahnung wie ich das in perl programmiere oder was dahintersteckt?

naiverweise würde ich alle queries in eine datenbank speichern und wenn jemand ne suche macht, die kaum/keine treffer liefert, dort nachschlagen... aber das reicht glaub ich kaum aus

bin ganz ohr, alex

  1. hi

    google-eingabe: datentpen -> googles-vorschlag: "Meinten Sie: datentypen"

    hat jemand ne ahnung wie ich das in perl programmiere oder was dahintersteckt?

    hier mal einer kleiner Anriss von dem was dahinter steckt :)
    http://www.zdnet.de/itmanager/unternehmen/0,39023441,39129811,00.htm

    so long
    Ole
    (8-)>

    --
    Des Mannes Auto ist seine Burg.
    Normalerweise ist ja des Mannes Haus seine Burg, aber nur wenn er den Drachen erschlagen kann, der darin wohnt.
    1. Soundex ist das Zauberwort.
      Man bildet von einem Wort den Soundexschlüssel, das ist ein Code der angibt wie ein Wort "klingt".
      Da kommt dann z.B. "G45A" oder so ähnlich raus.
      Wenn jetzt zwei Soundexschlüssel gleich sind klingen die Wörter gleich.
      Wenn jemand als nach Meier sucht wird auch Meyer, Mayer usw gefunden.
      Auch Rechtschreibfehler können so ausgeglichen werden.

      (Allerdings wird Google noch mit nem Haufen anderer Sachen arbeiten, Soundex ist wohl nur ein Teilbereich)

      1. 你好 zaphod,

        Soundex ist das Zauberwort.

        Soundex ist mit Vorsicht zu geniessen. Die Algorithmen, die dazu benutzt
        werden, die Summe zu berechnen, sind auf die englische Sprache ausgerichtet
        und funktionieren bei Deutsch nicht so sonderlich gut. Nein, da war der
        Link von Ole eindeutig besser als so eine wilde Vermutung.

        再见,
         CK

        --
        Coincidence?! I THINK NOT!!
        http://wwwtech.de/
        1. Hi Christian,

          Soundex ist das Zauberwort.

          Soundex ist mit Vorsicht zu geniessen. Die Algorithmen, die dazu benutzt
          werden, die Summe zu berechnen, sind auf die englische Sprache ausgerichtet
          und funktionieren bei Deutsch nicht so sonderlich gut. Nein, da war der
          Link von Ole eindeutig besser als so eine wilde Vermutung.

          so wild ist die Vermutung nicht!
          Ich habe den Link von Ole zwar nur kurz überflogen, aber wie Google das genau macht, habe ich nicht finden können.
          Soundex ist sogar ein sehr starkes Mittel, wenngleich nur als erster Filter. Wir benutzen bei unserer Suchmaschine Soundex als Vorfilter und Levenshtein als Bewertung.
          Wenn Du nicht glaubst, daß das sogar sehr gut funktionieren kann, überzeuge Dich selbst.

          Gruß
          Reiner

          1. 你好 Reiner,

            Soundex ist das Zauberwort.

            Soundex ist mit Vorsicht zu geniessen. Die Algorithmen, die dazu benutzt
            werden, die Summe zu berechnen, sind auf die englische Sprache
            ausgerichtet und funktionieren bei Deutsch nicht so sonderlich gut.
            Nein, da war der Link von Ole eindeutig besser als so eine wilde
            Vermutung.

            so wild ist die Vermutung nicht!
            Ich habe den Link von Ole zwar nur kurz überflogen, aber wie Google das
            genau macht, habe ich nicht finden können.

            Steht auf der letzten Seite.

            Soundex ist sogar ein sehr starkes Mittel, wenngleich nur als erster
            Filter. Wir benutzen bei unserer Suchmaschine
            Soundex als Vorfilter und Levenshtein als Bewertung.
            Wenn Du nicht glaubst, daß das sogar sehr gut funktionieren kann,
            überzeuge Dich selbst.

            Ich kenne eure Suchmaschine, eure Trefferrate ist nicht halb so gut wie
            die von Google...

            再见,
             CK

            --
            <zentrum> wie war noch mal die option in make.conf fuer das benutzen von pipes um das compile zu beschluenigen?
            <CK1> CFLAGS="-pipe"
            <torsten> Oder man frage einen Gentooer seiner Wahl, wie man 2 km Compilerswitches fuer seine CPU hinbekommt ;)
            http://wwwtech.de/
            1. Hi Christian,

              Ich habe den Link von Ole zwar nur kurz überflogen, aber wie Google das
              genau macht, habe ich nicht finden können.

              Steht auf der letzten Seite.

              meinst Du die "Andeutung" unter:
              "Rechtschreibung: Google schrieb sein eigenes Rechtschreibprüfungstool und beharrt darauf, dass niemand mehr Rechtschreibfehler erkennt.[...]" ?

              Soundex ist sogar ein sehr starkes Mittel, wenngleich nur als erster
              Filter. Wir benutzen bei unserer Suchmaschine
              Soundex als Vorfilter und Levenshtein als Bewertung.
              Wenn Du nicht glaubst, daß das sogar sehr gut funktionieren kann,
              überzeuge Dich selbst.

              Ich kenne eure Suchmaschine, eure Trefferrate ist nicht halb so gut wie
              die von Google...

              Oha, ich glaube kaum, daß Du das beurteilen kannst!
              Du kennst weder die genaue Umsetzung bei Google noch bei uns.
              Außerdem ist es natürlich unfair, daß direkt zu vergleichen.
              Google beurteilt bei einer Suche über _alle_ indizierten Seiten, wir nur über _Deine_ bzw. des Kunden.
              D.h. wir haben in der Vorschlagstabelle nur ein paar hundertausend - Google sicherlich ein paar zig Millionen Worte. Zudem kann die Vorschlagsquote nicht so hoch sein, wenn Du aus dem gesamten Wortvorschlag eine Beziehung zu Deinen 10 bis 1000 Seiten bei uns ziehst. Google kann diese Beziehung, eben weil Sie nicht auf eine Kundensite festgelegt sind, auf diese angeblich 4 Milliarden herstellen. D.h. ich _kann_ _Dir_ gar nicht "Wurst" vorschlagen, wenn Du "Wust" eingibst, wenn "Wurst" auf Deinen Seiten nicht vorkommt!!! Google kann das aber machen, weil es auf der Seite Deiner Metzgerei vorkommt.

              Ansonsten halte ich den Text von zdnet für sehr schwammig -abgesehen von den sprachlichen Schwächen-, d.h. ich sehe da außer, daß Google natürlich über wahnsinnige Rechenleistung verfügt, rein gar nichts näher erklärt. Selbst Der PageRank, den sie hier verlinkt haben, ist hier wesentlich besser erläutert!

              Du hast allerdings an einer Stelle recht, wobei ich nicht weiß, ob Du das meinst:
              Unser Vergleich ist bei mehreren Worten noch nicht so gut, d.h. bei Phrasenvergleichen ist es nicht so stark, wie bei Google.
              Aber das ist eine technische Umsetzung, die machbar ist.
              Google finde ich an der Stelle aber auch noch nicht perfekt.
              MSN hat Ihre Suche da - soweit ich das kurz testen konnte - besser gemacht. Google - auch wenn in dem Text von zdnet allerhand behauptet wird - ist meiner Meinung nach gar nicht so intelligent bzw. der Treffer. Der Wortvorschlag ist super, aber die Phrasenerkennung bzw. textliche Nähe von mehreren Worten wird in MSN viel besser erkannt (auch mal was gutes von Billy Boy :-]).

              Also, wenn Du ernsthaft einen Vergleich anstellen möchtest, Stelle ich Dir gerne unsere Serverversion für ein paar Wochen zur Verfügung.
              Diese kannst Du dann mal mit der Google-Box vergleichen.

              Gruß
              Reiner

              1. 你好 Reiner,

                Ich habe den Link von Ole zwar nur kurz überflogen, aber wie Google
                das genau macht, habe ich nicht finden können.

                Steht auf der letzten Seite.

                meinst Du die "Andeutung" unter:
                "Rechtschreibung: Google schrieb sein eigenes Rechtschreibprüfungstool
                und beharrt darauf, dass niemand mehr Rechtschreibfehler erkennt.[...]" ?

                Ich meine das komplette Kapitel :)

                Soundex ist sogar ein sehr starkes Mittel, wenngleich nur als erster
                Filter. Wir benutzen bei unserer Suchmaschine
                Soundex als Vorfilter und Levenshtein als Bewertung.
                Wenn Du nicht glaubst, daß das sogar sehr gut funktionieren kann,
                überzeuge Dich selbst.

                Ich kenne eure Suchmaschine, eure Trefferrate ist nicht halb so gut wie
                die von Google...

                Oha, ich glaube kaum, daß Du das beurteilen kannst!

                Klar kann ich. Ich gebe zwei falsche Suchbegriffe jeweils einmal bei Google
                ein und einmal bei euch. So kann ich problemlos herausfinden, wessen
                Trefferquote besser ist.

                Du kennst weder die genaue Umsetzung bei Google noch bei uns.

                Muss ich auch nicht, interessiert mich als User auch nicht, ich weiss nur
                dass die Trefferquote bei Google besser ist, der Rest ist euer Bier >;)

                Außerdem ist es natürlich unfair, daß direkt zu vergleichen.

                Ansichtssache, mich als Benutzer interessiert es nicht, warum eure
                Trefferquote schlechter ist.

                Also, wenn Du ernsthaft einen Vergleich anstellen möchtest, Stelle ich
                Dir gerne unsere Serverversion für ein paar Wochen zur Verfügung.

                Einen technischen Vergleich habe ich nie angestrebt. Meine Sicht ist die
                des Users, nicht die des Programmierers bzw. Marketing-Fritzen. Zu
                technischen Tests fehlt mir aktuell die Zeit, ich bin mit dem 3er-Release
                fuer das Classic Forum beschaeftigt. Aber nach dem Release koennen wir da
                gerne mal drueber reden...

                再见,
                 CK

                --
                Das Sein entsteht aus dem Nicht-Sein.
                http://wwwtech.de/
                1. Hi

                  Ihr wollt also wirklich wissen was hinter google steckt?
                  hier: http://www.google.com/technology/pigeonrank.html

                  so long
                  Ole
                  (;-)>

                  --
                  Des Mannes Auto ist seine Burg.
                  Normalerweise ist ja des Mannes Haus seine Burg, aber nur wenn er den Drachen erschlagen kann, der darin wohnt.
                  1. Hallo,

                    Ihr wollt also wirklich wissen was hinter google steckt?
                    hier: http://www.google.com/technology/pigeonrank.html

                    Ja, aber das kann nicht hinter der Worterkennung stecken
                    Beweis:
                    http://www.google.de/search?hl=de&c2coff=1&q=tbnfuttr&meta= und
                    http://www.google.de/search?hl=de&c2coff=1&q=pgnfod&meta=
                    vs.
                    http://www.google.de/search?hl=de&c2coff=1&q=hndeftter&meta=
                    und
                    http://www.google.de/search?hl=de&c2coff=1&q=dgfod&meta=

                    Für den Wortvergleich haben die Hunde.

                    viele Grüße ;-))

                    Axel

                    1. Hi,

                      Für den Wortvergleich haben die Hunde.

                      oder Pottwale

                      http://www.google.de/search?hl=de&c2coff=1&q=pttwal+ftter&btnG=Suche&meta=

                      *fg*

                      so long
                      Ole
                      (8-)>

                      --
                      Des Mannes Auto ist seine Burg.
                      Normalerweise ist ja des Mannes Haus seine Burg, aber nur wenn er den Drachen erschlagen kann, der darin wohnt.
                      1. Hallo,

                        Für den Wortvergleich haben die Hunde.
                        oder Pottwale
                        http://www.google.de/search?hl=de&c2coff=1&q=pttwal+ftter&btnG=Suche&meta=

                        *g*
                        Sehr unwahrscheinlich. Bedenke die Miet- und Wasserkosten für den Pottwal-Cluster.

                        viele Grüße

                        Axel

                        1. hi

                          Sehr unwahrscheinlich. Bedenke die Miet- und Wasserkosten für den Pottwal-Cluster.

                          *g*

                          die gradezu sinnfrei kombination von pottwahl und cluster führt bei google aber immerhin zu 2510 Ergebnissen. :)

                          http://www.google.de/search?hl=de&q=pottwal+cluster&btnG=Google-Suche&meta=

                          die Kombi Pottwahl + futter + cluster immerhin noch 3

                          http://www.google.de/search?hl=de&c2coff=1&q=pottwal+futter+cluster&btnG=Suche&meta=

                          so long
                          Ole
                          (8-)>

                          --
                          Des Mannes Auto ist seine Burg.
                          Normalerweise ist ja des Mannes Haus seine Burg, aber nur wenn er den Drachen erschlagen kann, der darin wohnt.