Reiner Rusch: (ZU DIESEM FORUM) Suchfunktion des Archivs

Ich habe etwas entdeckt:
Auch wenn man kein "+" vor den Suchbegriff stellt, muß das Stichwort vorkommen.
Kann das jemand bestätigen? Oder ist das so gewollt?

Alles Gute,
Reiner

  1. ...nö...:-)

    1. ...nö...:-)

      Bezieht sich das auf "ist NICHT so" oder auf "kann ich nicht bestätigen"???

      Ich habe jedenfalls mal folgendes eingegeben:

      "das hat ist" -> 6606 Treffer
      "das hat ist Stephan Münz" -> 5 Treffer

      Eigentlich müßten es ja eher mehr als weniger werden, oder?

      Reiner

      1. Hallo Reiner & Jan,

        "das hat ist" -> 6606 Treffer
        "das hat ist Stephan Münz" -> 5 Treffer

        Eigentlich sollten imho die Begriffe hier mit oder verknüpft werden, wenn ich die Worte alle im Ergebnis will, muss ich "+das +hat +ist" (ohne "") eingeben.
        Insofern ist das zweite Ergebnis wirklich falsch, da es offensichtlich die + mitverwendet, soll es aber nicht ?!

        max

        1. Hallo Reiner & Jan,

          "das hat ist" -> 6606 Treffer
          "das hat ist Stephan Münz" -> 5 Treffer

          Eigentlich sollten imho die Begriffe hier mit oder verknüpft werden, wenn ich die Worte alle im Ergebnis will, muss ich "+das +hat +ist" (ohne "") eingeben.
          Insofern ist das zweite Ergebnis wirklich falsch, da es offensichtlich die + mitverwendet, soll es aber nicht ?!

          max

          Sag' ich doch!

          1. Hallo Reiner,

            Sag' ich doch!

            nur zur Rechtfertigung <g> der Archivsucheerbauer, es steht auch unter dem Formular:
            -Mehrere Begriffe durch Leerzeichen getrennt werden mit 'und' verknüpft ausgewertet

            aber es steht eben auch:
            -+ vor einem Begriff: der Begriff muß vorkommen

            Damit kann man ja praktisch das + weglassen, da ohne + das gleiche Resultat erzielt wird?!

            max

            1. Damit kann man ja praktisch das + weglassen, da ohne + das gleiche Resultat erzielt wird?!

              Ja und nein ... siehe http://www.teamone.de/selfaktuell/self_forum/33199.html.

        2. Hallo nochmal,

          da ich es jetzt auch geschafft habe, unterhalb des Formulares diese Zeile zu lesen:
          Mehrere Begriffe durch Leerzeichen getrennt werden mit 'und' verknüpft ausgewertet
          weiß ich ja, dass dieses Phänomen durchaus bekannt ist, nur wie zum Teufel kann ich herausfinden, wie oft "stefan muenz" oder "stefan münz" (keine Gross- und Kleinschreibung) innerhalb des gesamten Archivs geschrieben wurde?

          Normalerweise würde ich die folgende Zeile als Suchstring eingeben (z.bsp. bei Fireball):
          "stefan muenz" "stefan münz"

          *überleg*, wie bekomme ich es hier heraus?

          knobelmax

          1. Sorry, ich konnte auch nicht lesen!

            Man muß "Ausdrücke als eigenständige Worte behandeln" markieren!

            Reiner

            1. Hallo Reiner,

              Man muß "Ausdrücke als eigenständige Worte behandeln" markieren!

              nö, geht nicht, wie soll ich so herausbekommen, wie oft innerhalb der beiträge entweder "Stefan Münz" oder/und "Stefan Muenz" geschrieben steht (nur als Beispiel)?

              Wie schon gesagt, bei Fireball gebe ich dazu folgende Zeile ein:
              "stefan muenz" "stefan münz"

              Die Sache mit "eigenständige Worte" erreicht lediglich, dass Münzen nicht als Treffer bei dem Suchbegriff Münz gefunden wird, die Sache mit der oder(inkl. und) Verknüpfung ist etwas anderes, nur was???

              max

              1. ... wie soll ich so herausbekommen, wie oft innerhalb der beiträge entweder "Stefan Münz" oder/und "Stefan Muenz" geschrieben steht (nur als Beispiel)?

                Wie schon gesagt, bei Fireball gebe ich dazu folgende Zeile ein:
                "stefan muenz" "stefan münz"

                Hallo,

                Die Eingabe von '+stefan muenz münz' sollte das gewünschte Ergebnis liefern.
                Ich finde es auch besser, wenn sich die Suchmaschine so wie die bekannten großen (zB. AltaVista) verhält, d.h. eine default ODER-Verknüpfung der Suchterme macht. Bei der Suchmaschine von http://www.HomepageSearchEngine.com gibt es eine checkbox, die man anhaken kann, um alle nicht mit "+" oder "-" markierten terme automatisch mit einem "+" zu versehen.

                Ciao,
                Robert

                1. Ich finde es auch besser, wenn sich die Suchmaschine so wie die bekannten großen (zB. AltaVista) verhält, d.h. eine default ODER-Verknüpfung der Suchterme macht.

                  Das Ziel meiner Erweiterung der Suchfunktion war es, daß man die Suche feiner eingrenzen kann.
                  Da wir ein themenorientiertes Forum sind, tauchen die meisten relevanten Begriffe so oft auf, daß es immer gleich hunderte von Treffern gibt; der Nutzeffekt einer ODER-Verknüpfung über *alle* Terme ist hier also vergleichsweise klein.
                  Was man dann brauchen würde, wäre irgend eine Möglichkeit, geklammerte Ausdrücke zu verwenden - und das übersteigt die Fähigkeiten des derzeitigen Parsers und Matchers. (Und wahrscheinlich auch die der meisten Benutzer. ;-)

                  Bei der Suchmaschine von http://www.HomepageSearchEngine.com gibt es eine checkbox, die man anhaken kann, um alle nicht mit "+" oder "-" markierten terme automatisch mit einem "+" zu versehen.

                  Das wäre schon eher eine Idee, für die ich mich erwärmen könnte, also etwa "Promotion vorzeichenloser Terme" als weitere Formular-Option. Kein Problem, das zu realisieren (als Defaultwert würde ich allerdings ON nehmen - wer das abschaltet, muß wissen, was er tut). Die Änderung würde mich 10 Minuten kosten, schätze ich.
                  Daß ich dennoch zögere, es einfach mal einzubauen, liegt u. a., daß es wieder eine Option mehr im Formular wäre, welches dadurch immer abschreckender wird. Leute, überzeugt mich (und Stefan!), daß wir das wirklich brauchen - ich bräuchte es selbst nämlich nicht ...

                  Das eigentliche Problem ist allerdings, daß bisher niemand versucht hat, eine Semantik für eine beliebige Mischung von vorzeichenbehafteten und vorzeichenlosen Termen zu definieren. Falls Du mir eine solche lieferst (was soll mit wem geODERt werden?), dann können wir darüber reden (es einzubauen wäre ggf. nicht wirklich schlimm).

          2. nur wie zum Teufel kann ich herausfinden, wie oft "stefan muenz" oder "stefan münz" (keine Gross- und Kleinschreibung) innerhalb des gesamten Archivs geschrieben wurde?

            Wenn Du nach einer Zeichenkette suchen willst, die ein Leerzeichen enthält, dann gib diese Zeichenkette in Gänsefüßchen eingeschlossen in das Suchformular ein.

            (case-insensitiv, ohne Wortgrenzen gesucht)

            stefan muenz  = 2873 Treffer, aber
            "stefan muenz" = 2856 Treffer.

            Es gibt also offenbar 17 Postings, in denen "stefan" und "muenz", nicht aber "stefan muenz" vorkommt. Diese findest Du dann auch wirklich mit
            +stefan +muenz -"stefan muenz", wie ich gerade verifiziert habe.

            Falls es Dir in Deinem Beispiel auf den Umlaut ankam, dann kannst Du mit regular expressions nach "m[üue]nz" suchen.
            Oder auf die Option "Intelligente Umlaute" warten, die in der nächsten Version des Suchskripts drin ist (dann matcht "ue" automatisch auf ü oder ue). Das Skript ist bereits "ausgeliefert" ...

  2. hi!

    Auch wenn man kein "+" vor den Suchbegriff stellt, muß das Stichwort vorkommen.
    Kann das jemand bestätigen? Oder ist das so gewollt?

    Das passiert nur, wenn es überhaupt keinen Begriff gibt, vor dem ein + steht. Das ist so beabsichtigt, wird aber evtl. (!) irgendwann geändert.

    bye, Frank!