(ZU DIESEM FORUM) Suchfunktion des Archivs
Reiner Rusch
Ich habe etwas entdeckt:
Auch wenn man kein "+" vor den Suchbegriff stellt, muß das Stichwort vorkommen.
Kann das jemand bestätigen? Oder ist das so gewollt?
Alles Gute,
Reiner
...nö...:-)
...nö...:-)
Bezieht sich das auf "ist NICHT so" oder auf "kann ich nicht bestätigen"???
Ich habe jedenfalls mal folgendes eingegeben:
"das hat ist" -> 6606 Treffer
"das hat ist Stephan Münz" -> 5 Treffer
Eigentlich müßten es ja eher mehr als weniger werden, oder?
Reiner
Hallo Reiner & Jan,
"das hat ist" -> 6606 Treffer
"das hat ist Stephan Münz" -> 5 Treffer
Eigentlich sollten imho die Begriffe hier mit oder verknüpft werden, wenn ich die Worte alle im Ergebnis will, muss ich "+das +hat +ist" (ohne "") eingeben.
Insofern ist das zweite Ergebnis wirklich falsch, da es offensichtlich die + mitverwendet, soll es aber nicht ?!
max
Hallo Reiner & Jan,
"das hat ist" -> 6606 Treffer
"das hat ist Stephan Münz" -> 5 TrefferEigentlich sollten imho die Begriffe hier mit oder verknüpft werden, wenn ich die Worte alle im Ergebnis will, muss ich "+das +hat +ist" (ohne "") eingeben.
Insofern ist das zweite Ergebnis wirklich falsch, da es offensichtlich die + mitverwendet, soll es aber nicht ?!max
Sag' ich doch!
Hallo Reiner,
Sag' ich doch!
nur zur Rechtfertigung <g> der Archivsucheerbauer, es steht auch unter dem Formular:
-Mehrere Begriffe durch Leerzeichen getrennt werden mit 'und' verknüpft ausgewertet
aber es steht eben auch:
-+ vor einem Begriff: der Begriff muß vorkommen
Damit kann man ja praktisch das + weglassen, da ohne + das gleiche Resultat erzielt wird?!
max
Damit kann man ja praktisch das + weglassen, da ohne + das gleiche Resultat erzielt wird?!
Ja und nein ... siehe http://www.teamone.de/selfaktuell/self_forum/33199.html.
Hallo nochmal,
da ich es jetzt auch geschafft habe, unterhalb des Formulares diese Zeile zu lesen:
Mehrere Begriffe durch Leerzeichen getrennt werden mit 'und' verknüpft ausgewertet
weiß ich ja, dass dieses Phänomen durchaus bekannt ist, nur wie zum Teufel kann ich herausfinden, wie oft "stefan muenz" oder "stefan münz" (keine Gross- und Kleinschreibung) innerhalb des gesamten Archivs geschrieben wurde?
Normalerweise würde ich die folgende Zeile als Suchstring eingeben (z.bsp. bei Fireball):
"stefan muenz" "stefan münz"
*überleg*, wie bekomme ich es hier heraus?
knobelmax
Sorry, ich konnte auch nicht lesen!
Man muß "Ausdrücke als eigenständige Worte behandeln" markieren!
Reiner
Hallo Reiner,
Man muß "Ausdrücke als eigenständige Worte behandeln" markieren!
nö, geht nicht, wie soll ich so herausbekommen, wie oft innerhalb der beiträge entweder "Stefan Münz" oder/und "Stefan Muenz" geschrieben steht (nur als Beispiel)?
Wie schon gesagt, bei Fireball gebe ich dazu folgende Zeile ein:
"stefan muenz" "stefan münz"
Die Sache mit "eigenständige Worte" erreicht lediglich, dass Münzen nicht als Treffer bei dem Suchbegriff Münz gefunden wird, die Sache mit der oder(inkl. und) Verknüpfung ist etwas anderes, nur was???
max
... wie soll ich so herausbekommen, wie oft innerhalb der beiträge entweder "Stefan Münz" oder/und "Stefan Muenz" geschrieben steht (nur als Beispiel)?
Wie schon gesagt, bei Fireball gebe ich dazu folgende Zeile ein:
"stefan muenz" "stefan münz"
Hallo,
Die Eingabe von '+stefan muenz münz' sollte das gewünschte Ergebnis liefern.
Ich finde es auch besser, wenn sich die Suchmaschine so wie die bekannten großen (zB. AltaVista) verhält, d.h. eine default ODER-Verknüpfung der Suchterme macht. Bei der Suchmaschine von http://www.HomepageSearchEngine.com gibt es eine checkbox, die man anhaken kann, um alle nicht mit "+" oder "-" markierten terme automatisch mit einem "+" zu versehen.
Ciao,
Robert
Ich finde es auch besser, wenn sich die Suchmaschine so wie die bekannten großen (zB. AltaVista) verhält, d.h. eine default ODER-Verknüpfung der Suchterme macht.
Das Ziel meiner Erweiterung der Suchfunktion war es, daß man die Suche feiner eingrenzen kann.
Da wir ein themenorientiertes Forum sind, tauchen die meisten relevanten Begriffe so oft auf, daß es immer gleich hunderte von Treffern gibt; der Nutzeffekt einer ODER-Verknüpfung über *alle* Terme ist hier also vergleichsweise klein.
Was man dann brauchen würde, wäre irgend eine Möglichkeit, geklammerte Ausdrücke zu verwenden - und das übersteigt die Fähigkeiten des derzeitigen Parsers und Matchers. (Und wahrscheinlich auch die der meisten Benutzer. ;-)
Bei der Suchmaschine von http://www.HomepageSearchEngine.com gibt es eine checkbox, die man anhaken kann, um alle nicht mit "+" oder "-" markierten terme automatisch mit einem "+" zu versehen.
Das wäre schon eher eine Idee, für die ich mich erwärmen könnte, also etwa "Promotion vorzeichenloser Terme" als weitere Formular-Option. Kein Problem, das zu realisieren (als Defaultwert würde ich allerdings ON nehmen - wer das abschaltet, muß wissen, was er tut). Die Änderung würde mich 10 Minuten kosten, schätze ich.
Daß ich dennoch zögere, es einfach mal einzubauen, liegt u. a., daß es wieder eine Option mehr im Formular wäre, welches dadurch immer abschreckender wird. Leute, überzeugt mich (und Stefan!), daß wir das wirklich brauchen - ich bräuchte es selbst nämlich nicht ...
Das eigentliche Problem ist allerdings, daß bisher niemand versucht hat, eine Semantik für eine beliebige Mischung von vorzeichenbehafteten und vorzeichenlosen Termen zu definieren. Falls Du mir eine solche lieferst (was soll mit wem geODERt werden?), dann können wir darüber reden (es einzubauen wäre ggf. nicht wirklich schlimm).
nur wie zum Teufel kann ich herausfinden, wie oft "stefan muenz" oder "stefan münz" (keine Gross- und Kleinschreibung) innerhalb des gesamten Archivs geschrieben wurde?
Wenn Du nach einer Zeichenkette suchen willst, die ein Leerzeichen enthält, dann gib diese Zeichenkette in Gänsefüßchen eingeschlossen in das Suchformular ein.
(case-insensitiv, ohne Wortgrenzen gesucht)
stefan muenz = 2873 Treffer, aber
"stefan muenz" = 2856 Treffer.
Es gibt also offenbar 17 Postings, in denen "stefan" und "muenz", nicht aber "stefan muenz" vorkommt. Diese findest Du dann auch wirklich mit
+stefan +muenz -"stefan muenz", wie ich gerade verifiziert habe.
Falls es Dir in Deinem Beispiel auf den Umlaut ankam, dann kannst Du mit regular expressions nach "m[üue]nz" suchen.
Oder auf die Option "Intelligente Umlaute" warten, die in der nächsten Version des Suchskripts drin ist (dann matcht "ue" automatisch auf ü oder ue). Das Skript ist bereits "ausgeliefert" ...
hi!
Auch wenn man kein "+" vor den Suchbegriff stellt, muß das Stichwort vorkommen.
Kann das jemand bestätigen? Oder ist das so gewollt?
Das passiert nur, wenn es überhaupt keinen Begriff gibt, vor dem ein + steht. Das ist so beabsichtigt, wird aber evtl. (!) irgendwann geändert.
bye, Frank!