Hallo Michael,
sondern? Wie viele Worte liefern, sagen wir mal: mehr als
1% aller Postings zurück? Und wieviel Prozent aller Worte
sind das? Über diese Teilmenge läßt sich prima ein
schnuckeliger kleiner Blacklist-Index bauen.
Soo, jetzt hab ich etwas, womit ich argumentieren kann:
</count_stopwords.txt>
Das ganze nochmal ohne Stopwords:
</count.txt>
Das Script, das den Output erzeugt hat, ist recht einfach:
</indizes.txt>
Damit kann man einfach keinen sinnvollen Index aufbauen.
Eine so absolute Aussage halte ich nicht für flexibel
genug, um dem Problem angemessen zu sein.
Hrhr ;)
Gruesse,
CK