Halihallo Michael
ich fände einen Mechanismus, der nichts anderes tut, als vorhandene Archiv-Threads mit dem Flag "wertvoll" zu markieren (und darauf aufsetzend den bekannten Archiv-Indexer auf diese Teilmenge anwendet und das Such-Formular um eine Indexdatei "besonders gute Archiv-Beiträge" erweitert) schon eine sehr sinnvolle und dabei preisgünstig umsetzbare Aktion.
Ja, da gebe ich dir recht. Ein kleines "aber": Die Suche ist noch immer eine Stichwort-
suche. Dazu komme ich noch...
Der redaktionelle Aufwand für die Markierung hält sich in Grenzen; bestehende Programme können in vollem Umfang weiter verwendet werden; die Qualität der Treffer bei einer Suche in einem "rauschfreien" Teil-Archiv kommt nahe an die Qualität einer Suche in der damaligen Archiv-Auslese heran.
ACK. Wobei die Programme auch bei Matze's oder meinem Vorschlag in vollem Umfang
weiterverwendet werden können; dies ist kein Ausschlusskriterium.
Das hängt davon ab, wie gut Du Deine Anforderung formulieren kannst - wie bei jeder Suchmaschine mit "advanced search". Bei Google bekommst Du Millionen von Treffern, wenn Du nur zwei Suchbegriffe angibst - je mehr Suchbegriffe per AND verknüpft werden, um so besser wird die Qualität.
Die Qualität ja, der Recall wird kleiner. Du änderst jedoch nichts an der Precision.
Das mag etwas verwirrend und falsch klingen, aber es ist so:
Durch eine bessere Anforderung steigt die Qualität natürlich, die Anzahl gefundener
Elemente wird deutlich kleiner (Recall) aber das ändert nichts an der Tatsache, dass
auch völlig themenfremde und/oder sinnlose Postings vor anderen ausgegeben/gefunden
werden. Wirklich precision-verbessernde Verfahren wäre z.B. die von dir genannte
Kennzeichnung von relevanten Postings, einer Klassifikation oder der Indexierung von
Schlagwörtern. Teilweise könnten auch statistische Verfahren zum Einsatz kommen.
Aber die jetztige Suche ist nicht precision orientiert und wird es nie sein, egal wie
gut die Anfrage ist, denn der Inhalt wird nicht gewertet (Gewichtung).
Aber ich gebe dir recht, dass man natürlich durch gute Suchanfragen die Qualität steigern
kann. Aber wenn es nur darum geht, können wir auch nur einen Feature Artikel über die
intelligente Suchanfrage schreiben. Mir geht es eben nicht um dies, sondern die
precision zu verbessern, mein Vorschlag wäre hier eben eine Klassifizierung mit einer
Indexierung (Schlagwörter) zu kombinieren. Die Kennzeichnung wichtiger Archivbeiträge
halte ich jedoch im Preis/Leistungsverhältnis sogar für besser, nur halte ich es für
sinnvoll den Preis ausser acht zu lassen und die Leistung zu verbessern, um das
Auffinden von sinnvollen Beiträgen (und darum geht es ja) zu erleichtern oder aber auch
sich einfach über ein Thema zu informieren (hier ist die Klassifikation sehr hilfreich).
Das ist etwas, das nicht durch Software lösbar ist, sondern nur durch Erziehung der Anwender - genau diejenige Erziehung, die Cheatah im Forum betreibt, um den Fragestellern beizubringen, ihr eigenes Problem so genau zu verstehen, daß sie es in Suchbegriffe (einer beliebigen Suchmaschine!) codieren können.
In meinen Überlegungen gehe ich eigentlich davon aus, dass jeder gute Anfragen
stellen kann. Tut er dies nicht, ist er selber schuld. Mir geht es darum, die Ergebnisse
einer Anfrage zu verbessern und aufzubereiten, dass die treffsicherheit besser wird.
Und der Zugang zu diesen qualitativ hochwertigen Beiträgen erfolgt dann - wie? Genauso wie auf das oben skizzierte Teil-Archiv: Entweder durch eine Navigation, bei der man als Besucher die entsprechende Kategorisierung lernen muß, oder durch eine Suche.
Ja.
Ganz ehrlich: Ich habe damit aufgehört, die Kategorisierung der Feature-Artikel begreifen zu wollen - wenn ich einen Feature-Artikel suche, von dem ich weiß, daß er existiert, dann gehe ich auf die Feature-Artikel-Hauptseite und verwende dort das Suchformular. Das liefert sehr schnell und ressourcenschonend sehr wenige und präzise Ergebnisse.
Wenn du mit der Suche besser zurecht kommst, verwende sie. Anfänger werden sich damit
erstmal herzlich schwer tun. Eine Aufbereitung in der Form "hier steht alles über das
Gruppieren von Datensätzen in Datenbanken" wäre vielleicht für den Anfänger leichter.
Zudem geht es nicht nur um die Suche eines expliziten Postings/Artikels, sondern auch
darum die Informationen zu strukturieren und "in Packete zu fassen".
Du wirst mir _keine_ Suchanfrage angeben können, die alle Postings zum Thema Datenbank
ausgibt und zwar so, dass sie alle auch wirklich relevanten Inhalt haben.
Eine weitere Möglichkeit der Aufbereitung wäre auch das menschliche Indexing, wo einigen
Postings ein Schlagwort zugeordnet wird. Diese Schlagwörter sind dann wirklich
charakteristisch für das Posting. Würde in der Suche so ein Schlagwort abgefragt, werden
alle Postings ausgegeben, welche mit diesem indexiert wurden und diese wären dann
implizit auch präzise für das Thema.
Das wiederum erfordert aber nicht nur die Auswahl von Qualität, sondern noch dazu eine über alle beteiligten Redakteure einheitliche (!) Richtlinie für die Vergabe solcher Schlagworte. Denn wenn da jeder macht, was er will, wie soll man dann als Besucher lernen, welche Worte was bedeuten?
Ja, das ist in der Tat ein Problem. Es wird bei der Zuordnung von
Indexausdrücken/Schlagwörtern einiges vom Indexer (eine Person) erwartet. Ich habe nicht
einfach nur so dahergeplappert, dass das erstellen von einem Wortschatz einfach ist; ich
weiss es und ich weiss auch warum (du hast es nur gesagt). Bezüglich des Besuchers, nun,
der sollte im Optimalfall die Indexausdrücke gar nie zu Gesicht bekommen. Die Suchanfrage
würde zuerst über einen Thesaurus oder inverted Index laufen, bis die Suchanfrage in eine
Reihe Schlagworte transformiert wurde (ja, ich weiss, dass dies beim SelfServer zum
Problem wird).
- Postings werden zu Klassen zusammengetragen, falls deren Inhalt mit der
Klassenthematik übereinstimmen.
In welcher Hinsicht unterscheiden sich "Klassen" von den bereits unterstützten Kategorien?
Eine Klassifikation ist eine _hierarchische_ Anordnung von Klassen (Sachverhalten).
Nimmst du z.B. die Dewey-Klassifikation (Decimal Classification System), so wird das
gesamte Wissen der Menscheit in 10 Hauptklassen (manchmal auch mehr) unterteilt. Diese
Hauptklassen enthalten wiederum 10 Klassen und jede wieder 10 Sektionen. In ähnlicher
Weise wäre dies für das Wissen im Forum denkbar.
Viele Grüsse
Philipp
RTFM! - Foren steigern das Aufkommen von Redundanz im Internet, danke für das lesen der Manuals.
Selbstbedienung! - Das SelfForum ist ein Gratis-Restaurant mit Selbstbedienung, Menüangebot steht in den </faq/> und dem </archiv/>.