Halihallo Matze und Forumer
Ich bin bisher nicht dazu gekommen den gesamten Thread zu lesen, ich entschuldige alle
doppelten Aussagen bereits jetzt. Mir geht es einfach mal darum die Gedanken von mir
in aufbereiteter Form niederzuschreiben:
Matze: Du sagst auch, dass Du dich dafür einsetzen würdest, das Forum etwas aufzuräumen.
Für mich stellt sich die Frage, ob Aufräumen überhaupt sinnvoll ist. Die Datenmenge ist
schwer zu überblicken und die Kriterien, was aufgeräumt werden soll noch nicht genau
definiert.
Für mich viel interessanter ist die Frage nach dem Aufbereiten von den Informationen,
denn dies wäre ein unglaublicher Mehrwert (das Aufräumen nicht, denn es vermindert
lediglich die Datenmenge, wenn man unter Aufräumen das Löschen von sinnlosen, unnützen
oder irrelevanten Postings versteht). Dieses Forum ist ein Platz von Leben und stetem
Informationsaustausch in einer linearen Form (Frage->Antwort, neue Frage, neue Antwort).
Die Information ist zwar strukturiert (Thread, Subject, Thema), aber nicht sehr tief.
Es gibt eine Suchfunktion, welche passende Einträge extrahiert (eine mögliche Form der
Navigation im Informationshaushalt des Forums), nur leider sind die Ausgaben nicht immer
präzise (precision), sondern primär recall (wieviele passende Einträge wurden gefunden).
Für eine zweite Möglichkeit der Aufbereitung wäre also ein precision verbesserndes
Verfahren zu empfehlen; ein Verfahren also wo man über geeignete Stich- und Schlagwörter
oder einer Klassifikation schnell und "treffsicher" zu relevanten Informationen kommt.
Eine automatische Suche erfüllt dies zwar oft auch, aber der Inahlt kann bekanntlich
durch diese nicht als relevant/irrelevant eingestuft werden und somit erhält man über
die Suche auch sehr oft "Schrott".
Eine tiefe Klassifikation (tief ist hier übrigens als eine tiefe hierarchische
Struktur zu verstehen) würde wirklich nur Themen ausgeben, die sich wirklich eingehend
mit der Thematik beschäftigen. Das Problem hier ist eindeutig die Wartung und die
menschliche Arbeit, zudem das genaue Spezifizieren einer hierarchischen Strukturierung
(das ist besonders hier nicht leicht, da sehr "breit" diskutiert wird).
Um nochmals etwas meinen Standpunkt zu erklären: Mir geht nicht darum den Datenbestand
des Forums zu ändern, sondern die Informationen so aufzubereiten, dass sie schnell und
präzise aufgefunden werden können. Die Suche ist hier natürlich ein gigantischer Helfer,
nur dass diese die Spreu nicht vom Weizen trennen kann und hier sind wir beim Faktor
Mensch...
Mir geht es desweiteren auch nicht darum den gesamten Datenbestand des Forums zu
klassifizieren/aufzubereiten, sondern die Kernaussagen/-antworten schnell aufzufinden.
Das Aufbereiten des gesamten Datenbestandes ist meiner Meinung nach kaum möglich (möglich
wohl schon, aber die Frage bleibt, ob das Ergebnis namentlich der Mehrwert wirklich noch
vorhanden/nützlich ist). Ein für mich gutes Retrieval System für das Forum wäre ein
Verfahren, welches auf eine explizite Frage (Suchanfrage über Schlagwörter/Sichwörter)
eine explizite Antwort ausgibt, welche für die Beantwortung der Frage relevant ist.
Ein einfaches Retrieval ermöglicht dies zwar nicht, aber zumindest wären die Treffer in
einem menschlich aufbereiteten System wirklich "Treffer", die sich mit dem Thema wirklich
beschäftigen (wer kennt es nicht, man gibt in der Suche Datenbank ein und kriegt
Beiträge, wo einfach steht: "Du brauchst eine Datenbank"), toll, das ist keine präzise
Antwort und derartige würden in einer Klassifikation eben nicht auftauchen.
Eine andere Möglichkeit der Aufbereitung sind auch die Feature Artikel und Tipps&Tricks,
welche ein Themenbereich einfach in klaren Worten beschreiben. Man müsste nur mal mehr
Autoren finden, die gewisse bereiche genug erschöpfend zusammenfassen.
Eine weitere Möglichkeit der Aufbereitung wäre auch das menschliche Indexing, wo einigen
Postings ein Schlagwort zugeordnet wird. Diese Schlagwörter sind dann wirklich
charakteristisch für das Posting. Würde in der Suche so ein Schlagwort abgefragt, werden
alle Postings ausgegeben, welche mit diesem indexiert wurden und diese wären dann
implizit auch präzise für das Thema. Ein Schlagwort ist eben nicht nur ein Wort, das im
Text vorkommt (diese nennt man Sichtwörter), sondern ein Wort das denn Sinn und Inhalt
des Postings genau beschreibt (und deshalb das Posting "bewertet", ein Posting wo nur
einmal das Wort "Datenbank" enhält wird kein Schlagwort "Datenbank" erhalten, da das
Posting eben gar nicht primär von "Datenbank" handelt).
Die Möglichkeiten, wie man die Information in diesem Forum aufbereiten könnte, sind sehr
vielfältig. Man sollte einfach mal darüber diskutieren, welches Verfahren am besten ist.
Möglichkeiten im Überblick:
- Abstracts, Zusammenfassungen (Tipps&Tricks, Feature Artikel, haben wir schon)
- Indexing
- Stichwortindexing (unsere jetztige Suche, haben wir schon)
- Schlagwortindexing (zuordnen von Desktiptoren zu Postings, welche den Inhalt und
die Aussage genau beschreiben und so die Spreu vom Weizen trennt)
- Klassifikation
- Postings werden zu Klassen zusammengetragen, falls deren Inhalt mit der
Klassenthematik übereinstimmen.
So, dass wären so meine theoretischen Gedanken zu deinem Vorhaben, Matze :-)
Ich denke, ich wäre durchaus bereit auch mitzuhelfen, denn eigentlich habe ich bisher
noch gar nichts für den SelfRaum getan, keine Feature Artikel, keine Tipps&Tricks, gar
nix. Ich bin daran interessiert dies mal zu ändern :-)
Aber bis dies in die Tat umgesetzt wird, muss noch einiges diskutiert werden...
Viele Grüsse
Philipp
RTFM! - Foren steigern das Aufkommen von Redundanz im Internet, danke für das lesen der Manuals.
Selbstbedienung! - Das SelfForum ist ein Gratis-Restaurant mit Selbstbedienung, Menüangebot steht in den </faq/> und dem </archiv/>.