Rouven: TextMining - Datenbank vs. ?

Beitrag lesen

Guten Morgen!

Nach Lesung des ganzen Threads scheinen das wohl "Schulaufgaben" zu sein. Deshalb hier kein Code oder Link, sondern eine Erklärung (Plus Hinweis auf ein passendes Programm, soooo bin ich natürlich nicht ;-).

Jo, das hätte ich dir auf Anfrage aber auch sicherlich gesagt, genau gesagt ist es eine "Uni-Aufgabe". Ich will ja auch keinen Quellcode, nur ein paar Anregungen zur effizienten Umsetzung (vs. meinem eigenen stundenlangen herumspielen mit diversen Lösungen)... Bin da doch schon mehr der Programmierer, der das selber umsetzen will.

Um Startwörter geht es nicht, die Grundidee ist eine Stoppwortliste. Dazu kommen noch eine Stammformen-Liste, eine Art Thesaurus-Liste, evtl. (d.h. wenn ich noch die Zeit finde) Wortabstände und Vor-/Nachsilben. Zu Onthologien werde ich wohl eher nicht mehr kommen...

Sowas ist ein recht interessantes Feld und sollte nicht so einfach nebenbei abgearbeitet werden.

Da stimme ich dir voll zu, ich bin froh, dass ich endlich mal ein paar Methoden lerne, wie man solche Dokument-/Worteinordnungen in der Praxis macht. Vorlesungen wie DataMining höre ich erst ab nächstem Jahr, die Aufgabe läuft daher etwas im Vorgriff.
Na gut, dann werde ich mich mal meinen ANDEREN Projekten zuwenden. Wenn ich doch nur die Zeit hätte um der Sache die notwendige Aufmerksamkeit zu widmen...

MfG
Rouven

--

-------------------
ss:) zu:) ls:& fo:) de:< va:{ ch:? sh:) n4:( rl:? br:$ js:| ie:) fl:(