Rouven: TextMining - Datenbank vs. ?

Beitrag lesen

Tag,

Was sollte schneller sein, als in einer schnellen Programmiersprache
(C, CPP, Java...)
die Liste der relevanten Wörter in einem Array zu speichern und den zu siebenden Text, in einer Variable eingelesen, dann in einer Iteration über den Array mittels regex zu behandeln?

Ähm, also ich geh mal davon aus, du meintest die Liste der irrelevanten Wörter, die andere kenne ich nicht, die relevanten Wörter sind ja genau die, die über bleiben.
Ich stell dann auch in diesem Ast die Frage noch mal: Das Array und die RegExp "stört" das dann auch nicht, wenn sie 4-5stellige Wortzahlen an irrelevanten Wörten bearbeiten muss?
Also das heißt, die Liste der Wörter die ich habe ist 4-5stellig, nun kommt ein Text rein, z.B. Webseite oder so, aus der ich die raushaben will.

MfG
Rouven

--

-------------------
ss:) zu:) ls:& fo:) de:< va:{ ch:? sh:) n4:( rl:? br:$ js:| ie:) fl:(