fastix®: TextMining - Datenbank vs. ?

Beitrag lesen

Moin!

Hmpf,

Hm. Wenn JAVA soooooOOOooooo schlecht Texte manipulieren kann muss man über Alternativen nachdenken.

Da wäre noch was. Wenn die Geschichte auf UNIX/Linux- Systemen laufen soll: Da gibts ein sehr altes, performantes Progrämmchen zur Textmanipulation (nein, nicht Perl, das ist "neu").

Wenn also Java externe Programme starten kann, dann solltest Du Dir mal das Manual zu awk (unter UNIX) oder gawk (unter Linux, normalerweise auf awk verlinkt, unter Windows mit Cygwin auch, läuft aber wahrscheinlich mit 30% weniger Performance) reinziehen. Es könnte sein, dies ist performanter, ich vermute ja, Du willst Dein Data-Mining nicht auf eine Seite beschränken.

"Lieber Gott, lass mich hier keinem helfen, der Emailadressen grabben will!"

MFFG (Mit freundlich- friedfertigem Grinsen)

fastix®

--
Als Freiberufler bin ich immer auf der Suche nach Aufträgen: Schulungen, Development. Auch  für seriöse Agenturen.