Hi Henryk,
Zwei Postings in der hart erstrittenen Mittagsruhe und gleich zwei peinliche Fehler eingebaut.
Make that three:
Hi Hendrik
;-)
Aaaargh!
Danke, daß Du es mit Humor nimmst, aber den Namen und auch noch in der direkten Anrede falsch zu schreiben ist nun wirklich unverzeihlich. Möchte trotzdem um Entschuldigung bitten.
Den hatte ich noch nicht. Wie langsam ist er denn?
Die Implementierung ist ziemlich aufwendig und in meinen Versuchen hat es so ungefähr 15 Minuten gebraucht um ein Megabyte Mails einzulernen (klassifizieren geht dann nachher deutlich schneller). Die >30h die es da für meinen gesamten Corpus gebraucht hätte, wollte ich nicht warten. Vermutlich könnte man das beschleunigen, wenn man den Algorithmus aus der aktuellen Implementierung, die ja eigentlich eher ein Schweizer Taschenmesser für Streamverarbeitung ist, herausnimmt und getrennt von den regulären Ausdrücken nur für diesen einen Zweck einsetzt.
Läd gerade herunter (2003-04-27). Ich schau mal, was sich machen läßt.
Ist mir aber jetzt zu spät, komme gerade von einer Bestattung eines OpenBSD File-Servers, der mir leider auf dem Tische verstorben ist. (Hat was mit einem MSCE, mindestens 13 Brutal-Resets laut teilweise restauriertem Log, einem wirklich _völlig_ zerschossenem ext2-FS, unauffindbaren Backups und einem (leider) verhinderten Versuch den Verursacher mittels CAT5 am Türrahmen "zur Warnung" aufzuknüpfen zu tun)
so short
Christoph Zurnieden