Andreas: TextMining - Datenbank vs. ?

Beitrag lesen

Ein HashSet ist eigentlich immer die schnellst und vernünftige Variante um ein Element schnell aufzufinden (Ausser man hat unendlich viel Speicher...). In den meisten Fällen (Zugriff) erhält man das Element in einem Schritt (O(1)). Ich habe schon HashSet und HashMap benutzt, welche zehntausende Objekte enthielten. Man sollte aber darauf achten, bei eigenen Objekten die Methode "equal" zu überschrieben und die Grösse des HashSet zu Beginn auf etwa das zweifache der zu erwartende Element-Zahl setzen.
Zudem sollte man den Speicher der VM raufschrauben wenn OutOfMemoryExceptions auftreten (Standardeinstellung bei 64MB).

MfG
    Andreas

Hi!

Das ist nicht schwierig:
Speichere alle irrelevanten Wörter in einem Set ab (HashSet ist hier vorteilhaft).

Danke erst einmal für den Tipp. Ich komme ja immer mehr zu der Erkenntnis, dass man sich bei den heutigen Speicherdimensionen keine Sorgen mehr um solche Sachen machen muss, aber das HashSet und eine FOR-Schleife sind auch bei 4-5stelligen Wortzahlen noch schnell genug ja?
Ich werd das aber auf jeden Fall mal praktisch ausprobieren, wenn ich mich einigermaßen an eine strukturierte Gliederung meines Programmes halte, dann sollte ich so eine Einles-Klasse ja recht schnell austauschen können...

MfG
Rouven