Hello,
[...]entscheiden, wie ich suche. Ob binär, ob per Hash-Index, das bleibt
völlig mir überlassen.
Sei bitte so lieb und beseitige für mich ein für alle Mal die Verständnisschwierigkeit: Was ist ein Hash-Index oder auch Hash-Algorithmus? Ich kanns mir einfach nicht merken.
such mal aus 1 millionen datensätze einen bestimmten eintrag ohne
einen solchen indize zu besitzen. eine blosse dateispeicherung wird
das nämlich nicht tun.
Bei direkt gestreuten Dateien habe ich den im ersten Zugriff. Dann nennt man es allerdings auch "holen" und wenn ich doch suchen muss, sollte ich schon wissen, welche Sortierung vorliegt. Außerdem sind Dateisysteme heute so schnell, wenn sie genügend Speicher haben, dass man den Datensatz auch bei unsortierten Daten schnell finden kann. Man liest immer Blöcke ein gemäß der Speicherzuteilung und reloziiert die, das heißt, man schaut, wo in den gelesenen Daten der erste Satz anfängt und wo der letzte aufhört und schneidet sich so eine passende Datenmenge aus dem Block raus. Der nächste Block wird dann entsprechend verschoben begonnen. Der Sinn dahinter ist die Abarbeitungsgeschwindigkeit im Speicher, die heute ca. 2600 mal so hoch ist, wie die Accelleration auf die Platten. Bitte nicht verwechseln mit dem Datendurchsatz, wenn man die passende Stelle erst einmal gefunden hat. Der ist mit ca. 20-100MByte/s durchaus beachtlich.
Liebe Grüße aus http://www.braunschweig.de
Tom
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen