Moin!
In der Produktion müssen dann täglich ca. 6.000 Dateien geprüft werden, und das sollte tunlichst nicht länger als 3ß Minuten dauern...
Worauf geprüft?
Es gibt so viele schöne Dateieigenschaften, die man wesentlich schneller abprüfen kann, als den Inhalt durch eine Prüfsumme zu schicken.
Typische Dinge, die sich bei Dateiänderungen verändern (können):
- Dateigröße
- file-mtime
- file-atime
In Abhängigkeit von der Art der Dateiänderung muß außerdem nicht jedes Prüfsummenverfahren geeignet sein. Prüfsummen haben jeweils typische Aufgabenstellungen, auf die sie spezialisiert sein können, was ermöglicht, dass sie bei anderen Aufgaben scheitern können.
Nur mal angenommen, als Prüfsumme würde man einfach die Addition aller Bytes einer Datei nehmen - dann würden Veränderungen, die die gleiche Summe ergeben, nicht entdeckt werden. Genauso kann man bei MD5 reinfallen, weil das eine Megabyte an Daten dummerweise den gleichen Wert hat, wie eine komplett leere Datei mit 0 Byte.
Nur: Das Dateisummieren ist sicherlich schneller erledigt, als MD5 - aber die Mehrinvestition in MD5-Rechenzeit erzeugt eine höhere Sicherheit gegen solche dummen Zufälle. Die Summe aller Bytes einer Datei ist nämlich nicht gleichverteilt über den verfügbaren Zahlenraum, kleinere Zahlen kommen wesentlich häufiger vor, als sehr große - MD5 hingegen hat den Anschein, als sei genau das der Fall.
- Sven Rautenberg
--
My sssignature, my preciousssss!