Wie groß ist denn dann die Wahrscheinlichkeit, dass es an einem Tag zu einem Datenverlust kommt, wenn man 4 Platten und jeweils 4 Paritätsplatten hat und die Chance, dass eine Platte ausfällt (das wird erst einen Tag später gemerkt), genau 10% beträgt?
wie schon erwähnt, es geht nicht um die wahrscheinlichkeit eines datenverlustes, sondern um den ausfall des arrays, die dadurch entsprechenden performanceeinbrücke und die unerreichbarkeit - raid - egal welches level - ersetzt kein backup
da auch nur die geringste chance besteht, dass bei einem raid ein datenverlust entsteht, ist es unumgänglich eine aktives oder passives backup zu haben
aber zurück zu deiner rechnung oder schätzung: diese ist gänzlich fehlerhaft
bei 4 platten mit je 4 paritätsplatten (was auch immer das sein soll) haben wir also 20 festplatten
wenn wir nun annehmen, wir rechnen die ausfallwahrscheinlichkeit auf ein jahr und jede platte defintiv 1x im jahr ausfällt, kommt uns das geburtstagsparadoxon zu hilfe:
die wahrscheinlichkeit für den ausfall einer beliebigen platte an einem bestimmten tag liegt bei etwa 1/365 (ca 0,27%) - die wahrscheinlichkeit für den ausfall 2 beliebiger platten an einem beliebigen tag liegt bei sage und schreibe etwa 41%
dieses phänomen ist einerseits in der kryptographie bzw hash-funktionen (birthday-attack) wichtig, anderseits aber auch in der berechnung von raid arrays
natürlich ist das obrige nur ein beispiel - es ist keinesfalls gesagt, dass eine platte defintiv 1x im jahr ausfallen wird - aber das ganze verschiebt nur den risikobereich etwas nach unten
fakt ist, dass mehr platten NICHT wie landläufig erwartet zu einer höheren datensicherheit führen sondern umgekehrt - je mehr platten desto katastrophaler ist die anahme - zwar ist ist ein raid 6 mit 4 platten immer noch sicherer als ein raid 5 mit 3 platten, aber die ausfallwahrscheinlichkeit der platten ist höher (auch wenn sich das auf die gesamtverfügbarkeit aufgrund der anderen technologie nicht auswirkt)
wie schon erwähnt: der spielerfehlschluss in bezug auf das geburtstagsparadoxon ist das entscheidende: man kann nicht einfach die ausfallwahrscheinlichkeit nehmen und dann diese ausfallwahrscheinlichkeit durch die ausfallwahrscheinlichkeit einer weiteren platte teilen
übrigens: das oben genannte beispiel mit 2 ausfallenden platten funktioniert natürlich nur unter der annahme, das 2 platten das raid-array vollständig unbrauchbar machen - gilt also in dem fall nur für raid 0 oder raid 5 und bedingt für raid 0+1 oder 10 - raid 6 ist davon ausgenommen, da hier in jedem fall 2 ausfallen dürfen
aber auch hier gilt: die wahrscheinlichkeit, dass 2 platten irgendwann ausfallen ist kleiner als die, dass 3 platten irgendwann gleichzeitig ausfallen