Wie groß ist denn dann die Wahrscheinlichkeit, dass es an einem Tag zu einem Datenverlust kommt, wenn man 4 Platten und jeweils 4 Paritätsplatten hat und die Chance, dass eine Platte ausfällt (das wird erst einen Tag später gemerkt), genau 10% beträgt?
wie schon erwähnt, es geht nicht um die wahrscheinlichkeit eines datenverlustes, sondern um den ausfall des arrays, die dadurch entsprechenden performanceeinbrücke und die unerreichbarkeit - raid - egal welches level - ersetzt kein backup
Für mich schon.
Es ist klar, dass es keine absolute Sicherheit bietet und ich würde natürlich trotz des RAID auch weiterhin wichtige Daten auf optischen Medien sichern.
Das Problem ist nur... ich habe keine Lust, 500GB an Filmen auf DVDs zu brennen. Daher ist ein RAID für mich ganz praktisch, weil die Filme erhalten bleiben, auch wenn mal eine Festplatte an Altersschwäche sterben sollte.
bei 4 platten mit je 4 paritätsplatten (was auch immer das sein soll) haben wir also 20 festplatten
Ich habe mich vielleicht schlecht ausgedrückt - ich meinte 4 Festplatten, von denen jede genau einmal gespiegelt wird. D.h. man hat am Ende 8 Festplatten.
wenn wir nun annehmen, wir rechnen die ausfallwahrscheinlichkeit auf ein jahr und jede platte defintiv 1x im jahr ausfällt, kommt uns das geburtstagsparadoxon zu hilfe:
die wahrscheinlichkeit für den ausfall einer beliebigen platte an einem bestimmten tag liegt bei etwa 1/365 (ca 0,27%) - die wahrscheinlichkeit für den ausfall 2 beliebiger platten an einem beliebigen tag liegt bei sage und schreibe etwa 41%
dieses phänomen ist einerseits in der kryptographie bzw hash-funktionen (birthday-attack) wichtig, anderseits aber auch in der berechnung von raid arrays
natürlich ist das obrige nur ein beispiel - es ist keinesfalls gesagt, dass eine platte defintiv 1x im jahr ausfallen wird - aber das ganze verschiebt nur den risikobereich etwas nach unten
fakt ist, dass mehr platten NICHT wie landläufig erwartet zu einer höheren datensicherheit führen sondern umgekehrt - je mehr platten desto katastrophaler ist die anahme
Das ist doch auch in meiner Rechnung enthalten.
Da ich vier Festplatten mit Daten habe und für jede Festplatte genau eine Festplatte, die zur Absicherung die gleichen Daten enthält, habe ich viermal die Chance, dass zwei zusammengehörige Platten ausfallen.
D.h.: 10% * 10% und das ganze mal 4.
Wären es 8 Platten und jeweils wieder noch je eine Platte mit den gleichen Daten (also zusammen 16 Platten) dann wäre die Chance für einen Datenverlusts schon mehr als doppelt so groß (über 8%).