RAID
Geschichte
•International Conference
on Management of Data (1988, Chicago, Illinois, USA)
•Ursprünglicher Name aus
Marketinggründen abgelegt
•Organisation mehrerer
physischer Datenträger (keine Partitionen) zu einem logischen Laufwerk
(Partition)
•1988 Ursprünglich
Erfunden (deshalb inexpensive) um Festplatten logisch zusammenzuschließen und
dadurch den Kauf einer überproportional teuren einzelnen Festplatte mit mehr
Kapazität zu vermeiden
•höhere
Geschwindigkeit
•Kostengünstiger
•Zuverlässiger
•Erweiterbar
•bei modernen
Systemen im laufenden Betrieb Auswechselbar
•Absicherung beim Ausfall
einzelner Datenträger, da Daten mehrfach vorhanden (Redundanz, Vorkommen
doppelter Daten)
Merkmale
•Erhöhung der
Ausfallsicherheit
•Aufbau großer logischer
Laufwerke
•Austausch defekter
Festplatten und Erhöhung der Speicherkapazität während Systembetriebs
Wie ?
Raid-Konzepte
Mirroring:
•Kopieren von Daten -
Doppelt vorhanden | Spiegelbilder
Striping:
•Gleichmäßiges Verteilen
von Daten auf mehrere Festplatten
Error Correction:
•Paritätsbit wird für
Datenblöcke Angelegt
•Fehlererkennung, keine
Korrektur
Womit?
Raid-Techniken
•Steuerung der
Festplatten über pure Software-Lösung (Betriebssystem + Programm)
•Alle Rechenaufgaben
werden vom Rechner übernommen (Performanceeinbußen)
•Arbeitsspeicher des
Rechners / Servers wird verwendet
•PCI-Systembusse
werden stärker belastet
•Keine Zusätzliche
Hardware außer Festplatten benötigt (JBODs, Just a Bunch Of Disks)
This paragraph has been concealed! Download the complete document for free! • Click on download to get complete and readable text • This is a free of charge document sharing network • First upload your own document, and you get a word document per email • No registration necessary, gratis Swap homeworks and notes at no charge! Gratis scripts for students and pupils!
•Steuerung der Festplatten
über RAID-Controller in PC oder im Festplattengehäuse (wenn da)
•Keine (zusätzlichen)
Performanceeinbußen
•Controller für
Heimanwender meist auf Mainboard (kein Echtes RAID da Rechenarbeit von
Hauptprozessor übernommen), sonst dedizierte Karte
kein eigentliches RAID, 1988):
•nicht redundant
•Schnelle
Datenübertragungen
•keine Datensicherheit
•günstig, da kaum
Anforderungen an Controller
Raid 0
•Streng genommen kein
wirkliches RAID, da es keine Redundanz gibt
•gesteigerte
Transferraten, indem die beteiligten Festplatten in zusammenhängende Blöcke
gleicher Größe aufgeteilt werden, wobei diese Blöcke quasi im
Reißverschlussverfahren zu einer großen Festplatte angeordnet werden
•Somit können Zugriffe
auf allen Platten parallel durchgeführt werden
•Die Größe der
Datenblöcke wird als Striping-Granularität (auch chunk size oder interlace
size) bezeichnet. Meistens wird bei RAID 0 eine chunk size von 64 kB gewählt.
Raid 1
•speichert auf allen
Festplatten die gleichen Daten (Spiegelung) und bietet somit volle Redundanz.
Die Kapazität des Arrays ( Anordnung) ist hierbei höchstens so groß wie die
kleinste beteiligte Festplatte, da die Daten einer Fastplatte auch auf der
anderen vorhanden sein müssen
This paragraph has been concealed! Download the complete document for free! • Click on download to get complete and readable text • This is a free of charge document sharing network • First upload your own document, and you get a word document per email • No registration necessary, gratis Swap homeworks and notes at no charge! Gratis scripts for students and pupils!
•RAID 1 bietet eine hohe
Ausfallsicherheit, denn zum Totalverlust der Daten führt erst der Ausfall aller
Platten
•Eine Spiegelplatte ist
kein Ersatz für eine Datensicherung, da sich
auch versehentliche oder fehlerhafte Schreiboperationen (Viren, Stromausfall,
Benutzerfehler) augenblicklich auf die Spiegelplatte übertragen
Raid 2
•RAID 2 spielt in der
Praxis keine Rolle mehr
•Wenn überhaupt nur bei
Großrechnern verwendet (da normalerweise 10 Platten)
•Die Daten werden hierbei
in Bitfolgen fester Größe zerlegt und mittels eines Hamming-Code
(Fehlerkorrigierung) auf größere Bitfolgen abgebildet, Teilt Daten nicht in Blöcke
sondern auf BIT-Ebene
•hoher Datendurchsatz,
Verteilt nach Striping-Prinzip
•Der kleinste
RAID-2-Verbund benötigt drei Festplatten und entspricht einem RAID 1 mit
zweifacher Spiegelung. Im realen Einsatz sah man daher zumeist nicht weniger
als zehn Festplatten in einem RAID-2-Verbund.
•Generiert einen
Fehlerkorrekturcode, der auf eine zusätzliche Festplatte geschrieben wird
•Ist ein einziges Bit
fehlerhaft kann es an Hand der Fehlerkorrekturcodes sofort korrigiert werden -
Error Checking & Correction (ECC), gleicht einzelne Bitfehler aus
Raid 3
•Primär Datensicherung
This paragraph has been concealed! Download the complete document for free! • Click on download to get complete and readable text • This is a free of charge document sharing network • First upload your own document, and you get a word document per email • No registration necessary, gratis Swap homeworks and notes at no charge! Gratis scripts for students and pupils!
•Für die Paritäts-Platte
(zur Datensicherung) werden die Bits der Datenplatten zusammengezählt und die
errechnete Summe wird darauf untersucht, ob sie eine gerade oder eine ungerade
Summe darstellt; eine gerade Summe wird auf der Paritäts-Platte mit dem Bit-Wert
0 gekennzeichnet; eine ungerade Summe wird mit dem Bit-Wert 1 gekennzeichnet
•Die Datenplatten
enthalten also normale Nutz-Daten, während die Paritäts-Platte nur die
Summen-Informationen enthält.Der Gewinn durch ein RAID 3 ist folgender: Man
kann beliebig viele Datenplatten verwenden und braucht für die Daten-Sicherung
trotzdem nur eine einzige Platte, nämlich die Paritäts-Platte. Die eben
dargestellten Berechnungen ließen sich auch mit 4 oder 5 oder noch mehr
Daten-Platten (und nur einer einzigen Paritäts-Platte) durchführen.
•RAID 3 ist inzwischen
vom Markt verschwunden und wurde weitgehend durch RAID 5 ersetzt
•RAID 3 mit 2 Festplatten
= RAID 1 (Daten doppelt vorhanden)
Raid 4
•Es werden ebenfalls
Paritätsinformationen berechnet, die auf eine dedizierte Festplatte geschrieben
werden. Allerdings sind die Einheiten, die geschrieben werden, größere
Datenblöcke (englisch chunks) und nicht einzelne Bytes, was die Gemeinsamkeit
zu RAID 5 ausmacht.
•Hohe Ausfallraten
•Wegen der fest
definierten Paritätsplatte bei RAID 4 wird stattdessen fast immer RAID 5 bevorzugt.
This paragraph has been concealed! Download the complete document for free! • Click on download to get complete and readable text • This is a free of charge document sharing network • First upload your own document, and you get a word document per email • No registration necessary, gratis Swap homeworks and notes at no charge! Gratis scripts for students and pupils! Dadurch werden die Nachteile von RAID 4
vermindert, und die Vorteile bleiben erhalten.
Raid 5
•RAID 5 bietet sowohl
gesteigerten Datendurchsatz beim Lesen von Daten als auch Redundanz und ist
dadurch die beliebteste RAID-Variante
•RAID 5 ist eine der kostengünstigsten
Möglichkeiten, Daten auf mehreren Festplatten redundant zu speichern und dabei
das Speichervolumen effizient zu nutzen
•Allerdings hoher
Controlleranforderungen und -preise (lohn sich meist erst ab vier Platten)
•Die nutzbare
Gesamtkapazität errechnet sich aus der Formel: (Anzahl der
Festplatten - 1) × (Kapazität der kleinsten Festplatte).
Rechenbeispiel mit vier Festplatten à 500 GB: (4 - 1) ×
(500 GB) = 1500 GB Nutzdaten und 500 GB Parität.
•Berechnung der Parität:
Bildung einer logischen Gruppe durch jeweils an gleicher Adresse anliegende
Datenblöcke der Festplatten
•Von allen Datenblöcken
einer Gruppe enthält ein Datenblock die Paritätsdaten, während die anderen
Datenblöcke Nutzdaten enthalten
•Da die
Paritätsinformationen beim Lesen nicht benötigt werden, stehen alle Platten zum
parallelen Zugriff zur Verfügung, was dem Vorgang (theoretisch)
beschleunigt - dieser Vorteil greift allerdings nicht bei kleinen Dateien, erst
bei größeren Dateien tritt eine nennenswerte Beschleunigung ein.
|