34
RAID-Systeme Sicherheit und Performance auf einem „anderen Level“ TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Embed Size (px)

Citation preview

Page 1: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID-Systeme

Sicherheit und Performance auf einem „anderen Level“

TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Page 2: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Inhalt

1. Einleitung RAID-Systeme RAID-Level

2. Theorie Software- vs. Hardware-RAID IDE- vs. SCSI-RAID Anforderung an die Festplatten Hot Swapping und Hot Spare Striping und MTBF

3. RAID-Level RAID 0,1,10 Level mit Fehlerkorrektur XOR-Parity RAID 2-7,50 Strategien Zusammenfassung

4. Fazit RAIDsche Dreieck Grenzen von RAID

Page 3: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID-Systeme

Redundant Array of Independent Disks (früher Inexpensive Disks)

Zusammenfassung mehrerer Festplatten zu einem Array, welches das Betriebssystem dann wie eine einzige große Festplatte verwaltet

Steigerung der Performance durch die gleichzeitige Nutzung mehrerer Laufwerke, auf denen die Daten verteilt sind

Erhöhung der Sicherheit und Verfügbarkeit der Nutzdaten durch Redundanz: es werden zusätzliche Daten abgespeichert, mit deren Hilfe sich die Nutzdaten einer defekten Platte rekonstruieren lassen

RAID-Systeme lassen auf unterschiedliche Art und Weise aufbauen, man unterscheidet dabei verschiedene Level

Page 4: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID-Level die Level 1-5 wurden 1987 an der Universität von Berkeley definiert

und haben sich als Standard etabliert

sie beschreiben das grundsätzliche theoretische Verfahren aber nicht dessen technische Umsetzung

Heute unterscheidet man die Level 0 bis 7 (und verschiedene weitere Level, die sich ergeben können, wenn man zwei Level kombiniert)

Trotz der Bezeichnung „Level“ handelt es sich nicht um stufenweise aufbauende Verfahren, sondern um voneinander unabhängige Techniken.

Kein RAID-Level wird allen Anforderungen gleichzeitig gerecht, je nach Struktur und Sensibilität der Daten muss das passende Level ausgesucht werden.

Page 5: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Software- vs. Hardware-RAID

Kriterium Software-RAID Hardware-RAID

Implementations-kosten

niedrig hoch

Performance niedrig hoch

CPU-Belastung hoch niedrig

Plattform-unabhängigkeit

nein ja

Unterstützte

RAID-Level

NT,2000,XP: 0,1,(5)

Linux: 0,1,4,5alle

Page 6: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

IDE- vs. SCSI-RAID

Kriterium IDE-RAID SCSI-RAID

Implementations-kosten

niedrig hoch

Performance niedrigerhoch

(Dis-/Reconnect)

CPU-Belastung hochniedrig

(RAID-Controller)

Ausbaufähigkeit gering hoch

Dauerbetrieb nein ja

Page 7: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Anforderung an die Festplatten eines RAID-Systems

gleiche Geschwindigkeit, gleiche Größe und gleich großer Cache (am besten baugleiche Platten verwenden)

die RAID-Verfahren setzen gleich große Partitionen voraus, in einer Mischkonfiguration wird jedes Laufwerk nur bis zur Kapazität der kleinsten vorhandenen Festplatte genutzt

bei der Kombination einer 20-GByte-Platte mit einer 30-GByte- großen Platte werden von dieser nur die ersten 20 GByte genutzt

solche Kombinationen sollten schon aus Kostengründen vermieden werden

Page 8: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Hot Swapping

Hot Swapping (oder auch Hot Plugging) ist ein Feature moderner RAID-Systeme, welches es erlaubt, eine defekte Platte auch während des Betriebs auszutauschen.

Sobald die neue Platte ihren Platz eingenommen hat, beginnt der Prozessor des RAID-Controllers selbsttätig mit deren Test, Formatierung und der Rekonstruktion des Inhalts.

Page 9: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Hot Spare

Alternativ zum Hot Swapping kommt häufigHot Spare (oder auch Hot Fix) zum Einsatz. Hierbei übernimmt eine unbenutzte Platte des RAID-Arrays im laufenden Betrieb die Funktion einer ausgefallenen Festplatte.

Es steht sofort eine neue Platte zur Verfügung, ohne das sie erst manuell ausgetauscht werden muss.

Page 10: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Striping die langsame Mechanik einer einzelnen Festplatte verhindert, dass die

Daten in der vollen Geschwindigkeit des Interfaces übernommen werden können

das Striping (RAID-Level 0) verteilt die Daten jeder Datei beim Schreiben gleichmäßig über alle im RAID vorhandenen Festplatten

ist der Cache der ersten Platte voll, wird sofort die nächste beliefert und die Mechanik der ersten Platte hat Zeit, die Daten zu schreiben

so entsteht ein kontinuierlicher Datenstrom am Interface und die gesamte Bandbreite wird ausgenutzt

beim späteren Lesen einer Datei werden die Dateidaten dann von allen Platten geliefert

die resultierende Lesegeschwindigkeit ist im Idealfall die Addition der Transfergeschwindigkeit aller Platten, also bei zwei genutzten Festplatten doppelt so hoch ist wie bei einer einzelnen Platte

das Aufsplitten der Daten ist es auch, was die anderen Levels (trotz des Overheads für die Verwaltung) oft in der Performance besser aussehen lässt als eine einzelne Festplatte

Page 11: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

MTBF

Je mehr Platten in einem Striping-Array zum Einsatz kommen, desto höher ist die statistische Wahrscheinlichkeit, dass eine von ihnen ausfällt.

Die Mean Time Between Failures eines Arrays (Zeit bis zum Ausfall) errechnet sich aus der MTBF einer Platte geteilt durch die Anzahl der Platten.

Beträgt der mittlere Ausfallabstand einer einzelnen Platte z.B. 35000 Betriebsstunden, muss bei einem RAID mit 7 Platten bereits nach 5000 Stunden mit einem Ausfall gerechnet werden.

Page 12: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 0

kein echtes RAID-Level, da keiner Weise redundanten Daten gespeichert werden, wird auch als Non-Redundant Striped Array oder als Striping bezeichnet

das parallele Lesen und Schreiben auf mehreren Laufwerken steigert zwar die Durchsatzrate enorm - im Falle eines Defektes sind aber alle Daten unwiederbringlich verloren, besteht keine Möglichkeit, die Daten zu rekonstruieren

wenn z.B. eine von zwei Platten ausfällt, so fehlt nicht etwa die Hälfte aller Dateien, sondern von allen Dateien jeweils die Hälfte.

wird vorzugsweise in der Audio- oder Videobearbeitung eingesetzt

Page 13: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100
Page 14: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 1

wird auch als Mirroring bezeichnet. Wenn für die Festplatten bei Verwendung separater RAID-Controller nennt man es Duplexing

benötigt min. 2 Platten, Gesamtzahl der verwendeten Platten muss stets gerade sein

auf zwei Platten werden identische Daten gespeichert. Daraus ergibt sich eine Redundanz von 100%, fällt eine der beiden Platte aus, arbeitet das System sofort mit der anderen Platte weiter

diese hohe Ausfallsicherheit wird jedoch mit den doppelten Kosten für die Festplattenkapazität bezahlt und lohnt sich deshalb nur für kleine Server

Page 15: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100
Page 16: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 0+1

wird auch RAID 10 genannt

Kombination von RAID 1 mit RAID 0 und verbindet dabei die Sicherheit von Level 1 mit der Performance von Level 0

Die RAID Level 0,1 und 10 haben dank der on Board oder als Steckkarte erhältlichen IDE RAID Controller auch unter den normalen PC Anwendern eine hohe Verbreitung.

Page 17: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Level mit Fehlerkorrektur (Parity)

beheben den Mirroring-Nachteil (halbe Nutzkapazität bei doppelten Kosten)

Nutzdaten werden per Striping auf mindestens zwei Datenlaufwerke verteilt

Daten der Nutzlaufwerke werden über eine logische Exklusiv-Oder-Operation (XOR) miteinander verknüpft (Paritätsprüfung)

Resultat wird (meist) auf einem eigenen Parity-Laufwerk gespeichert

aus den Paritätsinformationen und noch vorhandenen Nutzdaten lassen sich nach einem Ausfall die Daten eines defekten Laufwerks wieder rekonstruieren

Page 18: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

XOR (Exklusiv-Oder)

XOR ist ein bitweiser Vergleich der Nutzdaten. Hierbei wird die Anzahl der Einsen an einer bestimmten Stelle gezählt. Ist die Anzahl ungerade ist das Ergebnis der XOR Verknüpfung eine 1, ansonsten eine 0.

x1 x2 XOR

0 0 0

0 1 1

1 0 1

1 1 0

Page 19: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Parity-Berechnung

Nehmen wir nun einmal an, dass unsere Nutzdaten auf 2 Festplatten aufgeteilt werden. Für die Parität wird eine dritte Festplatte benötigt. Der Inhalt der Festplatten würde dann so aussehen:

Festplatte Inhalt

A 01101100

B 11100101

Parity 10001001

Page 20: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Fehlerkorrektur mit Parity

Würde jetzt eine Festplatte ausfallen, könnte durch eine erneute XOR Verknüpfung aus dem Inhalt der restlichen Platten die fehlende Information errechnet werden. Hierbei spielt es keine Rolle, ob eine Daten- oder die Parity- Festplatte ausfällt. Erst wenn mehr als eine Festplatte ausfällt, sind die gespeicherten Informationen verloren.

FestplatteInhalt vor

dem Ausfall Ausfall von

Festplatte B Ausfall der

Parity-Platte

A 01101100 01101100 01101100

B 11100101 * * * * * * * * 11100101

Parity 10001001 10001001 * * * * * * * *

Datenre- konstruktion

nicht notwendig

11100101 10001001

Page 21: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 2

die Nutzdaten werden bitweise auf die einzelnen Festplatten des RAID-Arrays verteilt

nach dem aufwendigen Hamming- Algorithmus wird ein Fehlerkorrekturcode (Error Correction Code) berechnet und separates abgespeichert

Methode entspricht dem ECC-RAM Bausteinen

langsame Schreibgeschwindigkeit

wird der Praxis nicht mehr eingesetzt, da moderne Festplatten bereits eigene Methoden zur Fehlerkorrektur besitzen

Page 22: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 3

die Nutzdaten werden byteweise auf die einzelnen Festplatten des RAID-Arrays verteilt

für jeden Datensatz eine XOR-Prüfsumme erstellt und diese auf einer separaten Parity-Platte abgelegt

beim Ausfall einer einzelnen Platte können die Daten anhand der verbliebenen Platten und den Parity-Informationen rekonstruiert werden

wird in der Praxis nicht mehr eingesetzt, da moderne Festplatten und Betriebssysteme aber nicht mehr mit einzelnen Bytes arbeiten

Page 23: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 4

arbeitet ähnlich wie RAID 3

die Daten werden aber nicht in einzelnen Bytes, sondern in Blöcken zu 8, 16, 64 oder 128 Kilobyte unter den Platten aufgeteilt

die Parity-Informationen werden auf einem separaten Laufwerk gespeichert

wird auch nur selten verwendet

Page 24: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100
Page 25: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 5

arbeitet wie RAID 4 mit blockweiser Datenverteilung

es existiert aber kein separates Parity-Laufwerk, die Parity- Informationen werden gleichmäßig auf alle Laufwerke des RAID-Arrays verteilt.

Schreibzugriffe werden weitgehend parallelisiert, die mechanische Beanspruchung verteilt sich auf alle Platten

auch beim Lesen der Daten gute Performance, da die Daten gleichmäßig von allen Platten kommen

beliebteste RAID-Variante im Server-Bereich, speziell bei Datenbank- und Transaktionsservern

Page 26: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100
Page 27: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Grundsätzliche RAID-Strategien

Page 28: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 50

Kombination von RAID 5 mit RAID 0 und verbindet dabei die Sicherheit von Level 5 mit der Performance von Level 0

benötigt mindestens 6 Festplatten

wurde von American Megatrends (AMI) entwickelt

Bei der Bezeichnung von Levelkombinationen wird aus marketing-technischen Gründen die größere Levelnummer meist zuerst angegeben (RAID 50 statt RAID 05), da sich höhere Level besser verkaufen lassen.

Page 29: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 6

arbeitet grundsätzlich wie RAID 5, ist deshalb auch als RAID 5+ bekannt

es wird eine weitere Parity-Platte verwendet, was die Ausfallsicherheit nochmals erhöht

nun könnten sogar zwei Platten des Verbunds ausfallen, ohne dass Datenverluste auftreten (zur Erinnerung: RAID 3 bis 5 garantieren die Datensicherheit nur beim Ausfall von einem Laufwerk)

setzt häufig Hot Spare ein

aber deutlich langsamer bei Schreibzugriffen

Page 30: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

RAID 7

arbeitet ähnlich wie RAID 5

im RAID-Controller wird ein Echtzeitbetriebssystem eingesetzt

benutzt schnelle Datenbusse und mehrere Pufferspeicher, welche die Laufwerke von der Datenübertragung auf dem Bus abkoppeln und somit asynchron arbeiten

erreicht sehr hohe Performance

ähnlich wie bei RAID 6 werden die Paritätsinformationen auf mehreren Laufwerken gespeichert

Page 31: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Level Methode Sicherheit

0 Data StripingKeine! Datenstreifen über min. 2 Festplatten

verteilt

1 Data Mirroring 100%ige Redundanz durch Datenspiegelung

2Data Striping

+ Hamming Code Paritybitweises Striping mit Fehlerkorrektur-Code

(ECC) auf dedizierter Festplatte

3Data Striping

+ XOR Byte Level Paritybyteweises Striping mit XOR-Prüfsumme auf

dedizierter Festplatte

4Data Striping

+ XOR Block Level Parityblockweises Striping, sonst wie Level 3

5Data Striping + Interleave XOR

Block Level ParityWie Level 4, aber gleichmäßige Verteilung

der Parity auf alle Platten des Arrays

6Data Striping + Two Independend

XOR Interleave Block Level Parity

Wie Level 5, jedoch mit einem zusätzlichen Parity-Laufwerk und oft mit Hot Spare

7Properitär Storage Computer

Corporation (SCC)

wie Level 5, jedoch mit kontrollerunabhängigen I/O-Bus und eigenem

Echtzeitbetriebssystem

Page 32: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Das RAIDsche DreieckMacht den direkten Zusammenhangder drei Komponenten eines jedenRAID-Systems sichtbar.

Zu betrachten sind: der Preis die Geschwindigkeit und die Datensicherheit

Je nach Zweck werden Systeme zwarschneller, was aber dann zu Lasten derDatensicherheit geht (RAID 0).Dagegen sind Systeme mit einerhohen Datensicherheit teurer.In der Praxis erstellen sich große UNmaßgeschneiderte Einzellösungen auseinem Mix verschiedener RAID-Level.

Page 33: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Sichere Aufbewahrung

In der Forschung und Entwicklung werden oftmals nach Dienstschluss alle RAID-Festplatten aus dem System entnommen und an verschiedenen Orten gelagert.

Ein Diebstahl oder Datenmissbrauch wird dadurch nahezu unmöglich. Schließlich müssten in einer Nacht alle Platten, bis auf eine gestohlen werden um über die Daten zu verfügen.

Page 34: RAID-Systeme Sicherheit und Performance auf einem anderen Level TFH-Wildau - Telekommunikation / LAN - 19.05.2003 - Henrik Schwarz - I100

Fazit RAID-Systeme erhöhen die Sicherheit, Verfügbarkeit und

Geschwindigkeit Rechnersystemen deutlich, können aber keinen 100%igen Schutz vor Datenverlusten bieten

um eine Ausfallsicherheit nahe 100 Prozent zu erreichen, müssen alle Komponenten des RAID-Systems inklusive Controller, Netzteil und Lüfter redundant ausgelegt werden – ist aber sehr teuer

sie schützen nicht vor Überspannungen (USV sinnvoll), Über-schwemmungen oder Bränden, auch Viren und Würmer befallenRAID-Systeme ebenso gerne wie Einzellaufwerke

auch das zuverlässigste Array kann den Risikofaktor Nummer 1 nicht ausschalten: den Menschen. Er verursacht den größten Teil irreparabler Datenverluste und nicht die Technik. Gelöschte Dateien sind auch auf RAID-Systemen verloren

selbst für das ausgefeilteste RAID-System gilt deshalb: Den einzig wirklich zuverlässigen Schutz gegen Datenverluste bietet ein konsequent geplantes und vorgenommenes Backup!