pressmaster - stock.adobe.com

Auch bei SSDs ist RAID wichtig für Data Protection

RAID ist eine seit Jahrzehnten bewährte Methode für Data Protection. Auch im Zeitalter der Solid State Disks hat RAID nichts von seiner Bedeutung verloren.

Das Redundant Array of Disks (RAID) ist ein schon seit Jahrzehnten bewährtes Konzept zur Datensicherung. Es beruht auf einem einfachen Bausteinprinzip. Unterschiedliche Festplatten werden genutzt, um Daten über Striping und Mirroring zu verteilen. Wenn eine Platte ausfällt, werden über Parity Sets die Daten auf gesunden Medien wiederaufgebaut.

Aber was passiert nun im Zeitalter der Solid State Disk (SSD) mit RAID? Dazu werden wir uns nun die Angebote der großen Storage-Anbieter im Detail ansehen.

Allgemein gesprochen finden sich auf älteren All-Flash-Arrays, bei denen Festplatten einfach durch SSDs ersetzt wurden, unterschiedliche RAID-Stufen. Die Spannbreite reicht von RAID 1 bis 10 in allen möglichen Kombinationen von Mirroring, Striping und Parity.

Aber auf den neueren All-Flash-Arrays haben sich RAID 5 und 6 als mehrheitsfähig etabliert, wobei manche Hersteller auf eigene Konzepte setzen. NetApp führt sogar ein Triple Parity RAID ein. Aber zurück zu den Grundlagen.

Die Fundamente von RAID

RAID gibt es in verschiedenen Versionen, aber sie bauen alle auf Kombinationen verschiedener Charakteristiken auf der Basis von Striping (wobei dies eher höhere Zugriffsgeschwindigkeit als Data Protection bringt), Mirroring und Parity auf.

Disk-Mirroring, auch als RAID 1 bezeichnet, ist die Replikation von Daten auf zwei oder mehr Laufwerken. Es ist eine gute Wahl für Anwendungen, die hohe Performance und hohe Verfügbarkeit erfordern, etwa Anwendungen für Transaktionen und E-Mail oder Betriebssysteme.

RAID 10 dagegen ist auch als RAID 1+0 bekannt und kombiniert die RAID-Verfahren RAID 1 und RAID 0. Genauer gesagt werden hier Festplatten-Striping und Datenspiegelung miteinander verbunden, um hohen Datenschutz und gleichzeitig gute Performance zu erreichen. Ein RAID-10-Verbund benötigt mindestens vier Festplatten. Die Daten werden über gespiegelte Plattenpärchen verteilt (gestriped). So lange eine Festplatte eines Paars funktioniert, so lange sind auch die Daten verfügbar. Fallen beide Disks eines Paars aus, so entsteht Datenverlust, da keine Paritätsinformationen in diesem Set liegen.

Der hauptsächliche Nachteil von RAID 1 ist der verbrauchte Festplattenplatz. Das gilt natürlich auch für RAID 10. Der RAID-Overhead ist, dass Sie die doppelte Kapazität des nutzbaren Storage kaufen müssen. Wollen Sie zum Beispiel 300 GByte an Daten speichern, müssen Sie 600 GByte erwerben.

Bei einem RAID 5 mit fünf Festplatten sind vier Fünftel der Kapazität tatsächlich nutzbar. Die Daten verteilen sich auf die fünf Festplatten. Dass man nicht die Kapazität von fünf Datenträgern zur Verfügung hat, liegt daran, dass man Paritäten auf die Festplatten verteilt. RAID 5 bietet also höhere Kapazität als RAID 1 oder 10, ist aber langsamer bei I/O-Operationen.

RAID 6 bietet noch bessere Data Protection als RAID 5 wegen der zusätzlichen Parität. Das bedeutet, hier werden zwei Parity-Stripes auf jeder Platte verwendet. Damit kann der Ausfall von zwei Festplatten abgefangen werden, ohne dass ein Datenverlust zu befürchten ist.

Ein Stripe Set ist die Zahl der Platten, auf die Daten geschrieben werden. Bei einem größeren Stripe Set werden die Daten auf mehr Festplatten geschrieben und die I/O-Geschwindigkeit wird erhöht.

Allerdings wächst bei größeren Stripe Sets auch die Fehleranfälligkeit und bei einem Rebuild kann es wegen unlesbarer Sektoren zu Problemen kommen. Außerdem erhöht sich die für einen Rebuild benötigte Zeit, wenn die Kapazität anwächst.

RAID hat sich im Laufe der Zeit weiterentwickelt. Neue Methoden zur Data Protection bauen auf RAID auf, verteilen aber Daten und Parity Informationen auf andere Arten.

Ist also RAID im Zeitalter der SSD überhaupt noch relevant? Die kurze Antwort lautet ja, denn trotz aller Unterschiede zu Festplatten fallen auch SSDs aus. Dass bestimmte Teile versagen, kann immer passieren und irgendwann schlägt die begrenzte Zahl der I/O-Schreiboperationen zu.  

Deshalb ist Data Protection nach wie vor nötig und die Anbieter von Flash-Laufwerken haben ihre proprietären RAID-Varianten entwickelt.

Anbieterübersicht

Dell EMC bietet die Arrays VMAX, Unity und SC Series als All-Flash oder hybrides Flash. Sie alle nutzen Standard RAID Stufen. RAID 5 und 6 kommt in VMAX zum Einsatz. Mögliche Konfigurationen sind 7 +1 Parity Disk, 3+1, 6+2 und 14+2. 

Bei den Unity und SC Series Arrays gibt es Raid 5 und 6 plus Raid 10, oder Raid 1/0 in der Nomenklatur von Dell EMC. 

Bei All-Flash XtremIO kommt die Data Protection Methode XDP (Xtremio Data Protection) zum Einsatz, eine sogenannte „modifizierte RAID 6 Variante mit diagonaler Parität“.

Die Fujitsu Eternus All-Flash-Arrays gibt es die auf den Mittelstand ausgerichtete AF250S2, die bis zu 737 TB skaliert sowie die für Großkunden geeignete AF650S2, die bis zu 3 PB erreicht. Die verfügbaren RAID-Stufen sind 0, 1, 10, 5 sowie für Parity Striping RAID 50.   

Bei der Hewlett Packard Enterprise (HPE) 3PAR-StoreServ-SAN-Plattform gibt es drei Modelle, die in den Petabyte-Bereich skalieren. Alle können als All-Flash, hybrid oder nur Festplatten konfiguriert werden.

Anfang 2017 hat HPE Nimble Storage gekauft. Die Nimble Arrays gibt es in drei Ausbaustufen von wenigen TBs bis zu einigen hundert TBs. Nimble verwendet Triple-Parity RAID mit Verfügbarkeit von sechs Neunen.

Die Hitachi Vantara F-series All-Flash Arrays gibt es in vier Modellen, die bis zu 2.300 Laufwerke aufnehmen können. Unterstützt wird RAID 5, 6 und 10.

Die NetApp All-Flash FAS Arrays bieten RAID DP (hauseigene Variante von RAID 6) oder RAID TEC (Triple Erasure Coding). Letzteres ist eine Funktion des Betriebssystems ONTAP 9 und ermöglicht, dass eine dritte Parity Disk Sicherheit und Geschwindigkeit eines Rebuilds gewährleistet. Die NetApp EF Arrays nutzen RAID 0, 1, 5, 6 und 10.

NetApp hat 2016 SolidFire übernommen. Die SolidFire Arrays nutzen eine Helix Data Protection unter Verzicht auf RAID. Dabei werden jeweils zwei Kopien der Daten über Knoten im Cluster verteilt.

IBM bietet FlashSystem und Storwize All-Flash Arrays sowie die DS8880F-Produkte. FlashSystem V900 skaliert bis zu 2PB mit RAID 5 sowie 3D TLC NAND.

IBM offeriert das sogenannte Variable Stripe RAID, die defekte Daten auf dem NAND Chip auf intakte Zellen verlagert. Diese Funktion in Verbindung mit RAID 5 heißt Two Dimensional RAID.

Die IBM Storwize Arrays unterstützen RAID 0, 1, 5, 6 und 10. IBM DS8880F Series All-Flash-Arrays können mit RAID 5, 6 und 10 Kapazitäten von 1 PB erreichen.

Das Kaminario K2 All-Flash-Array kann K-Blocks mit bis zu 4 PB aufnehmen und bietet duale Parität mit der K-RAID-Methode.

Das Pure Storage FlashArray//M gibt es in unterschiedlichen Größen von einigen Dutzend TB bis zu 1 PB. Pure setzt auf das hauseigene RAID HA mit dualer Parität, eine Variante von RAID 6.

Die Western Digital Tegile IntelliFlash Arrays bieten Block- und File-Zugang in Knoten von hunderten TB bis zu 2 PB. Die Datenblätter sind etwas unklar, aber es ist von verschiedenen Optionen für RAID/Mirroring die Rede mit dualer Parität und Zwei-/Drei-Wege-Mirroring.

Die Tintri EC Series skaliert bis zu Dutzenden PBs. Tintri T1000 ist das Angebot für Zweigstellen. Bei Tintri gibt es nur RAID 6 mit dualer Parität.   

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

RAID: Die unterschiedlichen Typen und ihre Vorteile

VMware NSX soll wie RAID Array wirken

Storage-Evolution: RAID, Cloud und Objektspeicher

Erfahren Sie mehr über Flash Storage und SSD