Krisztin - stock.adobe.com
Was verschiedene RAID-Konfigurationen in der Praxis bieten
Die verfügbaren RAID-Level bieten unterschiedliche Performance und Kapazitäten. Ein Test von Toshiba vergleicht die Leistungsmerkmale verschiedener RAID-Level und Systeme.
Geht es um RAID-Systeme, stehen Anwender vor der Entscheidung, welche RAID-Level sie konfigurieren sollen. Für kleinere Systeme mit zwei bis vier Laufwerken, wie sie bei Privatanwendern und kleinen bis mittleren Büros und Unternehmen eingesetzt werden, kommen typischerweise RAID 1, 5 oder 10 infrage. Ein Labortest von Toshiba zeigt, welche Leistung dedizierte NAS- und DAS-Systeme sowie Server mit RAID-Controller und Software-defined Storage in unterschiedlichen Konfigurationen liefern.
RAID-Systeme erfreuen sich nicht nur in Unternehmen, sondern auch Bürogemeinschaften und Privathaushalten großer Beliebtheit, da sie eine höhere Ausfallsicherheit und Performance als einzelne Festplatten bieten. Zumindest in der Theorie ist auch klar, welche Vor- und Nachteile die gebräuchlichsten RAID-Konfigurationen aufweisen.
Ein RAID 5 verteilt die Datenblöcke und Paritätsinformationen über alle zur Verfügung stehenden Laufwerke, wobei in einem System mit vier HDDs aus jeweils drei Stripes von drei HDDs eine Parität errechnet und auf der vierten HDD gespeichert wird. Dadurch stehen 75 Prozent der Gesamtkapazität tatsächlich für Daten bereit – bei vier Laufwerken à 4 TB also 12 TB. Fällt eine Festplatte aus, lässt sich deren Inhalte aus den Informationen der drei verbleibenden Festplatten rekonstruieren. Den Ausfall einer zweiten Festplatte verkraftet ein RAID 5 nicht. Da Daten von drei Laufwerken parallel gelesen werden können, sind die Lesegeschwindigkeiten hoch. Geschrieben wird zwar ebenfalls parallel auf drei Laufwerken, doch das Berechnen und Schreiben der Paritäten geht zulasten der Schreibperformance.
Ein RAID 10 mit vier HDDs hingegen spiegelt die Daten von jeweils zwei Festplatten auf zwei weitere Festplatten, sodass zwei RAID 1 entstehen, die in einem RAID 0 stecken – deren Daten also über die Paare hinweg gestript werden. Dadurch steigt die Verfügbarkeit gegenüber RAID 5: Es können sogar zwei Laufwerke ausfallen, solange sie sich in verschiedenen RAID-1-Paaren befinden. Die Lesegeschwindigkeiten sollten ebenfalls hoch sein, da von allen vier Festplatten parallel gelesen werden kann. Das Schreiben ist allerdings nur auf zwei Festplatten parallel möglich. Zudem haben die hohe Verfügbarkeit und Leseperformance ihren Preis: Durch das Spiegeln stehen nur 50 Prozent der Gesamtkapazität zur Verfügung – bei vier Laufwerken à 4 TB sind es 8 TB.
Als kostengünstige Alternative zu diesen Konfigurationen mag ein RAID 1 mit nur zwei HDDs der doppelten Kapazität attraktiv erscheinen. Es stellt dieselbe Kapazität wie ein RAID 10 zur Verfügung und bietet durch die Spiegelung der Daten ebenfalls Ausfallsicherheit. Doch wie schlägt sich ein solches RAID 1 in Sachen Lese- und Schreib-Performance gegen RAID 5 und 10? Und welchen Durchsatz erreichen diese überhaupt in der Praxis? Antworten liefert ein Labortest von Toshiba.
Verschiedene RAID-Systeme im Vergleich
Für den Test wurden Server mit den RAID-Controllern Broadcom MegaRAID 9560-8i und Microchip Adaptec SmartRAID 3204-8i bestückt. Da viele Server leistungsstark genug sind, um RAIDs ohne dedizierten Hardware-Controller zu verwalten, wurde ein System zudem mit Open-E JovianDSS als Software-RAID auf Basis des Dateisystems ZFS eingerichtet. Darüber hinaus kamen ein Qnap-NAS TS-464 und ein RD3640SU3, ein über USB verbundenes DAS-System (Direct Attached Storage) von Icy Box, zum Einsatz. Sie alle wurden mit vier Enterprise-HDDs von Toshiba ausgestattet, dem Modell MG08ADA400E mit 4 TB, und zunächst als RAID 5 konfiguriert. Nachdem dieses mit 6 TB Daten gefüllt war, wurde die Leistung beim sequenziellen Schreiben und Lesen mit 1-MB-Blöcken sowie bei gemischten Schreib/Lese-Workloads mit unterschiedlichen Block-Größen ermitteln – sowohl im Standard-Betrieb als auch nach dem simulierten Ausfall eines Laufwerks und während des RAID-Rebuilds.
Die Messungen wurden dann in einer RAID-10-Konfiguration mit ebenfalls vier 4-TB-HDDs und in einer RAID-1-Konfiguration mit zwei 8-TB-HDDs (MG08ADA800E) wiederholt.
Die Leistung hängt vom Controller ab
In Servern mit RAID-Controller liegen die sequenziellen Schreibgeschwindigkeiten von RAID 5 deutlich über denen von RAID 10, da auf drei und nicht nur auf zwei Laufwerke geschrieben werden kann. Beim sequenziellen Lesen hängt die Performance indes vom Controller ab: Während der Microchip-Controller im RAID 5 höhere Lese- als Schreibraten liefert, ist der Broadcom-Controller beim Lesen nicht schneller als beim Schreiben. Im RAID 10 hingegen übertrifft die Leseleistung bei beiden die Schreibleistung, wobei Microchip signifikant höhere Leseraten bietet. Bei gemischten Workloads sinkt die Performance drastisch und das RAID 10 hat die Nase vorn.
Aus Performance-Sicht lohnt ein RAID 1 mit größeren Festplatten nicht, da es bei sequenziellen Arbeitslasten durchweg hinter RAID 5 und 10 liegt und nur bei gemischten Workloads einigermaßen mit RAID 5 mithalten kann. Vor allem beim Schreiben werden die Beschränkungen sichtbar, denn durch die Spiegelung werden Daten nur auf ein Laufwerk geschrieben.
Fällt eine Festplatte aus, stehen die Daten in allen drei RAID-Konfigurationen weiterhin zur Verfügung, allerdings sinkt die Leseleistung, während die Schreibleistung gleichbleibt. Diese sinkt erst beim RAID-Rebuild – wie stark, hängt von der Konfiguration des Controllers ab. Hat der Rebuild eine hohe Priorität, geht er schneller vonstatten und die Schreib/Lese-Performance ist deutlich niedriger als bei einem Rebuild mit niedriger Priorität. In diesem Fall kann der Neuaufbau des RAIDs einige Stunden länger dauern. Insbesondere bei RAID 1 und 5 ist das eine kritische Phase, da in dieser Zeit keine weitere Festplatte ausfallen darf, damit es nicht zu Datenverlusten kommt.
Das Software-RAID liegt bei sequenziellen Lasten auf einem ähnlichen Leistungsniveau wie Systeme mit Hardware-Controller und ist auch nach einen Festplattenausfall sowie während des RAID-Rebuilds relativ flott. Lediglich bei gemischten Workloads fällt es klar ab, was sich allerdings durch den Einbau einer kleinen SSD als Cache beheben lässt. Bei der Wiederherstellung des RAIDs bietet die Software-Variante einen Geschwindigkeitsvorteil, da software-definierte Speicher die Datenmenge auf den Festplatten kennen und nur diese Daten auf der Ersatzfestplatte neu erstellen. Ein Hardware-RAID erstellt in der Regel die gesamte Festplatte neu, selbst wenn diese nur teilweise mit Daten gefüllt ist.
Die Schnittstelle kann zum Flaschenhals werden
Das NAS ist in allen Konfigurationen langsamer als Hardware-RAIDs, insbesondere bei gemischten Workloads, bei denen es ähnliche Leistungswerte wie das Software-RAID (ohne Cache) liefert. Bei sequenziellen Schreib- und Leseoperationen ist RAID 5 performanter, bei gemischten Arbeitslasten RAID 10.
Bei den sequenziellen Leistungswerten gilt es jedoch zu beachten, dass das Netzwerk-Interface des NAS zum Flaschenhals werden kann: Viele Systeme sind mit 1 GbE bestückt und dadurch auf einen Durchsatz von etwa 100 MB/s limitiert. Selbst mit 2,5 GbE lassen sich lediglich rund 250 MB/s übertragen und damit so viel, wie ein RAID 1 erreicht. Vier Festplatten in einem RAID 5 oder 10 sind in diesen Systemen nur sinnvoll, wenn der größere Speicherplatz von RAID 5 oder die höhere Ausfallsicherheit und Performance bei gemischten Arbeitslasten von RAID 10 gefragt sind. Um die sequenziellen Datenraten von 500 bis 700 MB/s zu nutzen, die diese Konfigurationen liefern, wird ein NAS mit 10 GbE benötigt.
Ähnlich sieht es bei DAS-Systemen aus, bei denen der USB-Host die Übertragungsgeschwindigkeit häufig begrenzt. Da inzwischen Festplatten mit 20 TB und mehr erhältlich sind, dürfte ein DAS mit zwei großen HDDs in einem RAID 1 daher in den meisten Fällen eine bessere Wahl sein als ein RAID 5 oder 10 mit vier kleineren HDDs.
Die Anforderungen der Anwendungen entscheiden
Für welche RAID-Konfiguration sich Unternehmen entscheiden sollten, hängt davon ab, welche Speicherkapazitäten sie benötigen und welche Performance-Anforderungen ihre Anwendungen haben. Datenbanken und virtualisierte Umgebungen produzieren üblicherweise viele zufällige Schreib- und Lesezugriffe, während Archivierung, Videoüberwachung und Streaming fast ausschließlich sequenzielle Zugriffe erfordern. Gemeinsame Laufwerke und Ordner für mehrere Nutzer weisen einen Mix aus zufälligen und sequenziellen Zugriffen aus, wobei die sequenziellen überwiegen, solange nicht mehrere Anwender gleichzeitig auf den geteilten Ressourcen arbeiten.
„Bei RAID-Systemen müssen Anwender entscheiden, welche RAID-Konfiguration sie nutzen wollen. Für kleinere Systeme mit zwei bis vier Laufwerken, wie sie bei Privatanwendern und kleinen bis mittleren Büros und Unternehmen eingesetzt werden, kommen typischerweise RAID 1, 5 oder 10 infrage. Unser Test verdeutlicht welche Leistung dedizierte NAS- und DAS-Systeme sowie Server mit RAID-Controller und Software-defined Storage in unterschiedlichen Konfigurationen liefern.“
Rainer W. Kaese, Toshiba Electronics Europe
Darüber hinaus gilt es mögliche Beschränkungen durch die Netzwerkinfrastruktur oder die Anbindung an den Host zu berücksichtigen sowie die Performance bei HDD-Ausfällen und die Dauer der RAID-Rebuilds. Grundsätzlich lässt sich jedoch feststellen, dass sich ein RAID 5 mit vier Laufwerken am besten für alle Arten von Speichersystemen eignet, bei denen der Großteil der Arbeitslast sequenzieller Natur ist. Es bietet zudem die höchste verfügbare Kapazität (75 Prozent) und die kürzesten Wiederherstellungszeiten, wenn eine HDD ausgetauscht werden muss.
Ein RAID 10 mit vier Laufwerken ist optimal für Arbeitslasten mit zufälligen oder gemischten Zugriffen ausgelegt, geht jedoch mit einer geringeren verfügbaren Kapazität von nur 50 Prozent einher. Solche Konfigurationen sind für lokale Server-Systeme mit Hardware- oder Software-RAID zu empfehlen, die allgemeine Workloads bewältigen müssen. Ein RAID 1 mit zwei Laufwerken der doppelten Kapazität lohnt eigentlich nur bei via USB an den Rechner angeschlossenen DAS-Systemen und bei kostengünstigen NAS-Systemen mit 1 GbE oder 2,5 GbE – wie sie allerdings auch heute noch in vielen Bereichen eingesetzt werden.
Natürlich gibt es noch weitaus mehr Möglichkeiten, ein RAID zu konfigurieren. Wenn die Verfügbarkeitsanforderungen hoch sind, ist beispielsweise ein RAID 6 eine gute Alternative, da es dank doppelter Paritätsinformationen den Ausfall von bis zu zwei Festplatten verkraftet. Optimalerweise stehen dafür aber mehr als vier Laufwerksschächte bereit, damit nicht die Hälfte der Speicherkapazität für die Paritäten verwendet wird und zum Schreiben und Lesen auf mehr als zwei Festplatten parallel zugegriffen werden kann.
Über den Autor:
Rainer W. Kaese arbeitet seit über 30 Jahren für Toshiba und ist Senior Manager, HDD Business Development bei Toshiba Electronics Europe. Er startete als Entwickler für ASICs, übernahm dann die Leitung des europäischen ASIC Design Centers und führte schließlich das Team für die Geschäftsfeldentwicklung der ASIC- und Foundry-Produkte. Heute ist er verantwortlich für die Einführung der Toshiba-Enterprise-Festplatten in Rechenzentren, Cloud-Umgebungen und Enterprise-IT-Systemen.
Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.