Getty Images/iStockphoto
Basiswissen: Redundanz im Rechenzentrum
Redundanz ist eine Möglichkeit, Unterbrechungen zu minimieren und Kosten zu sparen. Erörtern Sie die Anforderungen an die Betriebszeit, wenn Sie Redundanz in Data Centers aufbauen.
Informationen und Betriebszeiten sind immer wertvoller geworden, was die Bedeutung der Redundanz von und in Rechenzentren erhöht.
Ausfälle sind kostspielig und werden mit der Zeit immer teurer. Daher müssen Unternehmen alles tun, um ungeplante Ausfallzeiten zu vermeiden. Die Redundanz von und in Rechenzentren ist einer der wichtigsten Faktoren, um dieses Ziel zu erreichen.
Was ist Redundanz im Rechenzentrum?
Redundanz im Rechenzentrum bedeutet, dass doppelte Komponenten verwendet werden, um den Betrieb nicht zu unterbrechen, wenn einige Komponenten ausfallen, und die Betriebszeit während der Wartung aufrechtzuerhalten. Da laut einer Studie des Uptime Institute aus dem Jahr 2022 43 Prozent aller Ausfälle in Rechenzentren auf Probleme mit der Stromversorgung zurückzuführen sind, gehören unterbrechungsfreie Stromversorgungen (USVs) und Generatoren zu den häufigsten Elementen für Redundanz. Kühlsysteme sind eine weitere Komponente, die häufig gesichert werden muss, da ihr Ausfall zu kritischen Problemen führen kann.
Warum Redundanz im Rechenzentrum wichtig ist
Die Redundanz in Rechenzentren bedeutet zwar höhere Ausgaben für Hardware, doch die steigenden Kosten für Ausfallzeiten im Rechenzentrum rechtfertigen die höheren Vorlaufkosten. Im Jahr 2019 kostete eine einzige Stunde Ausfallzeit eines Unternehmensservers für 25 Prozent der Unternehmen zwischen 301.000 und 400.000 US-Dollar, so Statista in einer Studie aus dem Jahr 2022. Für viele Unternehmen sind die Kosten sogar noch höher, und sie werden weiter steigen, da Datenzugriff und Cloud-Dienste eine zentrale Rolle in einem Unternehmen spielen.
Redundanz minimiert die Wahrscheinlichkeit, dass ein Unternehmen in diese hohen Kosten gerät, hilft Firmen, sich schneller von Störungen zu erholen, und hält die Infrastruktur im Falle von Ausfällen am Laufen. Redundanz kann Unternehmen auch dabei helfen, Service-Level-Vereinbarungen einzuhalten.
Viele Unternehmen sammeln und analysieren immer mehr Daten, weil sie damit ihre Entscheidungsfindung verbessern, Abläufe rationalisieren oder Kundenbindungen stärken. Dieser Trend führt jedoch dazu, dass Unternehmen über beträchtliche Mengen an sensiblen Daten verfügen, was im Falle einer Datenschutzverletzung rechtliche und ethische Bedenken aufwirft. Redundanz trägt dazu bei, dass Datentechnologien auch bei einem Ausfall einiger Komponenten ordnungsgemäß funktionieren und weniger Angriffsflächen für solche Verstöße bieten.
Redundanzstufen für Rechenzentren
Die Redundanz in Rechenzentren kann in verschiedenen Stufen erfolgen. Unternehmen, die fundierte Entscheidungen über ihre Rechenzentrumsarchitektur treffen wollen, müssen diese Stufen und ihre Bedeutung verstehen.
Die Redundanzstufen basieren auf dem Konzept von N, das heißt der Mindestinfrastruktur, die für den Betrieb eines Rechenzentrums mit voller Kapazität erforderlich ist. Wenn ein Rechenzentrum beispielsweise vier USV-Einheiten für den Betrieb benötigt, entspricht N vier Einheiten. N gilt auch für andere Komponenten, wie Kühlsysteme, Netzwerksysteme, Speichersysteme oder Server.
Die niedrigste Redundanzstufe ist N+1, was bedeutet, dass ein Rechenzentrum über eine zusätzliche Komponente verfügt. Eine N+2-Architektur bietet zwei redundante Komponenten für einen bestimmten N-Wert.
N+1 ist eine häufigere Architektur als N+2, da sie Redundanz ermöglicht und die Hardwarekosten gering hält. Viele Unternehmen bevorzugen N+1 aus Gründen dieser Kosteneffizienz, da sie weniger Hardware kaufen müssen.
2N steht für hundertprozentige Redundanz, bei der die Rechenzentren über ein identisches Backup ihrer benötigten Komponenten verfügen. In einem Rechenzentrum, in dem N die Anzahl der USV-Einheiten ist, bedeutet 2N, dass doppelt so viele vorhanden sind. Einige Architekturen gehen sogar noch weiter und bieten 2N+1, was einer vollständigen Sicherung plus einer weiteren Komponente entspricht.
Rechenzentrumsebenen (Data Center Tiers)
Das N-System ist eine hilfreiche Methode zur Messung der Redundanz, aber in der Praxis geht es beim Erreichen einer maximalen Betriebszeit um mehr als das einfache Hinzufügen von Komponenten. Das Uptime Institute hat ein Tier-System entwickelt, um die für den Betrieb von Rechenzentren erforderliche Infrastruktur zu erklären.
Es gibt vier Hauptkategorien.
Tier-I-Rechenzentren
Rechenzentren der Stufe I sind die einfachsten. Diese Einrichtungen verfügen über eine ausreichend redundante Infrastruktur für einen effizienten Betrieb, benötigen jedoch mehr Redundanzen. Sie können Unterbrechungen durch menschliches Versagen verkraften, nicht aber einen unerwarteten Ausfall und müssen für Wartungsarbeiten abgeschaltet werden.
Tier-II-Rechenzentren
Ein Tier-II-Rechenzentrum verfügt über ein redundantes Kühl- und Stromversorgungssystem und bietet eine längere Betriebszeit. Mitarbeiter können Komponenten ausbauen, ohne das Rechenzentrum abzuschalten, aber bei größeren Ausfällen ist die Anlage immer noch offline.
Tier-III-Rechenzentren
Rechenzentren der Stufe III gewährleisten Redundanz für jede Komponente in der Einrichtung. Ein Ausfall an einem beliebigen Punkt hat keine Auswirkungen auf den Betrieb des Rechenzentrums. Abschaltungen sind nicht erforderlich, um Geräte zu ersetzen oder zu warten.
Tier-IV-Rechenzentren
Rechenzentren der Stufe IV stehen für maximale Betriebszeit. Diese Einrichtungen verfügen über mehrere unabhängige und isolierte Sicherungssysteme, die ein Redundanzniveau von 2N oder 2N+ erfordern. Ausfallzeiten sind in diesen Rechenzentren unwahrscheinlich, ihre Wartung ist jedoch kostspielig.
Tipps für die Wahl der richtigen Redundanzstufe für Rechenzentren
Jedes Unternehmen, das auf den Betrieb von Rechenzentren angewiesen ist, benötigt Redundanz, aber die Anforderungen variieren je nach Situation. Entscheiden Sie, welches Niveau das Unternehmen benötigt, und berücksichtigen Sie dabei das IT-Budget des Unternehmens. Denken Sie an die Kosten möglicher Ausfallzeiten, da diese sehr kostspielig sein können.
IT-Teams sollten auch ihre Risikotoleranz berücksichtigen. Unternehmen mit wenig sensiblen Daten oder solchen, bei denen Cloud-Umgebungen nicht unternehmenskritisch sind, können sich ein höheres Risiko leisten, so dass eine N+1-Architektur wahrscheinlich ausreichend ist. Firmen, die sich stärker auf die Cloud verlassen oder in stärker regulierten Branchen tätig sind, benötigen jedoch möglicherweise mehr Redundanz.
Berücksichtigen Sie bei diesen Entscheidungen die gesetzlichen Bestimmungen und die Sicherheit. Einige Vorschriften können eine höhere Betriebszeit erfordern. Ebenso sollten Unternehmen, die größeren Risiken im Bereich der Cybersicherheit ausgesetzt sind, eine höhere Redundanz anstreben, um Cyberangriffe abzuschwächen. Unabhängig von der Stufe eines Unternehmens können automatisierte Überwachungs-Tools die Reaktion auf Vorfälle beschleunigen und so Ausfallzeiten verhindern.