Getty Images/iStockphoto

Rechenzentrums-Tier und ihre Bedeutung für die Betriebszeit

Firmen sollten die vier unterschiedlichen Rechenzentrums-Tiers von Colocation-Anbietern für ihre eigenen RZs auf Basis ihrer Anforderungen an die Betriebszeit in Betracht ziehen.

Ausfallzeiten im Rechenzentrum können sehr kostspielig sein. Um Kunden und Mitarbeitern einen effektiven Service bieten zu können, muss die erforderliche Betriebszeit aufrechterhalten werden.

Wenn Sie Einrichtungen zum Hosten von Daten in Erwägung ziehen, sollten Sie die Betriebszeitstufen der Einrichtung prüfen. Die einfachen Tiers (zu deutsch: Stufen oder Ebenen) des Uptime Institute für Rechenzentren beschreiben, welche Gesamtverfügbarkeit ein Unternehmen durch das jeweilige technische Design einer Einrichtung gewährleisten sollte.

Die unterschiedlichen Ebenen in Rechenzentren

Es gibt vier Uptime-Levels. Jede Stufe muss die Fähigkeiten der vorhergehenden Stufe erfüllen oder übertreffen. Stufe I ist die einfachste und am wenigsten hochverfügbare Stufe, und Stufe IV ist die komplexeste und am meisten verfügbare.

Stufe I

Tier I oder ein einfaches Rechenzentrum verfügt über einen einzigen, nicht redundanten Stromverteilungspfad zur Versorgung von IT-Geräten mit nicht redundanten Kapazitätskomponenten, was zu einem Verfügbarkeitsziel von 99,671 Prozent Betriebszeit führt. In einer Tier-I-Einrichtung gibt es einen speziellen Raum für IT-Geräte und in der Regel eine unterbrechungsfreie Stromversorgung (USV), um kurze Ausfälle und Stromspitzen zu bewältigen.

Weitere Kapazitätskomponenten sind Kühlsysteme und ein Motorgenerator zum Schutz der Geräte vor längeren Stromausfällen. Jeder Ausfall einer Kapazitätskomponente führt in einem Tier-I-Rechenzentrum zu einer Ausfallzeit, ebenso wie eine planmäßige Wartung.

Stufe II

Ein Tier-II-Rechenzentrum verfügt über eine redundante Standortinfrastruktur mit redundanten Kapazitätskomponenten, was zu einer angestrebten Verfügbarkeit von 99,741 Prozent führt. Wie bei Tier I gibt es auch hier einen einzigen, nicht redundanten Stromverteilungspfad. Wenn eine redundante Komponente ausfällt, können Unternehmen mit einer kurzen Ausfallzeit manuell auf ein redundantes Element umschalten, und für geplante Wartungsarbeiten ist weiterhin eine Ausfallzeit erforderlich.

Tier-II-Rechenzentren verfügen über redundante Komponenten, darunter Energiespeicher, Stromerzeugungsanlagen am eigenen Standort, USV-Module, Kühleinheiten und Kraftstofftanks. Ungeplante Ausfälle oder Störungen von Komponenten mit nicht redundanter Kapazität oder des Stromverteilungspfads können dennoch Auswirkungen auf die Umgebung haben.

Abbildung 1: Die vier verschiedenen Rechenzentrumsebenen und ihre Merkmale im Kurzüberblick.
Abbildung 1: Die vier verschiedenen Rechenzentrumsebenen und ihre Merkmale im Kurzüberblick.

Stufe III

Ein Tier-III-Rechenzentrum oder ein gleichzeitig wartbares Rechenzentrum verfügt über Redundanzkomponenten und mehrere unabhängige Verteilungspfade zur Versorgung kritischer IT-Geräte. Es gibt mindestens zwei Stromversorgungen für alle IT-Geräte für Backups, und das Verfügbarkeitsziel liegt bei 99,982 Prozent Betriebszeit.

Unternehmen können jede Komponente in den Verteilungspfaden ausbauen und die redundante Kapazität nutzen, um geplante Wartungsarbeiten ohne Ausfallzeiten durchzuführen. Der Ausfall einer Kapazitätskomponente erfordert jedoch immer noch ein manuelles Umschalten auf eine redundante Komponente, was zu Ausfallzeiten führt.

Stufe IV

Tier-IV-Rechenzentren sind im Wesentlichen fehlertolerant. Sie verfügen über mehrere unabhängige und physisch isolierte Systeme, die redundante Kapazitäten bereitstellen. Die Kühlanlagen werden doppelt gespeist, und die vollständig fehlertolerante Architektur führt zu einer angestrebten Verfügbarkeit von 99,995 Prozent Betriebszeit.

Geplante Wartungsarbeiten und Ausfälle von Kapazitätskomponenten lösen ein automatisches Umschalten auf redundante Komponenten aus. Unternehmen können jede Komponente im Verteilungspfad zur Wartung ohne Ausfallzeiten entfernen. Potenzielle Geräteausfälle in Tier-IV-Rechenzentren sollten über Erkennungssysteme zur Aufrechterhaltung der Arbeitslasten verfügen.

In den meisten Fällen spiegeln die Kosten die Einstufung wider. Stufe I ist in der Regel die billigste, und Stufe IV ist in der Regel die teuerste. Eine gut implementierte, gut geführte Tier-III- oder Tier-IV-Einrichtung kann jedoch Kosten verursachen, die mit denen einer schlecht geführten Tier-I- oder Tier-II-Einrichtung vergleichbar sind.

Organisationen, die für ihre Einrichtungen mit einer bestimmten Stufe werben möchten, können sich vom Institut zertifizieren lassen.

So wählen sie den passenden RZ-Tier

Diese Uptime-Stufen spiegeln die Verfügbarkeitsziele für die Einrichtung wider - nicht unbedingt für die IT-Ausrüstung darin. Unternehmen müssen sicherstellen, dass die Architektur der ServerSpeicher- und Netzwerkgeräte sowie die externe Netzwerkanbindung ein ähnliches oder höheres Maß an Redundanz für die gesamte Plattform bieten, um die Anforderungen des Unternehmens zu erfüllen.

Die meisten Tier-III- und Tier-IV-Einrichtungen haben individuelle, interne Zielvorgaben, die keine ungeplanten Ausfallzeiten vorsehen; besprechen Sie dies bei Gesprächen mit möglichen Outsourcing-Anbietern oder bei der Planung Ihrer eigenen Einrichtung. Die Werte für die Betriebszeit scheinen eng beieinander zu liegen; eine Einrichtung der Stufe I lässt jedoch etwa 30 Stunden Ausfallzeit pro Jahr zu, während eine Einrichtung der Stufe IV weniger als 30 Minuten zulässt.

Berücksichtigen Sie die geschäftlichen Anforderungen, wenn Sie sich für eine Stufe eines Rechenzentrums entscheiden. Denken Sie an eine Zweigstelle mit einem zentralen Rechenzentrum für die meisten ihrer kritischen Anforderungen und einem kleinen Serverraum vor Ort für nicht kritische Arbeitslasten. Ein Tier-III-Rechenzentrum könnte für seine Bedürfnisse zu teuer sein, während eine Tier-I- oder Tier-II-Einrichtung sehr kosteneffizient wäre.

Tier-I- und Tier-II-RZs sind im Allgemeinen nicht für unternehmenskritische Arbeitslasten geeignet. Wenn Sie diese Einrichtungen nutzen müssen, stellen Sie sicher, dass ein Plan vorhanden ist, wie das Unternehmen während einer Ausfallzeit arbeiten kann.

Idealerweise sollten Sie kritische Arbeitslasten in Rechenzentren der Stufen III und IV unterbringen. Einrichtungen der Stufe III erfordern immer noch eine Reihe solider Verfahren für den Ausfall von Kapazitätskomponenten, und Unternehmen müssen diese Pläne regelmäßig testen. Auch bei Tier IV läuft nicht immer alles nach Plan. Eine einfache Architektur mit einfacher Redundanz - jede Kapazitätskomponente wird durch eine weitere gesichert - kann immer noch zu Unterbrechungen führen, wenn mehr als eine Kapazitätskomponente ausfällt.

Achten Sie bei der Prüfung von Colocation-Anbietern darauf, wie schnell der Betreiber des Rechenzentrums ausgefallene Komponenten ersetzt, damit die Redundanz schnell wiederhergestellt werden kann. Werden Ersatzkomponenten auf Lager gehalten, oder wird ein Lieferant beauftragt, innerhalb eines bestimmten Zeitrahmens einen Ersatz für den eigenen Standort zu beschaffen und zu installieren? Bei einer Tier IV-Einrichtung sollte dies in Stunden und nicht in Tagen gemessen werden.

Diese RZ-Tiers des Uptime Institute bieten zwar eine gute Grundlage dafür, was erforderlich ist, um eine Rechenzentrumseinrichtung mit den erforderlichen Verfügbarkeitsniveaus um die Kapazitätskomponenten herum zu schaffen, aber die Gruppe stellt keine Referenzdesigns zur Verfügung, zum Beispiel für Bereiche wie Doppelböden vs. feste Böden und Kühlung in Reihen vs. Warm-/Kaltgang.

 

Erfahren Sie mehr über Data-Center-Infrastruktur