carloscastilla - Fotolia

Tipp

Im Design virtueller Infrastruktur Fehlertoleranzen planen

Lieber zu früh als zu spät: Berücksichtigen Sie schon beim Entwurf virtueller Infrastrukturen möglicherweise auftretende Fehler und planen Sie vorab, was dann passiert.

von

Brian Kirsch, Milwaukee Area Technical College

Zuletzt aktualisiert: 05 Sept. 2018

Der Entwurf virtueller Infrastrukturstruktur verlangt von Administratoren, die Möglichkeit auftretender Fehler vorherzusehen und dieses Fehlerpotenzial in den Planungsprozess einzubeziehen.

Dazu gehört natürlich die Berücksichtigung aller möglichen Ausfälle. Daraus ergibt sich, dass Hosts separiert werden, Distributed Resource Scheduler (DRS) korrekt platziert werden, Regeln für Hochverfügbarkeit (High Availability, HA) verfügbar sind und redundante Verbindungen zu Netzwerk- und Speicherressourcen etabliert sind.

Plattformen mit konvergenter Infrastrukturstruktur sind heutzutage der wohl größte Wandel einer modernen Infrastrukturstruktur im Rechenzentrum. Dies bedeutet nicht nur Vorteile, sondern auch neue Anforderungen an den Entwurf der virtuellen Infrastrukturstruktur. Diese Plattformen bilden eine Brücke zwischen der Dichte von Blade-Servern und Single-Host-Plattformen. Sie vereinen Netzwerk, Rechenleistung und Speicher in einem Frame, was nicht nur zu größerem Komfort, sondern auch zu größerer Systemanfälligkeit führt.

Wie auch bei Blade-Servern müssen Sie jederzeit mit dem Verlust einer vollständigen Plattform rechnen, statt nur dem Ausfall eines einzelnen Blades. An dieser Stelle wird es etwas komplexer. Denn in einer konvergenten Infrastruktur ist Speicher ein Teil der Plattform selber, die Auswirkungen eines Chassis-Fehlers können daher die reinen Verluste an Rechenkapazität weit überschreiten. Datenrettungstechnologien arbeiten herkömmlich am besten mit Speicher außerhalb der zentralen Virtualisierungs-Umgebung. Bei konvergenten Plattformen jedoch stellt Speicher einen Teil der abgeschlossenen Infrastruktur dar und eröffnet deswegen ein neues Feld für Fehlermöglichkeiten.

Administratoren sind sich mitunter nicht einig, ob nur ein Node einer Plattform oder der ganze Frame ausfällt. In der Marketing-Sprache der Verkäufer heißt es dazu gerne, Backplanes seien passiv und daher zu einem Ausfall gar nicht in der Lage. Aber realistisch gesehen können auch passive Blades Probleme verursachen, die dann das komplette Herunterfahren eines Frames und aller Blades erforderlich machen, um das System wieder auf die Beine zu bringen. Betrifft dies dann Hosts für die Virtualisierung, so sind die Auswirkungen erheblich.

Zugegeben, das ist selten. Trotzdem lässt sich die Aussage, irgendein System sei gegen Fehler immun, zumindest in Konzernumgebungen definitiv nicht aufrechterhalten. Das Design virtueller Infrastrukturen, insbesondere bei der Verwendung konvergenter und hyperkonvergenter Infrastrukturen, erfordert das Verständnis, dass alles ausfallen kann.

Neue Herausforderungen für den Entwurf virtueller Infrastruktur

Konvergente und hyperkonvergente Infrastrukturen haben einen deutlichen Vorteil gegenüber herkömmlichen Blades, denn sie weisen eine reduzierte Dichte auf. Deren Vorteil für Sie liegt darin, dass Sie Ihre Hardwaredichte gegen Workload-Platzierungen abwägen können.

Konvergente Produkte sind in der Regel in einer Dichte von einem, zwei oder vier Rechen-Nodes pro Frame erhältlich. Wichtige Faktoren sind Stromversorgung und Kühlung, denn diese Frames sind in Bezug auf die Anforderungen an die Stromversorgung im Rechenzentrum alles andere als leichtgewichtig.

Der verteilte Ansatz bedeutet im Anwendungsentwurf, dass der monolithische Stack in den Hintergrund rückt.

Ebenso ist zu berücksichtigen, ob genug Nodes zur Verfügung stehen, um die virtuellen Workloads in einem konvergenten Frame der Infrastruktur zu verteilen. Dabei sollten Sie allerdings auch die Anzahl der Frames kennen. Auch wo die Möglichkeit bestehen sollte, dass alles auf ein paar konvergente Plattformen mit vier Nodes passen könnte, sollten Sie Ihre Recovery-Anforderungen nicht vergessen. Denn diese könnten durchaus erfordern, dass Sie sich für eine Dichte von zwei Nodes pro Frame entscheiden. Diese Entscheidung hängt zusätzlich auch vom Speicherbedarf ab. Sie müssen also letztlich Storage-I/O und -Kapazität mit der Anzahl der Nodes und Frames für Anwendungen in Einklang bringen.

Viele der verteilten Entwurfsdienste, wie etwa konvergente und hyperkonvergente Infrastruktur oder auch Speichertechnologien wie VMware SAN, verlangen ein Umdenken in Bezug auf die Platzierung von Anwendungen und den Entwurf der virtuellen Infrastruktur. Dies birgt einige Komplexität in sich, ist dank moderner Anwendungsarchitektur aber zum Glück letztlich doch einfacher, als es klingt.

Der verteilte Ansatz bedeutet im Anwendungsentwurf, dass der monolithische Stack in den Hintergrund rückt. Zwar erübrigt die Integration des Speichers viele der traditionellen Komplexitäten im Bereich der Konnektivität und bietet darüber hinaus sogar Kostenvorteile. Erkauft wird dies aber mit einer größeren Abhängigkeit von einer sauberen Konstruktion der Fehlerregeln.

Recovery-Regeln von DRS und HA brauchen nach einem Umzug auf eine konvergente Plattform sogar noch mehr Aufmerksamkeit. Allerdings können sie nicht alle Probleme lösen, denn der Speicher ist ja nicht zentralisiert. Zwar könnte man den Speicher in den Hintergrund verlagern, dagegen spricht aber die verringerte Effizienz. Letztlich geht es also wieder um die Interaktion und Platzierung der Anwendungen.

Dafür ist nicht nur ein Verständnis darüber erforderlich, wie eine Anwendung arbeitet und wie ihre einzelnen Bestandteile interagieren. Auch die Anforderungen an die Infrastruktur sind relevant. Dies zieht sich von der Auslieferung bis hin zu Active-Directory-Komponenten für die Autorisierung.

Eine verteilte Infrastruktur kann positive Wirkung auf Kosten und Komplexität haben. Sie bringt aber auch zusätzliche Herausforderungen mit sich. Kaum jemand spricht offen über den Ausfall passiver Komponenten oder die Folgen eines großflächigen Ausfalls. Versuchen Sie nicht, dass Thema zu umgehen, indem Sie so tun, als würden diese Dinge schon nicht eintreten. Sprechen Sie offen darüber. Denn in der IT passiert doch ständig das eigentlich Undenkbare. Natürlich, die perfekte Lösung gibt es nicht. Ein solider Entwurf Ihrer virtuellen Infrastruktur, der die Möglichkeit von Ausfällen in jedem Punkt berücksichtigt, kann Ihnen im Notfall konkurrenzlos schnell den richtigen Weg weisen.

Folgen Sie SearchDataCenter.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Auf dem Weg zum Mainstream: hyperkonvergente Infrastrukturen

Netzwerkdesign für hyperkonvergente Infrastruktur erfordert Umdenken

Vorteile konvergenter Infrastruktur

Im Design virtueller Infrastruktur Fehlertoleranzen planen

Lieber zu früh als zu spät: Berücksichtigen Sie schon beim Entwurf virtueller Infrastrukturen möglicherweise auftretende Fehler und planen Sie vorab, was dann passiert.

Neue Herausforderungen für den Entwurf virtueller Infrastruktur

Nächste Schritte

Erfahren Sie mehr über Data-Center-Infrastruktur

FCoE (Fibre Channel over Ethernet)

Konvergente Infrastruktur (Converged Infrastructure)

Wie unterscheiden sich Rack- und Blade-Server-Formfaktoren?

Pure Storage FlashBlade//S: Funktionen und Funktionsweise