Getty Images
Wie man einen Ausfall von Cloud-Diensten überlebt
Ausfälle sind zwar selten, aber sie sind nie billig – jede Ausfallzeit kostet Geld. Erfahren Sie, wie Sie die Risiken minimieren und einen Ausfall von Cloud-Diensten überleben.
Einer der Hauptvorteile der Cloud ist, dass sie selten ausfällt. Cloud-Rechenzentren werden in erdbebensicheren Gebieten aufgebaut, in denen Überschwemmungen und Naturkatastrophen nicht üblich sind. Es ist zwar unwahrscheinlich, dass ein externes Problem eine Cloud außer Gefecht setzt, aber ein Konfigurations- oder Serviceproblem, das einen Ausfall verursacht, ist möglich.
Normalerweise gibt es viele Sicherheitsvorkehrungen gegen Hardwareausfälle, so dass die Wahrscheinlichkeit extrem gering ist. Aber selbst ein Ausfall von ein paar Minuten ist schwer zu verkraften. Vor allem, wenn Sie sich mitten in einem Ausfall befinden und nicht wissen, wann Sie wieder online sein werden. Befolgen Sie diese Tipps, um einen Ausfall von Cloud-Diensten zu überstehen.
Verstehen Sie Ihre SLAs
Prüfen Sie zunächst, was in den Service Level Agreements (SLA) für das Produkt oder den Dienst, den Sie nutzen, steht. Veröffentlichte SLAs gelten nicht für alles, sie werden in der Regel von jedem Dienst erstellt, damit der Cloud-Anbieter für die Dienste mit den höheren SLAs werben und die mit niedrigeren SLAs in den Hintergrund drängen kann.
Wenn Sie eine Sammlung von SLA-Werten von Anbietern erhalten, legen Sie für Ihre Gesamt-SLA den niedrigsten SLA-Wert aller Ihrer Dienste zugrunde. Dieser Wert bildet die Grundlage für Ihren Software-Stack. Denken Sie daran, dass, wenn ein Dienst in Ihrer Umgebung offline ist, Ihre Anwendung auch komplett offline sein kann. Es spielt keine Rolle, dass nur ein Dienst ausgefallen ist und alles andere noch läuft, denn wenn Ihre Anwendung diesen Dienst benötigt, um vollständig zu sein, sind Sie offline.
Betriebszeit
In SLAs wird oft angegeben, dass etwas zu 99 Prozent, 99,9 Prozent oder 99,95 Prozent online ist. Das mag zwar nicht wie ein großer Wertunterschied erscheinen, aber die tatsächliche Zeit dieser Werte summiert sich.
Ein SLA von 99,9 Prozent entspricht im Durchschnitt einer Minute und 26 Sekunden pro Tag. Jährlich sind das im Durchschnitt acht Stunden und 41 Minuten. Diese Ausfälle werden höchstwahrscheinlich an einem kritischen Tag auftreten, wenn Sie es sich am wenigsten leisten können. Wenn Sie zum Beispiel ein Einzelhandelsunternehmen sind, kann sich ein Ausfall am Black Friday nachteilig auswirken.
Wenn Sie von 99,9 Prozent auf 99,99 Prozent online gehen, sinkt die Ausfallzeit auf 8,6 Sekunden pro Tag und 52 Minuten pro Jahr. Dieser Unterschied in der Ausfallzeit ist mit einem enormen Kostenunterschied verbunden. Management- und Buchhaltungsteams können auf ein niedrigeres SLA im Bereich von 99 Prozent oder 98 Prozent drängen, um Geld zu sparen, ohne sich darüber im Klaren zu sein, dass die Ausfallzeiten in diesen Fällen auf lange Sicht kein Geld sparen. Wägen Sie die Kosten mit dem Wissen ab, wie viel Ausfallzeit Sie eliminieren werden.
Was bekommen Sie, wenn der Ausfall gegen Ihr SLA verstößt?
Die Verluste für die Ausfallzeit werden Ihnen nicht ersetzt. Sie erhalten jedoch eine Servicegutschrift. Wenn Ihr Dienst zum Beispiel acht Stunden lang ausfällt, können Sie einen bestimmten Prozentsatz des Geldes zurückerstattet bekommen. Das heißt, wenn der betreffende Dienst 20 Euro die Stunde gekostet hat und zu 50 Prozent abgedeckt ist, erhalten Sie 80 Euro für des Ausfall zurück. Das hängt davon ab, welchen Dienst Sie in Anspruch nehmen, und hier ist es hilfreich, die SLAs zu lesen und zu verstehen. Auch wenn Sie während des Ausfalls Millionen von Euro an Umsatz verloren haben, erhalten Sie immer noch 80 Euro zurück. Das wird oft übersehen, weil die Leute denken, sie bekämen einen Prozentsatz dessen, was sie in diesem Zeitraum verloren haben, was aber nicht der Fall ist.
Was Sie verlieren, hängt davon ab, was Sie in der Cloud tun und welche Auswirkungen der Ausfall eines Systems haben könnte. Für manche Unternehmen ist der Verlust von E-Mails für einen Tag kein Problem, für andere kann es eine Katastrophe sein, von der sie sich möglicherweise nicht mehr erholen. Die Auswirkungen sind individuell auf den Kunden zugeschnitten und lassen sich nur schwer in Zahlen ausdrücken.
Wie können Sie die Auswirkungen eines Ausfalls minimieren?
Es gibt mehrere Möglichkeiten, die Auswirkungen eines Ausfalls zu minimieren, aber es kann zu Problemen bei der Umsetzung dieser Praktiken kommen.
Sie können eine Multi-Cloud-Bereitstellung vornehmen, bei der Ihre Anwendung oder Ihr Bedarf auf zwei verschiedene Cloud-Instanzen verteilt ist. Es ist zwar möglich, eine Anwendung auf zwei Clouds aufzuteilen, aber das bringt keine wirkliche Redundanz, denn Sie benötigen in beiden Clouds denselben vollständigen Anwendungs-Stack, was Geld kostet. Das ist vergleichbar mit einem Rechenzentrum an einem heißen Standort, was viele aufgrund der Hardwarekosten und -verpflichtungen vermeiden.
Zuverlässige Backups sind wichtig, um den Schutz der Daten zu gewährleisten, aber sie helfen nicht, Ausfälle zu verhindern. Leider haben Sie kaum Einfluss auf diese Ausfälle, da es sich nicht um Ihr Rechenzentrum handelt und Sie keinen Einfluss auf den Betrieb haben. In diesem Szenario sind Sie ein Kunde und nicht der Manager und müssen wie alle anderen in der Schlange warten.
Da es zweifelhaft ist, dass Sie das Geld für eine replizierte Cloud-Instanz aufbringen können, sollten Sie sich darüber im Klaren sein, was passieren kann. Es wird zu Ausfällen kommen, nichts ist immer zu 100 Prozent sicher. In einer Cloud kann es zu einem kritischen Systemausfall kommen, aber wenn Sie sich des Risikos bewusst sind, werden Sie Pläne und Verfahren haben, wie Sie damit umgehen können. Vielleicht ist es ein manueller Prozess, der nicht effizient ist, aber er wird funktionieren. Wenn Sie es nicht verhindern können, oder es sich nicht leisten können, es zu verhindern, sollten Sie die Richtlinien und Verfahren erstellen, um sich darauf einzustellen.