Elnur - stock.adobe.com
Disaster-Recovery-Kosten: Wenn das Restore fehlschlägt
Jedes Unternehmen sollte wissen, was es kostet, wenn sein Betrieb stillsteht, und mit den Kosten eines Disaster-Recovery-Plans gegenrechnen, um böse Überraschungen zu vermeiden.
Die Kosten eines Disaster-Recovery-Plans erscheinen manchen IT-Managern als unnützer Aufwand. Budget und Personal werden nur ungern den Vorbereitungen für eine Situation zugewiesen, die möglicherweise gar nicht eintritt.
Aber wenn wichtige Systeme ausfallen, müssen Recovery- oder Umschaltprozesse eingreifen, damit das Unternehmen weiterarbeiten oder den Betrieb schnell wieder aufnehmen kann. In solchen Situationen diskutiert niemand mehr über das DR-Budget, denn wer zuvor hier investiert hat, kommt glimpflich davon.
Ohne einen ausgefeilten DR-Plan und entsprechende Werkzeuge dauert die Ausfallzeit grundsätzlich länger. Daher sind die Kosten einer fehlgeschlagenen Disaster Recovery oder gar das Fehlen eines entsprechenden Plans potentiell viel höher als die Kosten des Plans selbst.
Kritisch ist die Integrität einer DR-Strategie. Unglücklicherweise planen viele Unternehmen nicht konsistent, testen und aktualisieren ihre DR-Prozesse nicht regelmäßig oder gar nicht. Dann entgeht ihnen, dass die DR-Pläne unter Umständen verändert werden müssen. Das bedeutet am Ende, sich auf sein Glück zu verlassen. Und das ist bekanntlich launisch.
Für verschiedene Ausfallszenarien vorbereiten
Grob gesprochen, kann man Ausfälle in zwei Kategorien einteilen: Ausfall der Infrastruktur oder lokalisierte Ausfälle. Infrastrukturausfälle können Rechenzentren und Speichersysteme oder Server betreffen, lokalisierte Ausfälle tendenziell eher Anwendungen und ihre Abhängigkeiten voneinander.
Anwendungen umzuschalten, ist eine sehr direkt wirkende Gegenmaßnahme. Dazu braucht man nur wenige Ressourcen, beispielsweise verwaltete Ressourcen oder ganz einfach Raum – entweder in der Cloud oder an einem alternativen DR-Standort. Die gesamte RZ-Infrastruktur umzuschalten, ist allerdings auch für die größten Unternehmen teuer.
Das Risiko eines Komplettausfalls der Data-Center-Infrastruktur ist gering. So etwas passiert vor allem bei Bränden, Naturkatastrophen oder anderen physisch zerstörerischen Ereignissen. Ransomware-Angriffe und andere Sicherheitszwischenfälle können ebenfalls das gesamte System schädigen.
Die Kosten eines DR-Fehlschlags schätzen
Auf vielen Geschäftsfeldern können Systemausfälle massive Auswirkungen haben. Wenn eine Organisation On-Demand-Services anbietet, muss sie möglicherweise rechtliche Anforderungen und strikte Service-Level-Anforderungen beachten. Werden solche Anforderungen wegen größerer Ausfallzeiten nicht eingehalten, kann das sehr viel Geld kosten.
Es ist daher wichtig für Unternehmen, die Kosten für Systemausfälle zu berechnen. Dazu gehören die Kosten der Wiederherstellungen, Kompensationen für Ausfallzeiten und die geschätzte Häufigkeit von Ausfällen übers Jahr. Organisationen können Risikoeinschätzungen durchführen, um potentielle Bedrohungen, die damit verbundenen Konsequenzen und Kosten zu erkennen.
Risikoeinschätzungen helfen, die wahrscheinlichsten Bedrohungen zu identifizieren und ihre Kosten für die Organisation zu schätzen. Mit den Ergebnissen einer solchen Bewertung können Unternehmen sich sinnvoll auf potentielle Risiken vorbereiten. Ein Beispiel: Angenommen, das Rechenzentrum einer Organisation liegt in einem Gebiet, in dem häufig der Strom ausfällt. Dann sollte dieses Risiko hoch bewertet werden und ein Disaster-Recovery-Plan sollte sich mit diesem spezifischen Szenario auseinandersetzen.
Bei Organisationen, die kein Geld für nur mit geringer Wahrscheinlichkeit eintretende Risiken ausgeben wollen, stellen Risikoeinschätzungen sicher, dass das Budget wenigstens die wahrscheinlichsten Risiken abdeckt. Organisationen müssen auch kaum oder gar nicht vorhersehbare Ereignisse einbeziehen. Denn nicht für eine Naturkatastrophe oder einen Ransomware-Angriff zu planen, erhöht das Risiko zusätzlicher Kosten und rechtlicher Probleme.
Priorisieren, aber was?
Es ist nicht einfach, die kritischen Services zu definieren, die auch in einer Krise weiter funktionieren müssen und sie von denen zu differenzieren, die die Organisation nach einer Krise später neu oder wieder aufbauen kann. Im Brennpunkt der DR-Planung sollten Services stehen, die essentiell fürs Weiterlaufen des Geschäfts sind. Die Prioritätenliste sollte man von oben nach unten abarbeiten. Dann sind im Notfall jedenfalls alle Ressourcen für die kritischen Dienste verfügbar.
Es wäre ideal, wenn alle Organisationen sich problemlos selbst vor allen Risiken schützen könnten, ohne zu viel auszugeben. Allerdings ist das nicht so. Zwar motivieren die hohen Kosten fehlschlagender DR-Läufe stark, sich für alle denkbaren Worst-Case-Szenarien vorzubereiten. Doch das kann sich nicht jedes Unternehmen leisten.
Aber nicht jeder Teil einer Organisation braucht einen Disaster-Recovery-Plan. Zur DR gehören Lizenzen, Bandbreite, Storage und Zeit für die Systemverwaltung. Je weniger eine Organisation mit ihrer DR-Strategie schützen muss, desto weniger kostet sie. Was unbedingt geschützt werden muss, zeigt die folgende Kategorisierung:
- Unverzichtbare Infrastruktur. Ohne diese Infrastruktur funktioniert die Organisation nicht. Unbedingt schützen!
- Nice-to-have-Infrastruktur. Sie sollte nur dann über den DR-Plan geschützt werden, wenn sich die Organisation das leisten kann.
- Alles andere. Diese Kategorie kann als letztes wiederhergestellt werden, weil ihr Fehlen die Organisation nicht schädigt.
Ein Diagramm des Enterprise-Netzwerks beschreibt alle Beziehungen und Abhängigkeiten innerhalb einer IT-Infrastruktur. Es ist die Blaupause der Systemanforderungen, die Organisationen durch diese Aufgabe führen kann.
Welche DR-Option hat die beste Kosteneffizienz?
Zunehmender Beliebtheit erfreut sich beim DR das Umschalten auf die Cloud. Denn damit brauchen Organisationen keine eigene physische DR-Infrastruktur, die außer bei einer Krise nicht benötigt wird. Natürlich kostet auch das Failover in die Cloud etwas, aber relativ wenig, wenn man dies mit den Kosten für eine komplette physische Infrastruktur und ihre Wartung vergleicht. Cloud eignet sich am besten für das DR von kleinen Unternehmen – nicht nur wegen der Kosten und der relativ einfachen Handhabung, sondern auch, weil der Cloud-Provider den Support der Infrastruktur übernimmt.
Für größere Umgebungen sollte man an einen warmen physischen Sekundärstandort denken. Allerdings ist ein solcher Sekundärstandort unglaublich teuer. Zu den Kosten gehören Energie, Licht, Kühlung und Klimatisierung, Serverhardware, Netzwerkinfrastruktur, Personal und Sicherheit. Dafür kann das Unternehmen alle diese Ressourcen allein nutzen.
Das gilt für die Cloud nicht immer. Organisationen können zwischen zwei Bezugsmodellen für Cloud-Ressourcen wählen: On-Demand-Verbrauch oder Vorauszahlung für bestimmte Ressourcen, die ihnen dann garantiert zur Verfügung stehen. Wenn in einer bestimmten Gegend etwas passiert und jedes Unternehmen dann möglicherweise auf dieselbe oder einige wenige Clouds umschalten möchte, kann es sein, dass die Ressourcen für die Nachfrage nicht ausreichen. Anwender können gegen Aufpreis die nötigen Ressourcen für DR exklusiv mieten, allerdings gilt das nicht für jeden Provider und die Bedingungen unterscheiden sich.
Schließlich gibt es mit Storage einen weiteren Kostenfaktor beim Cloud-DR, den Unternehmen oft übersehen. Eine Schlüsselmetrik hierfür ist die Veränderungsrate der Unternehmensdaten. Sie gibt einen Hinweis auf die nötige Bandbreite und die Storage-Anforderungen. Die meisten Cloud-Provider rechnen Kosten pro Maschine und Festplatte sowie die Benutzung von Bandbreite ab. Während die erstgenannten Kostenfaktoren meist klar und vorhersehbar sind, türmen sich letztere Provider-abhängig schnell zu großen Summen. Daher sollte man die Veränderungsrate der Daten, die Netzverkehr auslöst, immer genau kennen.