Andrii - stock.adobe.com
Erfolgreiches Disaster Recovery braucht umfassende Planung
Ein erfolgreiches Disaster Recovery erhält die Geschäftstüchtigkeit einer Firma im Störfall aufrecht. Um diesen Erfolg zu gewährleisten, müssen DR-Pläne sorgfältig konzipiert sein.
Ein Disaster Recovery (DR) ist mehr als die simple Datenwiederherstellung von einem Backup. Vielmehr geht es darum, die Auswirkungen eines größeren Störfalls zu verringern. Das kann beispielsweise Datenverlust, ein Cyberangriff, ein Hardware-Ausfall und als Folge all dessen eine signifikante Unterbrechung des Unternehmensbetriebs. Um auf einen solchen Vorfall vorbereitet zu sein, müssen Firmen eine Disaster-Recovery-Strategie entwickeln und einen entsprechenden Plan dazu anlegen. Diese Elemente sind Teil einer Business-Continuity-Strategie, mit der eine Geschäftsfortführung in Katastrophen- und Störfällen gewährleistet werden soll.
Gründe, warum Firmen ein Disaster Recovery benötigen, gibt es genügend. Verschiedene Studien, zum Beispiel von der ITIC, belegen, dass bereits eine Stunde Ausfallzeit über 100.000 US-Dollar kosten kann. Andere Quellen wie Atlassianbeziffern die Kosten für eine Minute Ausfallzeit mit 9.000 US-Dollar. Das sind Angaben für große Unternehmen, in kleineren und mittelgroßen Firmen liegen die Kosten deutlich darunter, geschätzt zwischen 137 und 427 US-Dollar pro Minute. Finanzieller Verlust ist sicher ein starkes Argument für ein Disaster Recovery, aber nicht das einzige. Verlust des Kundenvertrauens, Imageschaden oder verfehlte Geschäftsziele sind weitere negative Folgen, die es zu verhindern gilt.
Die Disaster-Recovery-Planung ist umfassend und begrenzt sich nicht nur auf das Implementieren sinnvoller Backup-Lösungen. Für das DR muss unternehmensübergreifend geplant werden, wobei Datensicherungen, Wiederherstellungen, Failback, Failover und Sicherheitsmaßnahmen sicher den größten Teil einnehmen.
Analysieren Sie die Ist-Situation
Vor dem Beginn der Planung sollten verschiedene Analysen der bestehenden Umgebung und Prozesse durchgeführt werden. So lassen sich ein aktuelles Bild der Infrastruktur erstellen und potenzielle Schwachstellen identifizieren. Konkret bedeutet dies, dass eine Business-Impact-Analyse (BIA) und eine Risikoanalyse durchgeführt werden sollten.
Mit einer BIA erstellen IT-Verantwortliche eine Reihe von Katastrophenszenarien und versuchen zu beziffern, welche Auswirkungen und Schaden diese Geschäftsunterbrechungen haben können. Dabei lassen sich alle möglichen Vorfälle konstruieren, beispielsweise Feuer im RZ, Ausfall der Cloud-Ressourcen, Hardwareschäden, Sabotage, Cyberangriffe oder Pandemien. Darauf aufbauend, können IT- und Geschäftsverantwortliche planen, wie das Unternehmen auf diese Vorfälle reagieren soll. Dabei werden unter anderem Verantwortlichkeiten festgelegt, ein Maßnahmenkatalog erstellt und Verfahren für eine Wiederherstellung des Normalzustandes bestimmt.
Die Risikoanalyse kann auf der BIA aufbauen. Sie bewertet die Wahrscheinlichkeit der potenziellen Folgen der zuvor identifizierten Risiken und gibt den Szenarien entsprechend Kategorien. So könnte das Risiko eines Ransomware-Angriffs als sehr wahrscheinlich und die Gefahr eines Erdbebens als höchst unrealistisch eingestuft werden. Die DR-Planung kann diese Risiken miteinbeziehen und entsprechend entscheiden, wie sich das Unternehmen auf diese möglichen Szenarien vorbereitet.
Darüber hinaus müssen Admins feststellen und dokumentieren, welche Daten wie in ein Backup einfließen und wo diese Kopien gespeichert werden. In diesem Schritt dokumentieren IT-Verantwortliche die Abhängigkeiten zwischen den Ressourcen: Hardware, Software, Anwendungen und Daten. Damit lässt sich beispielsweise herausfinden, welche Anwendungen betroffen sind, sollte eine andere oder die darunterliegende Hardware ausfallen. Nur wenn diese Abhängigkeiten bekannt sind, kann man mögliche Probleme identifizieren und dann Alternativpläne für Systeme, Software und Prozesse entwickeln.
Ein weiterer wichtiger Punkt ist die Priorisierung von Anwendungen, denn nicht alle Workloads sind wichtig für die Geschäftskontinuität. Nach einem Störfall kann es durchaus sein, dass auf einige Anwendungen länger verzichtet werden kann als auf andere. Es empfiehlt sich eine Klassifizierung in drei Kategorien:
- Geschäftskritisch: Diese Anwendungen sind für das Unternehmen unverzichtbar.
- Wichtig: Bei diesen Apps kann eine kurze Ausfallzeit in Kauf genommen werden.
- Nicht wesentlich: Die Anwendungen dieser Kategorie können vorübergehend durch manuelle Prozesse ersetzt werden und sie sind für einen längeren Zeitraum verzichtbar.
RTO, RPO und Integrität
Auf Basis der Analysen des IT-Zustandes entscheiden IT-Verantwortliche, welche Ziele für die Wiederherstellung von Daten, Systemen oder gar Standorten festgelegt werden. Wiederherstellungszeitraum, verkraftbarer Datenverlust und Datenintegrität sind hier die zu bestimmenden Faktoren.
Recovery Time Objective (RTO) definiert die Recovery-Zeit, das heißt die maximale Zeitspanne, die die Wiederherstellung von Daten oder Systemen in Anspruch nehmen darf. Recovery Point Objective (RPO) beschreibt wie lange das Unternehmen einen Datenverlust hinnehmen kann. Das heißt, ein RPO legt fest, wie alt die Daten für eine Wiederherstellung sein dürfen. Im produktiven Umfeld kann dies bedeuten, dass das Backup nur wenige Minuten alt sein darf, in anderen Bereichen ist eventuell ein älteres Backup (zum Beispiel von vor einer Woche) ausreichend. Darüber hinaus muss auch die Integrität der Daten für das Recovery gewährleistet sein. Dafür wird ein Recovery Consistency Objective (RCO) definiert. Dieses Ziel gibt an, wie viele inkonsistente Einträge in Geschäftsdaten aus wiederhergestellten Prozessen oder Systemen in Disaster-Recovery-Situationen tolerierbar sind, und die die Integrität von Geschäftsdaten in komplexen Anwendungsumgebungen beschreibt.
Zu guter Letzt muss der DR-Plan auch Vorgaben für ein Failover enthalten, also beschreiben, wann und wie schnellstmöglich zum normalen Geschäftsbetrieb zurückgekehrt werden kann.
Compliance
Compliance und deren Einhaltung ist ein weiterer essenzieller Faktor, der bei der Backup- und DR-Planung beachtet werden muss. Dies muss unternehmensübergreifend erfolgen. Die IT-Verantwortliche sollten sich mit den einzelnen Abteilungen und/oder ihrer Rechtsabteilung zusammensetzen und die konkreten gesetzlichen Richtlinien in Erfahrung bringen, die es zu befolgen gilt. Dem entsprechend konzipiert das IT-Team nicht nur die BC/DR-Pläne, sondern auch die Backup-Prozesse und Failover-Verfahren.
Technologien und Standorte
Die Disaster-Recovery-Pläne beschäftigen sich auch mit der Auswahl der Technologien, die den DR-Plan stützen. Dazu gehören unter anderem die Backup-Anwendungen, die Storage-Systeme und die Speichermedien. Durch die Verbreitung von Cloud-Diensten können Admins auch auf diese Technologien zugreifen, um die Datensicherung und ein Failover einzurichten. So lassen sich beispielsweise Daten in der Cloud speichern und bei Bedarf von dort entweder im eigenen Rechenzentrum, an einem anderen Hardware-Standort oder auch in einer anderen Cloud wiederherstellen (Cloud Backupund Cloud DR). Firmen haben zudem auch die Wahl, Disaster Recovery as a Service (DRaaS) zu nutzen. Dieser Service ist auf die bestimmten Anforderungen eine DR ausgerichtet.
Einige Unternehmen verfügen über physische Ausfall- oder Recovery-Standorte. Dort halten sie eine Kopie des gesamten Datenbestandes und der Anwendungen vor und können ohne großen Zeitverlust ein Failover vom Hauptrechenzentrum auf diesen Standort durchführen. Ein solcher Standort ist kostenintensiv, da er stets auf dem aktuellen Status des Hauptrechenzentrums gehalten werden muss. Aus diesem Grund entscheiden viele IT-Verantwortliche, die Cloud als Backup- sowie Failover-Ziel sowie als Failover-Ressource einzusetzen. Dadurch werden die Kosten verringert und die Zuverlässigkeit erhöht, da Cloud Service Provider strenge Sicherheitsvorgaben einhalten müssen.
Test und Anpassungen
Ein Disaster-Recovery-Plan ist keine statische Komponente, sondern muss ständig auf Aktualität überprüft und auf Gelingen getestet werden. Nur so kann ein Unternehmen sicher sein, dass der Plan in erfolgreichen Wiederherstellungen resultiert. Ein Test deckt zudem Schwachstellen und Anomalien auf, an die der Test dann entsprechend angepasst werden kann.
Darüber hinaus muss der DR-Plan bei jeder Änderung im Unternehmen demzufolge überarbeitet werden. Das können ein Hardware-Austausch, der Wechsel einer Software oder Anwendung sowie unternehmerische Veränderungen (zum Beispiel ein Merger oder eine Entlassungswelle) sein.
Eine solide Planung von Business Continuity und Disaster Recovery, zusammen mit Backup-Maßnahmen, kann bei einem größeren Störfall die Geschäftstüchtigkeit des Unternehmens sicherstellen. Wurden diese Komponenten vor Jahren von einigen Firmen nicht vollständig oder gründlich umgesetzt, so entsteht derzeit ein Umdenken. Durch das Aufkommen von Cyberbedrohungen im großen Stil, gewinnen Backups, BC/DR und deren Planung an Bedeutung. Unternehmen stehen zahlreiche technologische und strategische Optionen zur Verfügung, so dass ein Disaster Recovery alle Anforderungen bedienen und vor allem erfolgreich sein kann.