Disaster-Recovery-Test
Ein Disaster-Recovery-Test (DR-Test) ist die Überprüfung der einzelnen Schritte eines Disaster-Recovery-Plans, wie er im BC/DR-Planungsprozess einer Organisation festgelegt ist. Die Bewertung des DR-Plans trägt dazu bei, sicherzustellen, dass ein Unternehmen Daten wiederherstellen, geschäftskritische Anwendungen wiederherstellen und den Betrieb nach einer Unterbrechung der Dienste fortsetzen kann.
In vielen Unternehmen werden DR-Tests vernachlässigt, weil die Erstellung eines Plans für das Disaster RecoveryRessourcen bindet und teuer werden kann. Unternehmen halten es möglicherweise für ausreichend, einen Notfallplan zu haben, auch wenn es keine Beweise dafür gibt, dass sie diesen Plan im Katastrophenfall auch ausführen können.
Wenn ein Unternehmen keine Zeit und Ressourcen in das Testen seines Disaster-Recovery-Plans investiert, besteht eine reelle Chance, dass der Plan nicht wie erwartet funktioniert, wenn er wirklich benötigt wird. Kommunikation,Datenwiederherstellung und Anwendungswiederherstellung stehen in der Regel im Mittelpunkt der Disaster-Recovery-Tests. Andere Testbereiche variieren je nach dem Recovery Point Objective (RPO) und dem Recovery Time Objective(RTO) des Unternehmens.
Experten empfehlen, Disaster-Recovery-Tests regelmäßig im Laufe des Jahres durchzuführen und sie in alle geplanten Wartungs- und Mitarbeiterschulungen einzubeziehen. Nach Abschluss eines Tests sollten Audit-Protokolle und andere Daten analysiert werden, um festzustellen, was wie erwartet funktioniert hat, was nicht wie erwartet funktioniert hat, welche Änderungen am Design des Disaster-Recovery-Plans vorgenommen werden müssen und welche Aufgaben für erneute Tests geplant werden müssen.
Ziele von Disaster-Recovery-Tests
Eines der Hauptziele eines Disaster-Recovery-Tests ist es, festzustellen, ob ein DR-Plan funktioniert und die vorgegebenen RPO/RTO-Anforderungen einer Organisation erfüllt. Darüber hinaus erhalten die Unternehmen ein Feedback, damit sie ihren Plan bei unerwarteten Problemen anpassen können.
IT-Systeme bleiben selten statisch, sodass neue und aktualisierte Produkte erneut getestet werden müssen. Speichersysteme und Server können hinzugefügt oder aufgerüstet worden sein, neue Anwendungen wurden implementiert und ältere Anwendungen aktualisiert, seit ein Unternehmen seinen DR-Plan entwickelt hat. Auch die Cloud - privat,öffentlich oder hybrid - spielt eine immer größere Rolle in der IT-Infrastruktur eines Unternehmens. Ein Disaster-Recovery-Test hilft sicherzustellen, dass ein Notfallplan in einer sich ständig verändernden IT-Welt auf dem neuesten Stand bleibt.
Arten von Disaster-Recovery-Tests
Es gibt drei grundlegende Arten von Disaster-Recovery-Tests. Dazu gehören eine Planüberprüfung, eine Tabletop-Übung und ein Simulationstest.
Planüberprüfung: Hier überprüfen der Verantwortliche für den DR-Plan und andere Mitglieder des Teams, das für die Entwicklung und Umsetzung des Plans verantwortlich ist, den Plan im Detail, um eventuelle Unstimmigkeiten und fehlende Elemente zu finden.
Tabletop-Übung: Hierbei handelt es sich um Übungen, bei denen die Beteiligten zusammenkommen, um Schritt für Schritt alle Komponenten eines DR-Plans durchzugehen. Auf diese Weise lässt sich feststellen, ob jeder weiß, was er im Notfall zu tun hat, und es werden Unstimmigkeiten, fehlende Informationen oder Fehler aufgedeckt.
Simulation: Die Simulation von Katastrophenszenarien ist eine gute Möglichkeit, um festzustellen, ob die Verfahren und Ressourcen - einschließlich der Backup-Systeme und Wiederherstellungsstandorte -, die für das Disaster Recovery und die Geschäftskontinuität (Business Continuity) vorgesehen sind, in einer Situation funktionieren, die der Realität so nahe wie möglich kommt. In einer Simulation werden verschiedene Katastrophenszenarien durchgespielt, um festzustellen, ob die am DR-Prozess beteiligten Teams die Technologien und Geschäftsabläufe rechtzeitig wieder in Gang setzen können. Auf diese Weise kann festgestellt werden, ob genügend Mitarbeiter vorhanden sind, um die DR-Aufgabe ordnungsgemäß zu erledigen.
Wichtige Aspekte eines DR-Tests
Bei effektiven Disaster-Recovery-Tests sollten folgende Aspekte berücksichtigt werden:
Zeitplan: Wann wurde eine Anwendung oder ein System das letzte Mal getestet? Je länger die Zeitspanne zwischen den Tests ist, desto größer ist das Risiko, dass Änderungen oder Wachstum - bei Daten, Hardware oder Software - zu einem Ausfall des DR-Plans führen. Es ist auch wichtig, im Rahmen Ihres DR-Tests zu messen und zu wissen, wie lange eine vollständige Wiederherstellung aus RTO-Sicht dauert.
Änderungen: Testen Sie, um sicherzustellen, dass die Sicherungs-/Wiederherstellungsprozesse durch Änderungen nicht beeinträchtigt werden. Führen Sie nach größeren Infrastrukturänderungen – zum Beispiel bei der Speicherhardware oder der Aktualisierung eines Hypervisors – immer einen DR-Test durch, da diese dazu führen können, dass Disaster-Recovery-Prozesse neu geschrieben werden müssen.
Auswirkungen: Sie müssen wissen, ob der Disaster-Recovery-Test Auswirkungen auf Ihre Produktionsumgebung haben wird oder nicht. Beispielsweise können Tests zu Ausfallzeiten führen, weil eine Anwendung oder Hardware-Geräte heruntergefahren werden müssen, da sie sonst Auswirkungen auf die Produktivdaten haben. Alle Daten und Software-Updates sollten in eine Simulation einbezogen werden, um sicherzustellen, dass es sich um einen gültigen Durchlauf handelt und die Auswirkungen der Tests dieselben sind, wie wenn der Notfallplan in einer realen Katastrophe umgesetzt würde.
Menschen: Verwenden Sie einen DR-Test, um das Potenzial für menschliches Versagen im Disaster Recovery-Prozess zu minimieren oder ganz auszuschalten. Stellen Sie außerdem sicher, dass Sie eine Vielzahl von Personen einsetzen - nicht nur Mitarbeiter, die direkt an der Unterstützung einer bestimmten Anwendung beteiligt sind -, um die Gültigkeit aller Schritte in einem DR-Plan besser bestimmen zu können, entweder an einem Produktivsystem oder während einer Übung auf Papier.
Eine kostenlose, herunterladbare, englischsprachige Vorlage für einen Disaster-Recovery-Plan finden Sie hier. Er soll Ihnen die Einleitung, Fertigstellung und Prüfung eines IT-DR-Plans erleichtern.
Checkliste für Disaster-Recovery-Tests
- Legen Sie einen detaillierten DR-Testplan vor, wenn Sie versuchen, eine Genehmigung und Finanzierung für die Durchführung von Tests zu erhalten.
- Legen Sie die Ziele und Verfahren klar fest und geben Sie an, was Sie in Ihren Analysen nach den Tests suchen.
- Stellen Sie ein Testteam zusammen - einschließlich Fachexperten - und stellen Sie sicher, dass alle zum geplanten Testtermin verfügbar sind.
- Legen Sie genau fest, was getestet werden soll, zum Beispiel die Sicherung und Wiederherstellung, die Wiederaufnahme von Systemen und Netzwerken oder das Benachrichtigungssystem für Mitarbeiter.
- Dokumentieren Sie Ihren Notfallplan und die Testskripte für das Disaster Recovery sorgfältig und seien Sie darauf vorbereitet, diese zu bearbeiten.
- Überprüfen und bestätigen Sie, dass der gesamte Code in den Testskripten korrekt ist.
- Nehmen Sie alle relevanten technologischen Elemente und Prozesse, die getestet werden sollen, in den Plan auf - auch wenn sie noch so unbedeutend erscheinen.
- Vergewissern Sie sich vor dem Start, dass die Testumgebung bereit und verfügbar ist und die Produktionssysteme nicht beeinträchtigt. Stellen Sie sicher, dass die Tests nicht mit anderen Aktivitäten oder Tests kollidieren.
- Planen Sie einen DR-Test, der mehrere Stunden dauern kann, weit im Voraus; informieren und erinnern Sie andere IT-Manager an den bevorstehenden Test.
- Führen Sie einen Trockenlauf - oder eine Übung - durch, bevor der Disaster-Recovery-Test live geht, um mögliche Probleme aufzudecken und zu beheben.
- Halten Sie den Test an und überprüfen Sie ihn, wenn Probleme auftreten. Setzen Sie den Test fort, wenn das Problem umgangen werden kann; verschieben Sie ihn gegebenenfalls.
- Bestimmen Sie einen Zeitnehmer, der die Start- und Endzeiten festhält, und einen Schreiber, der sich Notizen macht, um den Bericht nach dem Test vorzubereiten, in dem beschrieben wird, was während des Tests passiert ist, was funktioniert hat und was nicht und was daraus gelernt wurde.
- Aktualisieren Sie Disaster-Recovery- und Business-Continuity-Pläne und andere Dokumente auf der Grundlage der aus dem DR-Test gewonnenen Erkenntnisse.