alexskopje - stock.adobe.com

Mit dieser Checkliste das Disaster Recovery richtig planen

Die Abläufe bei katastrophalen Zwischenfällen müssen dokumentiert, regelmäßig aktualisiert, getestet und geübt werden, damit der Betrieb so schnell wie möglich weiterläuft.

Disaster Recovery (DR) und Business Continuity (BC) sollten unbedingt schriftlich geplant, die Pläne regelmäßig überprüft und auch getestet werden. Nur so ist bei desaströsen Zwischenfällen alles vorbereitet, um den Schaden gering zu halten.

Zwar lassen sich katastrophale Zwischenfälle trotz optimaler Vorbereitung nicht gänzlich ausschließen. Doch wer sich gründlich präpariert, hat wenigstens seine Daten gesichert und kann den normalen Betrieb so schnell wie möglich wieder aufnehmen. Mit der richtigen Methode findet man Schwachstellen und Angriffspunkte der eigenen Organisation und weiß, mit welchen Ressourcen sich ein DR-Plan an die spezifischen Bedürfnisse des individuellen Unternehmens anpassen lässt. Anschließend überprüft man mit praktischen Tests und Übungen, ob der Plan auch funktioniert und passt ihn nötigenfalls an.

Im Folgenden geht es um sieben wichtige Themen, die jede DR-Plan-Checkliste abdecken sollte. Sie behandeln DR umfassend: von der anfänglichen Analyse bis zu den Tests und Übungen im Anschluss an die Konzeptphase.

Business-Continuity-Regelwerk: Das Geschäft soll weiterlaufen

Ein Business-Continuity-Regelwerk umfasst die Regeln und Standards einer Organisation, um den Fortgang der Geschäfte bei einer Krise zu sichern. Dieses Regelwerk wird von der Organisation durchgesetzt. Es unterscheidet sich je nach den Compliance-Anforderungen und verfügbaren Technologien. Ein solches Regelwerk dokumentiert, was in welcher Reihenfolge getan werden muss, um den Geschäftsbetrieb wieder aufzunehmen.

Sind die Regeln klar formuliert und werden sie befolgt, bewirken sie bei der Organisation realistische Erwartungen hinsichtlich der Wiederaufnahme des Geschäfts nach einer Krise. Die internen Mitarbeiter, etwa das Unternehmensmanagement und die Mitglieder des DR-Teams, aber auch Lieferanten, Kunden und andere Verantwortlichen sollten diese Regeln kennen, soweit sie für sie relevant sind.

Business Impact Analysis (BIA): Was schadet dem Geschäft und wie?

Eine Business Impact Analysis (BIA) wird im Rahmen der Planung für eventuelle Desaster durchgeführt, um festzustellen, wie potentielle Ereignisse den Betrieb beeinflussen können. Sie sollte weit oben auf der DR-Checkliste stehen und regelmäßig unternehmensintern oder zusammen mit Geschäftspartnern und gegebenenfalls Kunden aktualisiert werden. Bei einer BIA sammelt eine Organisation Informationen darüber, wie das Geschäft durch unterschiedliche mögliche Katastrophen betroffen wäre. Daraus entsteht ein Bericht, der hilft, bestehende BC/DR-Pläne zu ändern, zu ergänzen oder neu zu formulieren.

Das kann unternehmensintern, ausgelagert oder mit Hilfe eines unabhängigen Drittanbieters geschehen. Eine gern verwendete Methode für die interne BIA ist ein Fragebogen, der Informationen sammelt: erstens darüber, welche unterschiedliche Abteilungen und Gruppen wie von einem Desaster betroffen sein können und zweitens darüber, wie man den Betrieb wieder zum Laufen bekommt.

Risikoeinschätzung (Risk Assessment): Was kann überhaupt passieren?

Eine Risikoeinschätzung sollte nicht mit der BIA verwechselt werden. Erstere analysiert die potentiellen Desaster oder Zwischenfälle, von denen ein Unternehmen betroffen sein könnte, schätzt ihre Wahrscheinlichkeit und benennt vorbeugende Maßnahmen der Organisation. Normalerweise wird sie nach der BIA durchgeführt. Sie listet im Detail alle bekannten Gefahren und die gefährdeten Güter des Unternehmens auf, falls die jeweilige Gefahr sich realisiert. Zu diesen Gütern können Personal, Grundstücke, Gebäude sowie anderes physisches und geistiges Eigentum, Daten, Lieferketten, Vertragsverpflichtungen und auch der Ruf der Firma gehören.

Das Ziel einer Risikoeinschätzung und der Einschätzungsprozess sind organisationsspezifisch. Im Wesentlichen geht es allerdings um die Gefahren und die damit verbundenen Risiken für geschäftliche Güter aller Art. Eine aktuelle Risikoeinschätzung und ihre regelmäßige Aktualisierung gehören unverzichtbar zu einem DR-Plan.

Risikoverringerung (Risk Mitigation): Den Schaden verringern

Mit den Ergebnissen der Risikoeinschätzung kann ein Unternehmen beginnen, die Risiken zu verringern. Dazu gehört, dass Prozesse im BC/DR-Plan hinzugefügt oder aktualisiert werden, die Risiken mit hoher Eintrittswahrscheinlichkeit betreffen. Diese Prozesse sollen verhindern, dass die betreffenden Risiken die Unternehmensgüter mehr als unvermeidbar beschädigen. Risikoverringerung geht nicht davon aus, ein Ereignis vollständig zu verhindern. Vielmehr soll im Fall des Ereignisses dessen Einfluss minimiert werden.

Im Prinzip geht es also hier darum, sich auf alle potentiellen Risiken vorzubereiten. Dennoch bewertet ein Risikoverringerungsplan Eintretenswahrscheinlichkeit und Auswirkungen jedes Risikos gesondert und priorisiert die Planung entsprechend der Größe der erwarteten Auswirkungen, die sich als Produkt aus erwartetem Schaden und Eintrittswahrscheinlichkeit ergibt. Zu den Maßnahmen können Investitionen in Backup- oder DR-Standorte oder in Cloud-DR gehören oder auch neue Regeln für den Umgang mit Sozialen Medien, um dem Ruf des Unternehmens oder einzelner Mitarbeiter nicht zu beschädigen.

DR-Test: Funktioniert alles wie geplant?

Passt ein DR-Plan theoretisch, verschafft man sich mehr Sicherheit, indem man die Effektivität des Plans regelmäßig testet und bei dieser Gelegenheit alle festgestellten Lücken schließt. Die Testfrequenz wird von Organisation zu Organisation variieren. Nach einem DR-Test werden die Ergebnisse analysiert und verwendet, um die nötigen Veränderungen durchzuführen.

DR-Provider bieten entsprechende Tests oft als Teil ihres Services an. Bei der Bewertung solcher Provider sollten DR-Teams also nach Tests und Testfrequenz fragen. Interne Tests können ebenfalls im Rahmen von Wartungsprojekten und beim Training der Mitarbeiter durchgeführt werden.

Tabletop Exercise (TTX): Den Ernstfall üben

Ein Tabletop Exercise (TTX), ist ein DR-Planspiel, bei der die Effizienz eines DR-Plans getestet wird. Hier sehen nicht nur Administratoren, wie ein Plan funktioniert. Vielmehr nehmen alle Beteiligten testweise ihre Rollen im Fall eines spezifischen Desasters ein. So wird deutlich, ob sie ihre Funktion beherrschen und wie das Zusammenspiel mit anderen Rollen ist. Diese Beteiligung macht ein TTX zu einem besonders wertvollen Teil der DR-Planungs-Checkliste.

Als diskussionsbasierte Übung braucht man für ein TTX einen Moderator, der die zu simulierende Situation vorstellt und die Mitwirkenden anleitet. Er bespricht mit ihnen die einzelnen Schritte, die zu unternehmen sind. Gern mit TTX-Szenarien getestet werden Naturkatastrophen oder die Reaktion auf Pandemien. Was genau geübt wird, ist organisations-, branchen-, und regionalspezifisch oder hängt von anderen Faktoren ab.

Eine Checkliste, die alle Punkte berücksichtigt, wird zwar nicht jedes Desaster verhindern können. Wenn aber der Fall der Fälle eintritt, ist wenigstens alles vorbereitet.

Ein TTX dauert einige Stunden und durchläuft das betreffende Ereignis von Anfang bis Ende. So können sich die Teilnehmer mit ihren Rollen und Verantwortlichkeiten vom Beginn des Desasters bis zu den Aktivitäten um die Wiederaufnahme des regulären Betriebs vertraut machen. Das Ergebnis eines TTX fließt in die DR-Planung ein. Es zeigt Lücken im nötigen Wissen des Personals oder Sicherheitsprobleme, die behoben werden müssen.

Emergency Communications Plan (EC): Wer sagt was zu wem und wie?

Ein Notfall-Kommunikationsplan (Emergency Communications Plan, EC) gehört unbedingt zur DR-Planung. Denn wenn beispielsweise ein Standort geschlossen wird oder gefährdet ist, muss es ein System geben, um diese Informationen und alle wichtigen Details den Mitarbeitern oder anderen Involvierten mitzuteilen sowie alle auf denselben Stand zu bringen. Ein EC-Plan sollte die Kommunikationsmethode festlegen und sicherstellen, dass alle Teilnehmer ihre Rolle kennen, falls sie eine haben.

Zu diesem Plan kann auch ein System zur automatisierten Massenbenachrichtigung via Text, Email oder Telefonkette gehören, an dem die Mitarbeiter teilnehmen und das viele Menschen schnell und effizient über die Lage informiert.

Zwar ist die einseitige Benachrichtigung, zum Beispiel per SMS, dank moderner Technologie sehr verbreitet und beliebt, da sie schnell und effizient funktioniert. Allerdings ist eine Anrufkette noch immer schneller darin, Zweiwegekommunikation herzustellen.

Es kann dauern, herauszufinden, ob alle Mitarbeiter eine Benachrichtigung erhalten haben, wenn sie keine Antwort senden. Ein Anruf ist also unter Umständen die unmittelbarere Kommunikationsform bei der Kommunikation mit Mitarbeitern, um sicherzustellen, dass sie alle nötigen Informationen haben. Die gewählte Methode wird sich gemäß der Unternehmensgröße und den vorhandenen Ressourcen unterscheiden. Auf jeden Fall aber sollte jede im Plan vorgesehene Rolle von einem existierenden Mitarbeiter ausgefüllt werden und der Plan sollte allen Mitgliedern der Organisation zugänglich sein.

Ein EC-Plan kann den Mitarbeitern nicht nur den Status des aktuellen physischen Standorts mitteilen, sondern auch, wo sich die Ersatzarbeitsplätze befinden und wann es möglich ist, zum primären Standort zurückzukehren.

Fazit

Ein BC/DR-Plan und eine Checkliste, die alle diese Punkte berücksichtigen, werden zwar nicht jedes Desaster verhindern können. Wenn aber der Fall der Fälle eintritt, ist wenigstens alles vorbereitet, damit das Geschäft schnellstmöglich und mit geringstmöglichem Schaden weiterläuft. 

Nächste Schritte

Warum Sie Ihre DR-Strategie regelmäßig auf Aktualität prüfen sollten

Die richtigen Disaster-Recovery-Ziele finden

Die Unterschiede zwischen DRaaS und klassischem Disaster Recovery

Erfahren Sie mehr über Disaster Recovery