Getty Images
Warum Sie diese Disaster-Recovery-Szenarien testen sollten
Unterbrechungen des IT-Betriebs kann verschiedene Ursachen haben und einen dedizierten Disasater-Recovery-Prozess erfordern. Diese sollten individuell und regelmäßig getestet werden.
Die meisten Unternehmen sind zwar auf kleinere Unterbrechungen vorbereitet, können aber eine größere, komplexere Krise nicht übersehen, nur weil sie weniger wahrscheinlich erscheint. Typische Unterbrechungen, auf die sich IT-Teams vorbereiten, sind gewöhnliche Ereignisse wie Festplattenausfälle oder Stromausfälle. Es gibt jedoch noch weitere IT-Katastrophenszenarien, die Unternehmen berücksichtigen müssen, um vollständig geschützt zu sein.
Die Ursache vieler IT-Katastrophen liegt oft darin, dass die für die Wiederherstellung verantwortlichen Personen nichts anderes in Betracht gezogen haben als Hardwareausfälle sowie versehentliche oder böswillige Datenverluste. Leider entwickeln sich die Bedrohungen und Szenarien ständig weiter, so dass sich auch die Disaster-Recovery-Pläne anpassen müssen.
Es gibt viele Arten von Katastrophen, die sich auf die Verfügbarkeit von IT-Diensten auswirken können, und einige davon sind für einzelne Organisationen möglicherweise relevanter als andere. Es ist daher ratsam, zu prüfen, welche Risiken die Infrastruktur und Dienste eines Unternehmens am wahrscheinlichsten bedrohen. Eine Risikobewertungsmatrix ist ein Instrument, mit dem sich die Wahrscheinlichkeit des Eintretens einer Katastrophe sowie deren Schweregrad bestimmen lässt.
Im Folgenden finden Sie fünf mögliche IT-Katastrophenszenarien, auf die sich DR-Teams vorbereiten müssen, sowie Tipps, wie sie dies tun können, unabhängig von Unternehmensgröße und -typ, Standort und Infrastruktur.
Fehlgeschlagene Backups
Fehlgeschlagene Backups gehören zu den häufigsten IT-Katastrophen. Unternehmen können zwar Hardware und Software ersetzen, aber wenn die Daten und alle Backups verschwunden sind, kann es unmöglich oder unglaublich teuer sein, sie wiederherzustellen.
Systemadministratoren müssen in regelmäßigen Abständen ihre Fähigkeit zur Wiederherstellung aus Backups testen, um sicherzustellen, dass die Backups korrekt funktionieren und der Wiederherstellungsprozess nicht einen unsichtbaren, fatalen Fehler aufweist. Gleichzeitig sollten immer mehrere Generationen von Backups vorhanden sein, wobei einige dieser Backup-Sets außerhalb des eigenen Standorts liegen sollten.
Naturkatastrophen
Naturkatastrophen können viele Formen annehmen, darunter Brände, Überschwemmungen und Erdbeben. Auch wenn die Art der Katastrophe von Region zu Region unterschiedlich sein kann, so können doch fast alle Naturkatastrophen Hardware beschädigen und Datenverluste verursachen. Viele können den Arbeitsplatz für längere Zeit unzugänglich machen.
Manche Unternehmen erkennen vielleicht erst, dass ihre Büros in Überschwemmungsgebieten oder erdbebengefährdeten Gebieten liegen, wenn es zu spät ist. Um sich vor solchen Problemen zu schützen, ist eine gewisse Vorausplanung erforderlich.
Die Möglichkeit, Kerndienste durch Ausfälle in der Cloud aufrechtzuerhalten, bedeutet, dass zwar nicht alle Anwendungen verfügbar sind, aber diejenigen, die für den Geschäftsbetrieb wichtig sind. Eine weitere Möglichkeit, sich auf verschiedene Naturkatastrophen vorzubereiten, besteht darin, eine Infrastruktur einzurichten, die die Arbeit aus der Ferne möglich macht.
Die Fähigkeit, ein Failover in die Cloud umzusetzen und außerhalb des Standorts zu arbeiten, erfordert etwas Voraussicht und Planung, zahlt sich aber im Katastrophenfall massiv aus. Die Reparatur und der Ersatz von Gebäuden und Hardware kann mehr Zeit in Anspruch nehmen, als man annimmt, und ein Unternehmen, das während der Wiederherstellung nicht funktionsfähig ist, riskiert erhebliche finanzielle Verluste.
Ransomware-Angriffe
Ransomware ist nicht nur eine der schlimmsten Katastrophen, die einem Unternehmen widerfahren können, sondern vielleicht auch die wahrscheinlichste. Es braucht nur eine Person mit ausreichenden Rechten, die auf einen falschen Link klickt, um Chaos zu verursachen.
Die Verteidigung gegen Ransomware ist weder trivial noch billig. Viele moderne Ransomware-Programme sind so intelligent, dass sie erst aktiviert werden, nachdem sie mehrere Generationen von Backups kompromittiert haben.
Es gibt viele Möglichkeiten, das Risiko eines Ransomware-Angriffs zu verringern, aber kein einziges präventives Werkzeug. Es hilft, die Patches für Anwendungen und Betriebssysteme auf dem neuesten Stand zu halten, E-Mails auf fragwürdige Anhänge zu überprüfen, den Zugriff auf externe Medien zu beschränken und die Benutzer gut zu informieren.
Netzwerkunterbrechungen
Dieses IT-Katastrophenszenario kommt leider häufig vor. Zum Beispiel können schwere Maschinen Kabel durchtrennen und das Netzwerk unzugänglich machen. Netzwerkunterbrechungen sind ein immer dringlicheres Problem, da immer mehr IT-Systeme SaaS-basiert sind. Die Netzwerkkonnektivität ist für die Teilnahme am SaaS-System und dessen Nutzung unerlässlich.
Glücklicherweise ist die Lösung für dieses Problem in den letzten Jahren leicht verfügbar und kostengünstig geworden. Eine zweite Leitung ist eine Option für kleine Unternehmen, und die meisten Netzwerkrouter bieten 4G- oder 5G-Netzwerke als Backup an. Das ist zwar nicht ideal, aber es macht eine Netzwerkunterbrechung weniger zu einer Katastrophe und mehr zu einer Unannehmlichkeit. Die Einrichtung einer Backup-Konnektivität ist zwar mit Kosten verbunden, kann sich aber lohnen, wenn die Alternative ein Büro voller Mitarbeiter ist, die nicht arbeiten können.
Hardwareausfall
Hardwareausfälle können viele Formen annehmen, zum Beispiel ein System, das kein RAID verwendet, der Verlust einer einzigen Festplatte, der ein ganzes System zum Absturz bringt, fehlerhafte Netzwerk-Switches und Stromausfälle.
Die meisten hardwarebasierten IT-Katastrophenszenarien lassen sich relativ einfach entschärfen, allerdings auf Kosten zusätzlicher Komplexität und zu einem höheren Preis. Ein Beispiel ist ein Datenbankserver. Ein solcher Server kann in einen Datenbank-Cluster mit hochverfügbarem Speicher und Netzwerk verwandelt werden. Die Kosten hierfür wären leicht doppelt so hoch wie die Kosten für einen einzelnen, nicht redundanten Server. Außerdem müssten die Administratoren für die Verwaltung einer solchen Umgebung geschult werden.
Auch Hardwareausfälle können die Cloud beeinträchtigen. In der Regel werden diese jedoch abstrahiert, und es gibt mehrere Kopien der Daten, die wiederhergestellt und weiter verwendet werden können.
Über den Autor:
Stuart Burns ist Virtualisierungsexperte bei einem Fortune-500-Unternehmen. Er ist auf VMware und Systemintegration spezialisiert und verfügt über zusätzliche Fachkenntnisse in den Bereichen Disaster Recovery und Systemmanagement. Burns erhielt den vExpert-Status im Jahr 2015.