ra2 studio - stock.adobe.com
Ist die Cloud eine kritische Infrastruktur für Unternehmen?
Die Cloud ist für viele Unternehmen mittlerweile eine kritische Infrastruktur geworden. Wie sahen die größten Cloud-Störungen aus und welche Maßnahmen können Sie dagegen ergreifen?
Unternehmen aller Größen und Branchen verlassen sich heutzutage sehr weitgehend auf Cloud-Dienste. Mit der zunehmenden Nutzung kommt aber eine weniger schöne Seite ans Tageslicht: Es entsteht eine kritische Abhängigkeit von Cloud-Anwendungen und -Diensten, die sich verheerend auf die Geschäftsfähigkeit eines Unternehmens auswirken kann, wenn die Cloud dann doch einmal nicht mehr verfügbar ist.
Da immer mehr Unternehmen auf Cloud Computing setzen, sollten Sie sich jetzt über die wichtigsten Ausfälle bei den großen Providern informieren. Auf Basis dieser Kenntnisse lassen sich Strategien entwickeln, die Ihnen helfen, Unterbrechungen zu vermeiden, wenn es zu einem Ausfall bei einem Ihrer Cloud-Anbieter kommt.
Beispiele für Ausfälle bei Cloud-Anbietern
Im Folgenden stellen wir Ihnen eine kleine Auswahl von erwähnenswerten Störungen bei den größten Cloud-Providern weltweit vor.
- Ausfälle bei AWS: Drei Störungen bei AWS (Amazon Web Services) im November und Dezember 2021 führten zu wiederholten Erreichbarkeitsproblemen bei vielen bekannten Webseiten und Diensten. Beispiele sind Slack und Epic Games. Einer der Ausfälle dauerte sogar mehr als fünf Stunden. Nach Angaben von AWS traten in automatisierten Systemen „unerwartete Probleme“ auf, die dann zu den nicht erreichbaren Diensten führten.
- Ausfälle bei Google: Im Februar 2021 stellte der Google Assistant für Home-Devices, der unter anderem zur Steuerung von smarten Sicherheitslösungen und Thermostaten eingesetzt wird, wegen einem „begrenzten Experiment“ für eine Reihe ausgewählter Nutzer den Betrieb überraschend ein. Im November desselben Jahres erlebte auch die Google Cloud Platform einen etwa zwei Stunden dauernden Störfall, der auf einen Konfigurationsfehler im Netzwerk zurückzuführen war. Betroffen waren Webseiten und Dienste wie Snapchat, Spotify, Etsy und Home Depot.
- Ausfälle bei Meta: Facebook, Instagram, der Facebook Messenger sowie WhatsApp funktionierten zum Verdruss vieler Nutzer für ungefähr sechs Stunden im Oktober 2021 plötzlich nicht mehr. Laut Facebook waren Änderungen bei der Konfiguration von Routern verantwortlich für den Vorfall. Nach Ansicht von Beobachtern führten größere Änderungen an der Konfiguration des Border Gateway Protocols zu einer Serie von Fehlern.
- Ausfälle bei Microsoft: Azure erlebte im Oktober 2021 eine ebenfalls etwa sechs Stunden dauernde Störung, die viele Virtual Machine Workloads und einige andere Dienste beeinträchtigte. Als Ursache wird ein Fehler bei VM-Abfragen vermutet, der in den vergangenen Jahren schon mehrfach zu Problemen bei Microsoft 365 geführt haben soll. Zum Beispiel gab es einen Ausfall bei Exchange Online im April 2021, der zu Problemen bei der Zustellung von E-Mails und einem nahezu kompletten Ausfall aller Microsoft-365-Dienste führte. Auch im November 2020 waren Dienste wie Exchange, SharePoint, Microsoft Teams und OneDrive betroffen.
Warum sind Ausfälle bei Cloud-Providern von so großer Bedeutung?
Alle die genannten Cloud-Ausfälle führen zu einer nahe liegenden Frage: Sind wir mittlerweile viel zu abhängig von der Infrastruktur der Cloud-Provider? Wenn das so ist, müssen wir dann nicht die Cloud-Anbieter als kritische Infrastruktur einstufen?
Die meisten Behörden haben bisher noch keine Anzeichen dafür gezeigt, dass es in nächster Zeit zu einem Wechsel der Einstufung kommen könnte. Das Thema wird aber bereits in anderen Bereichen heiß diskutiert, da immer mehr Unternehmen ihre intern gehosteten Anwendungen, Dienste und Infrastrukturen in von Drittanbietern betriebene Cloud-Umgebungen umziehen.
Das Einstufen von Cloud-Anbietern als kritische Infrastruktur ist natürlich nicht nötig, wenn wir nur davon sprechen, den Zugang zu unseren Mails, Collaboration Services oder Dateifreigaben für einen relativ kurzen Zeitraum zu verlieren. Die größten Provider hosten aber mittlerweile auch teils gigantische IoT-Plattformen (Internet of Things) oder Bezahldienste für weltweit agierende Finanzorganisationen. Andere verarbeiten die Gesundheitsdaten von zahllosen Patienten oder werden zur Integration essenzieller Anwendungen benötigt.
Ein Beispiel dafür sind die Azure Health Data Services, die von großen Unternehmen wie Humana, SAS und anderen genutzt werden, um Daten von Patienten oder direkt aus der medizinischen Forschung zu verarbeiten. Ebenso nimmt der Anbieter AWS seit einer geraumen Weile verstärkt den Energiebereich mit Produkten ins Visier, die Modelle zur Erdölexploration und -bohrung sowie zur Überwachung der Förderung umfassen. Auch die Fahrzeugindustrie profitiert zunehmend von Googles Connected Car Telemetry Platform. Damit lassen sich Daten von selbstfahrenden oder mit Telemetrie ausgestatteten Autos sammeln und koordinieren.
Wie sich durch Störungen bei Cloud-Anbietern verursachte Ausfälle vermeiden lassen
Die enormen Verarbeitungsleistungen der Cloud werden weiter neue Technologiemodelle und Nutzungsfälle anlocken. Es wird daher kaum vermeidbar sein, dass auch Firmen aus dem Bereich kritische Infrastruktur davon profitieren wollen. Man kann davon ausgehen, dass auch sie das Risiko einer Nutzung von Cloud-Anwendungen als geringer einschätzen werden als wenn sie selbst ihre Workloads und Anwendungen weiter intern bereitstellen müssen.
Unternehmen sollten daher ihre Anstrengungen in den Bereichen Disaster Recovery (DR) und Business Continuity (BC) verdoppeln. Zu diesem Zweck haben wir mehrere strategische Denkanstöße zusammengestellt:
- Statt eine identische Kopie der eigenen Cloud-Infrastruktur beim selben Anbieter zu errichten, sollten Sie über eine Fallback-Umgebung bei einem anderen Anbieter nachdenken. Dieses Modell erhöht allerdings sowohl die Kosten als auch die Komplexität.
- Investieren Sie in Backup-Lösungen oder in DR-as-a-Service-Anbieter, die Cloud-Workloads vervielfältigen können und außerhalb des primären Cloud-Providers speichern.
- Setzen Sie Ihre bisherigen SaaS-Anbieter unter Druck, damit sie flexiblere und leichter zugängliche Backup-Möglichkeiten durch API-Integrationen entwickeln – sofern es natürlich überhaupt möglich ist.
- Führen Sie für alle wichtigen Cloud-Anwendungen eine gründliche Analyse der Auswirkungen eines Ausfalls auf die Geschäftstätigkeit durch. Das gilt besonders für SaaS-Applikationen, da diese nur schwierig zu vervielfältigen sind. Auf diese Weise richten Sie die Risikotoleranz Ihres Unternehmens an seiner Cloud-Nutzung aus.