Getty Images
Netzwerk-Downtime: Auswirkungen und Vorsorgemaßnahmen
Hauptursachen für Netzwerkausfallzeiten sind menschliches Versagen, Fehlkonfigurationen und Sicherheitsbedrohungen. Die Folgen von Downtime und wie sie sich vermeiden lässt.
Selbst mit größter Sorgfalt geplante und betriebene Netzwerke können immer wieder von Downtime betroffen sein.
Dabei kann es sich um absichtliche, geplante Ausfallzeiten handeln, in denen Netzwerktechniker das Netzwerk bewusst für eine gewisse Zeit abschalten, um notwendige Konfigurationsänderungen vorzunehmen. In anderen Fällen handelt es sich jedoch um ungewollte Netzwerkunterbrechungen, die den Administratoren Kopfzerbrechen bereiten können. Bis das Netzwerk wieder betriebsbereit ist, sind die Schäden bereits eingetreten.
Schon wenige Minuten Downtime können ein Unternehmen Tausende von Euros kosten. Wenn aus diesen Minuten Stunden werden, können die Folgen erheblich sein. Selbst wenn Netzwerkexperten die Ursache des Ausfalls kennen, kann es dauern, bis das Netzwerk wieder verfügbar ist. Dies bedeutet möglicherweise nicht nur beträchtliche Umsatzeinbußen für das Unternehmen, sondern auch Herausforderungen für die Netzwerkteams, die Endbenutzer und das Netzwerk selbst.
Ursachen für Netzwerk-Downtime
Laut Frank Kyazze, Gründer und CEO von GRC Knight, einer Beratungsfirma für Cybersicherheit, gehören folgende Punkte zu den häufigsten Ursachen für Netzwerk-Downtime:
- Menschliches Versagen und Fehlkonfigurationen. Fehlerhafte Änderungen oder Missverständnisse zwischen IT-Teams sowie falsch konfigurierte Geräte und ungeeignete Regeln.
- Sicherheitsbedrohungen. Cyberangriffe sowie versehentliche oder unbeabsichtigte Schwachstellen in Hardware oder Software.
Menschliches Versagen und Fehlkonfigurationen
Kyazze zufolge ist vor allem der menschliche Faktor eine häufige Ursache für Netzwerk-Downtime. Wenn beispielsweise ein Netzwerkteam eine Änderung vornimmt, durch die einer Gruppe der Zugriff auf benötigte Ressourcen verwehrt wird, kommt es in dieser Gruppe wahrscheinlich zu Downtime.
Ähnlich äußert sich Chris Grundemann, CEO und Mitbegründer von FullCtl, einem Unternehmen für Netzwerkautomatisierung und Softwareentwicklung, sowie Mitbegründer von Network Automation Forum. Grundemann sagt, eine der häufigsten Ursachen für Netzwerk-Downtime bestehe darin, dass ein Netzwerkadministrator etwas ändert, ohne sich über die Auswirkungen auf das Netzwerk im Klaren zu sein.
„Es gibt Ausfälle, die durch Hardware- und Softwarefehler sowie Software-Bugs verursacht werden. Aber sie sind seltener als menschliches Versagen“, erklärt er.
Wim Gerrits, Gründer und CEO von NetYCE, einem Unternehmen für Netzwerkautomatisierung, sagt, dass fehlerhafte Konfigurationsänderungen aufgrund von Komplexität zu den Hauptursachen für Netzwerk-Downtime gehören. Angesichts der zunehmenden Komplexität von Netzwerken wissen Netzwerktechniker manchmal nicht, wie sich eine Änderung auf den Rest des Netzwerks auswirkt, was es schwieriger macht, Änderungen vorzunehmen.
Obwohl fehlerhafte Änderungen zu Downtime führen können, lasse sich dies, so Kyazze, durch ein angemessenes Change Management verhindern.
„Change Management ist das A und O, wenn es darum geht, den Faktor Mensch als Risiko möglichst auszuschalten“, betont er. „Jede Art von kritischer Änderung, die ein Netzwerk beeinträchtigen könnte, sollte dokumentiert, überprüft, getestet und genehmigt werden, bevor sie durchgeführt wird, um die Gefahr menschlicher Fehler, die zu Netzwerk-Downtime führen, zu minimieren.
Sicherheitsbedrohungen
Sicherheitsschwachstellen in Netzwerkhardware, -software oder -Firewalls können laut Kyazze ebenfalls zu Downtime führen. Ein Hacker, der absichtlich ein Gerät manipuliert, könnte zum Beispiel das Netzwerk lahmlegen und Downtime verursachen. Unerfahrene Netzwerkadministratoren können auch unbeabsichtigt Ausfallzeiten verursachen, wenn sie die Sicherheitsrichtlinien in Geräten falsch konfigurieren.
Die Auswirkungen von Netzwerk-Downtime auf Unternehmen
Wenn Fachleute ein Netzwerk planen, implementieren sie in der Regel Failover-Maßnahmen, damit der Traffic bei einem Ausfall auf Backup-Verbindungen umgeleitet werden kann, die den Betrieb des Netzwerks sicherstellen.
Wenn jedoch keine Backup-Verbindung zur Verfügung steht, sei die Wahrscheinlichkeit größer, dass es zu Downtime kommt, so Gerrits. Außerdem hätten Netzwerktechniker möglicherweise Schwierigkeiten, das Problem zu erkennen und zu beheben. Noch komplizierter wird es, wenn es sich um ein Problem handelt, das nur durch das nun nicht mehr funktionierende Netzwerk behoben werden kann.
„Wenn die Netzwerkressourcen des Unternehmens ausgefallen sind und man sie benötigt, um auf eine Netzwerk-Downtime zu reagieren, steht unter Umständen das gesamte Unternehmen still, bis das Netzwerk wie durch ein Wunder wieder funktioniert“, erläutert Kyazze.
Wenn es zu Netzwerk-Downtime kommt, sind Unternehmen laut Gerrits nicht in der Lage, grundlegende Aufgaben durchzuführen. Folgende Probleme können aufgrund von Netzwerk-Downtime entstehen:
- Mitarbeiter können nicht auf Anwendungen zugreifen.
- Mitarbeiter können nicht miteinander kommunizieren.
- Unternehmen sind für ihre Kunden nicht mehr erreichbar.
Darüber hinaus kann der Ausfall des Netzwerks weitere Geschäftsbereiche in Mitleidenschaft ziehen. Andere Computersysteme und Anwendungen sind auf das Netzwerk angewiesen. Ein Ausfall führt zu einem Dominoeffekt, der den gesamten IT-Stack beeinträchtigt.
„Das Netzwerk ist für den IT-Stack von entscheidender Bedeutung“, erklärt Gerrits. „Wenn das Netzwerk nicht läuft, läuft auch das Geschäft nicht.“
Wie Sie Netzwerk-Downtime reduzieren
Netzwerkteams können Downtime mit Netzwerkmanagement- und -Monitoring-Tools entgegenwirken, die Probleme erkennen oder beheben. Diese Werkzeuge finden sich üblicherweise in einem Netzwerk mit Domänenverwaltung oder im Rahmen von Tools zur Netzwerkautomatisierung.
Management von Netzwerkdomänen
Netzwerkexperten nutzen nach Angabe von Gerrits im Allgemeinen separate Netzwerke, die als Teil einer Managementdomäne fungieren. Tools für die Managementdomäne können den IT-Teams dabei helfen, die Performance des Netzwerks zu überwachen, es vor Bedrohungen zu schützen und auftretende Probleme zu beheben.
Zu diesen Tools gehören zum Beispiel:
- Netzwerk-Monitoring-Tools. Sie bieten Einblick in die Netzwerk-Performance und können potenzielle Probleme erkennen, bevor sie auftreten.
- Fehlermanagement-Tools. Sie überwachen aktiv die Netzwerk-Performance, um Probleme zu erkennen, zu diagnostizieren, zu isolieren und zu beheben.
- Netzwerk-Compliance-Tools. Sie überprüfen die Netzwerkgeräte, um zu gewährleisten, dass diese den Sicherheitsstandards entsprechen, erkennen verdächtige Aktivitäten und korrigieren Sicherheitsinkonsistenzen.
Wenn ein Unternehmen über keine separaten Managementnetzwerke mit diesen Tools verfügt, müssen laut Gerrits Netzwerkexperten alternative Methoden finden, um die Ursache eines Ausfalls zu erkennen und zu beheben.
Netzwerkautomatisierungs-Tools
Automatisierte Netzwerk-Tools können Fachleuten bei der Implementierung von Konfigurationsänderungen helfen, so Grundemann. Er fügt jedoch hinzu, dass die Automatisierung nicht unbedingt die Möglichkeit menschlichen Versagens ausschließe. Netzwerkadministratoren schreiben Skripte, die Änderungen automatisch implementieren. Wenn also ein Fehler in einem Skript vorhanden ist, wird das Tool die Änderung inklusive dieses Fehlers durchführen. Einige modernere Netzwerkautomatisierungs-Tools verfügen zwar über Verifizierungsfunktionen, aber sie schließen menschliche Fehler nicht aus.
„Es ist nicht so, dass die Automatisierung menschliches Fehlverhalten komplett eliminiert. Doch sie ist definitiv eine große Hilfe und sorgt dafür, dass Konfigurationen standardisiert bleiben und man Tests integrieren kann“, erklärt Grundemann.
Rick Osteen, ein Netzwerktechniker mit 25 Jahren Erfahrung, ist der Meinung, dass Netzwerkautomatisierungs-Tools durchaus hilfreich sein, aber neu entwickelte Tools mit KI-Funktionen effizienter arbeiten können. Diese Tools könnten beispielsweise Predictive-Analysis-Funktionen besitzen, die Änderungen erkennen, bevor sie auftreten, und die Häufigkeit verringern, mit der Netzwerkexperten Änderungen manuell identifizieren müssen.
Downtime präventiv verhindern
Kyazze zufolge besteht eine der effektivsten Möglichkeiten, Netzwerk-Downtime zu minimieren, darin, sich darauf vorzubereiten. Eine gründliche Vorbereitung kann helfen, Downtime zu verhindern, bevor es dazu kommt. Aber sie kann auch dazu beitragen, dass die IT-Teams wissen, was bei einem Ausfall zu tun ist. Kyazze empfiehlt Unternehmen zum Beispiel, Testumgebungen für Szenarien wie Downtime zu simulieren und zu üben, wie sie auf einen Vorfall reagieren.
Eine weitere Möglichkeit, Ausfallzeiten zu vermeiden, besteht laut Osteen darin, eine Vorgehensweise (Method of Procedure, MOP) festzulegen, um zu planen, wie Änderungen implementiert werden sollen. Eine MOP besteht aus einer Reihe von Anweisungen, die detailliert beschreiben, wie ein Prozess zu implementieren ist. Osteen empfiehlt Netzwerkprofis, jeden einzelnen Schritt der Konfigurationsänderungen aufzuschreiben und sich bei der Implementierung der Änderungen auf die Anweisungen zu beziehen.
Wenn die IT-Teams eine MOP verwenden, sollte dies jedoch ein gemeinsamer Prozess sein, so Grundemann. Mindestens ein Netzwerkexperte sollte an der MOP selbst arbeiten – was die Pläne und Konfigurationen vom Frontend bis zum Backend umfasst – und ein anderer sollte sie genehmigen.
„Eine zweite Person überprüft dann, ob etwa ein Schnittstellenname falsch geschrieben wurde oder Tippfehler enthalten sind“, erläutert Grundemann. „Mindestens zwei Leute haben das Ganze abgesegnet, und dann kann man mit der Implementierung loslegen.“
Geplante Netzwerk-Downtime: Positive Aspekte
Der Begriff Downtime wird oft negativ interpretiert, aber geplante Ausfallzeiten können sich positiv auf das Netzwerk auswirken. Administratoren planen Downtime ein, wenn sie die Netzwerkinfrastruktur für Upgrades oder Wartungszwecke abschalten müssen.
Da geplante Ausfallzeiten für den Prozess der Konfigurationsänderung von entscheidender Bedeutung ist, sollten Netzwerkteams Best Practices nutzen, um unbeabsichtigte Ausfälle zu vermeiden. Beispielsweise nehmen diese Teams Änderungen bevorzugt während der Nebenzeiten vor, damit sich etwaige Fehler nicht auf die Endanwender auswirken.
Außerdem konzipieren laut Grundemann die meisten Fachleute Netzwerke so, dass Redundanzen vorhanden sind. Ein Netzwerk kann etwa über zusätzliche Switches, Router und mehrere Übergabepunkte verfügen. Redundanzen tragen dazu bei, dass das Netzwerk bei Hardwareausfällen und während Upgrades weiterhin zur Verfügung steht.
Wenn Netzwerkadmins Geräte aufrüsten wollen, können sie die zusätzlichen Geräte so lange laufen lassen, bis die betreffende Hardware aktualisiert ist. In diesem Fall kommt es Grundemann zufolge nicht zu einer Netzwerk-Downtime, sondern nur zu Ausfallzeiten der jeweiligen Geräte, während das Netzwerk verfügbar bleibt.
Auch wenn Konfigurationsänderungen zu Downtime führen können, sollte man deshalb nicht auf Änderungen verzichten. Laut Gerrits ist die meiste Downtime geplant. Netzwerkexperten sollten allerdings darauf achten, dass sie die Komplexität ihrer Netzwerke kennen, bevor sie eine Änderung implementieren.
„Solange man sicher ist, dass durch den Eingriff, den man vornimmt, keine anderen Bereiche in Mitleidenschaft gezogen werden, stellt Downtime kein Problem dar“, betont Gerrits.