whyframeshot - stock.adobe.com
Leistungskennzahlen für optimalen NOC-Betrieb nutzen
Zu den bewährten NOC-Praktiken gehören standardisierte Netzwerkdesigns und Automatisierung. Mit Leistungskennzahlen lässt sich der operative Erfolg verfolgen und messen.
Erfolgreiche Netzwerkbetriebsteams stützen sich auf Best Practices und Leistungskennzahlen (KPI), um Verbesserungen im Netzwerkbetrieb zu erzielen.
Das Netzwerkteam kann die Effizienz seines Network Operations Center (NOC) beurteilen, indem es die unten aufgeführten bewährten Verfahren und Leistungskennzahlen auswertet sowie Bereiche mit Verbesserungspotenzial ermittelt.
Bewährte NOC-Verfahren
Standardisierte Netzwerkdesigns
Die wichtigste Best Practice für den Netzwerkbetrieb ist die Verwendung einfacher, standardisierter Netzwerkdesigns in größtmöglichem Umfang. Entfernte Zweigstellen sollten ähnliche Entwürfe verwenden und nur geringfügig variieren, um unterschiedlichen Größen oder spezifischen Anforderungen gerecht zu werden.
Die gleiche Strategie gilt für größere Büros und Rechenzentren. Die Verwendung von Standard-Bausteindesigns vereinfacht den gesamten Systemlebenszyklus von der Beschaffung über die Installation bis hin zum Betrieb. IT-Teams können außerdem Richtlinien, Konfigurationen, Betrieb, Überwachung und Fehlerbehebung auf Standardverfahren reduzieren, was durch Automatisierung weiter vereinfacht werden kann.
Redundanz im Netzwerk
Die Netzwerkarchitektur muss das richtige Maß an Redundanz beinhalten, um das Netzwerk ausfallsicher zu machen. Es wird zu Ausfällen kommen – Verbindungen werden unterbrochen und Geräte fallen aus – und die IT-Teams müssen das Netzwerk so gestalten, dass diese Ausfälle problemlos bewältigt werden können.
Ein zusätzlicher Vorteil der Redundanz besteht darin, dass Netzwerkteams Wartungsarbeiten und Upgrades an Teilen des Netzwerks durchführen können, ohne den Geschäftsbetrieb zu beeinträchtigen. Dies schafft eine wesentlich stressfreiere Umgebung und ermöglicht es dem Netzwerk, mit den Änderungen bei Anwendungen und unterstützenden IT-Systemen Schritt zu halten.
Umfassendes Netzwerk-Management
Top-Unternehmen nutzen Netzwerkmanagementsysteme, um einen Gesamtüberblick über das Netzwerk zu erhalten und Probleme proaktiv zu lösen, bevor sie sich auf den Betrieb auswirken. Die IT-Abteilung kann rechtzeitig auf Fehler- und Ausfallberichte reagieren, um zu verhindern, dass der Ausfall einer weiteren Komponente das Geschäft beeinträchtigt. Eine umfassende Architektur für das Netzwerkmanagement ist erforderlich, um das erforderliche Maß an Transparenz zu gewährleisten.
Automatisierung und ChatOps
Die Automatisierung gängiger Aufgaben ist eine weitere bewährte Praxis. Dazu gehören die Bereitstellung, die Durchführung von Betriebssystem-Upgrades für Netzwerkgeräte – zur Behebung von Fehlern oder Sicherheitslücken – und die Änderung von Konfigurationen. Tools für maschinelles Lernen, wie zum Beispiel Moogsoft, Splunk und Elastic, können die Ereignisverwaltung erheblich verbessern, indem sie eine große Anzahl von Ereignissen konsolidieren und zu einigen wenigen verwertbaren Elementen korrelieren. Unternehmen können die Automatisierung nutzen, um den Betrieb des Netzwerks regelmäßig zu überprüfen und die Fehlerbehebungsprozesse zu verbessern.
Eine neuere Ergänzung für Netzwerk-Teams ist der Einsatz von ChatOps zur Rationalisierung der Mitarbeiterkommunikation, des Trouble Ticketing und der Problemlösung.
NOC-Leistungsmetriken und KPIs
KPI-Dashboards sind der Schlüssel dazu, dass Netzwerkbetriebsteams ihren Erfolg messen und feststellen können, wo sie sich auf Verbesserungen konzentrieren müssen. Die spezifischen KPIs, die von den Teams verwendet werden, hängen von den Geschäftsfunktionen und dem unterstützenden Netzwerk ab. Rechenzentren, Cloud, SaaS, entfernte Standorte, Wireless, Internetkonnektivität, Call Center und andere haben sowohl allgemeine als auch spezielle KPIs.
Zu den gängigen Metriken gehören Netzwerkdatenverkehr-Statistiken, wie die 95-prozentige Auslastung, Paketverluste, Fehler und Latenzzeiten zwischen ausgewählten Endpunkten. Die Netzwerkverfügbarkeit ist schwierig zu definieren und zu messen, daher ist es oft einfacher, die Verfügbarkeit und Leistung von Anwendungen mit Tools wie Digital Experience Monitoring zu messen.
Die einzelnen Messgrößen hängen von der zugrunde liegenden Netzwerktechnologie ab. KPIs für drahtlose Netzwerke verfolgen AP-Verbindungen (Access Point) zu Controllern, Client-Volumen, Signalstärke und Interferenzen. Routing und Switching – mit Spanning Tree – verwenden KPIs, um die Stabilität von Nachbarverbindungen und Pfaden zu messen.
Zu den weniger offensichtlichen Metriken gehört die Überwachung der Elemente der unterstützenden Infrastruktur, wie Stromversorgung, Kühlung, Rack-Platz und Abdeckung der System-Backups. Das IT-Team will weder unerwartet keine unterstützenden Ressourcen mehr zur Verfügung haben, noch will es feststellen, dass gespeicherte Konfigurationen von Netzwerkgeräten nicht verwendbar sind.
Es gibt auch Management-KPIs, zum Beispiel die folgenden:
- das Volumen der Trouble Tickets eines bestimmten Typs oder Schweregrads
- die mittlere Reparaturzeit (MTTR) für eine Klasse von Fehlern
- die Zeit für die Ausführung allgemeiner Dienste, zum Beispiel die Messung der Effizienz der Automatisierung
- den Status der Netzwerkdokumentation
- das Alter der Netzwerkausrüstung und Planung der Erneuerung
Leistungsfähige NOCs im Vergleich zu leistungsschwachen NOCs
Leistungsfähige NOC-Teams nutzen KPIs, um das Netzwerk und ihre Fähigkeit, es zu betreiben, zu messen und zu verbessern, und nicht, um Schuldzuweisungen vorzunehmen. Die Mitarbeiter sind gut geschult, arbeiten als Team zusammen und kooperieren gut mit anderen IT-Teams. Sie setzen Prozesse ein, die menschliche Fehler reduzieren und Aufgaben rationalisieren. Sie bevorzugen Tools und Automatisierung, um ihre Aufgaben einfacher, schneller und einheitlicher zu gestalten.
Ein leistungsschwaches NOC arbeitet im Feuerlöschmodus, hangelt sich von einer Krise zur nächsten und verwendet manuelle Prozesse, die nur selten dokumentiert sind. Wahrscheinlich werden die Netzwerkdesigns nicht so weit wie möglich standardisiert, was den Betrieb behindert. Infolgedessen kommt es im Netzwerk zu unerklärlichen Ausfällen, die Zeiten für die Problembehebung variieren stark, sind schwer zu automatisieren und haben einen schlechten Ruf.
Den Übergang schaffen
Mit den folgenden Schritten können IT-Teams von einem leistungsschwachen NOC zu einem leistungsfähigen NOC wechseln:
- Beginnen Sie mit der Implementierung von Standardbausteinen für das Netzwerk.
- Untersuchen Sie die aktuelle Tool-Suite zur Verwaltung des Netzwerks und ermitteln Sie die wichtigsten zu verfolgenden Metriken.
- Entwickeln und dokumentieren Sie Prozesse für gängige Vorgänge und integrieren Sie die Automatisierung, um menschliche Fehler und den Zeitaufwand für die Durchführung dieser Vorgänge zu reduzieren.
Am besten ist es, wenn die IT-Abteilung für diese Änderungen die Unterstützung des Managements hat. Aber selbst wenn diese Unterstützung nicht vorhanden ist, sollten die IT-Teams in der Lage sein, kleine Änderungen vorzunehmen, die nichts kosten und zu einer besseren Leistung des Teams und des Netzwerks führen.