taa22 - stock.adobe.com
3 Best Practices für Network Observability
Studien zeigen einen Zusammenhang zwischen dem Erfolg von NetOps und Network Observability. Die Einhaltung von Best Practices für Network Observability kann diesen Erfolg fördern.
Network Observability (im Deutschen gelegentlich auch Netzwerk-Observability oder Netzwerkbeobachtbarkeit genannt) ist eine wichtige Methode zur Entwicklung von Netzwerkintelligenz, die von vielen Netzwerkteams nicht genutzt wird.
Die Beobachtung eines Netzwerks kann den Erfolg von Network Operations (NetOps) eines Unternehmens potenziell erheblich steigern. IT-Teams können einige Schritte unternehmen, um Network Observability zu implementieren. Auf diese Weise sind Netzwerkadministratoren imstande, ihre Netzwerke besser zu verstehen und einen angemessenen Service für ihre Endanwender zu gewährleisten.
Was ist Network Observability?
Wenn IT-Teams ein Netzwerk überwachen, konzentrieren sie sich seine Performance. Tritt in einem Netzwerk ein Problem auf, können die Netzwerk-Admins es per Monitoring erkennen. Während IT-Teams in der Lage sind, das Troubleshooting von Netzwerkproblemen mithilfe von Netzwerkmanagement und -Monitoring durchzuführen, kann Network Observability eine gründlichere Analyse des Netzwerks liefern. Wenn IT-Teams ein Netzwerk beobachten, wollen sie verstehen, wie ein Problem entstanden ist, wie es sich beheben lässt und wie das Netzwerk verbessert werden kann, um zukünftige Fehler zu vermeiden.
Network Observability kann auch definiert werden als „die Lösung des Problems, die Zustandsvariablen der Endbenutzererfahrung aus den gemessenen Variablen in möglichst kurzer Zeit zu rekonstruieren“, so Göran Edin, CTO von Data Ductus, einem Beratungsunternehmen für Softwareentwicklung, in einem kürzlich durchgeführten Webinar.
Edin, dessen Definition eine Ergänzung zu Rudolf Kalmans Definition (PDF) der Observability von Steuerungssystemen ist, beschreibt die folgenden Grundsätze, die Unternehmen die Observability ihrer Netzwerkdienste ermöglichen:
- Messen der Endbenutzererfahrung.
- Einsatz von Telemetrieverfahren zur Datenerfassung.
- Service Assurance (Dienstgarantie), um hochwertige Services für die Kunden zu gewährleisten.
1. Fokus auf Endbenutzererfahrung
Studien zeigen, welche positiven Auswirkungen es hat, die Endbenutzererfahrung zu messen. Laut einer von Enterprise Management Associates durchgeführten Untersuchung zu den Megatrends des Netzwerkmanagements im Jahr 2020 wird ein Drittel der IT-Probleme von Endanwendern gemeldet, bevor sie vom NetOps-Team erkannt werden. Unternehmen, die die Endbenutzererfahrung messen und überwachen, berichten von einer erfolgreicheren Geschäftstätigkeit.
Obwohl diese Statistiken die Bedeutung von Netzwerk-Monitoring unterstreichen, könnte die Beobachtung der Endbenutzererfahrung wertvollere Informationen darüber liefern, wie das Netzwerk verbessert werden kann. Die Überwachung des Netzwerks ermöglicht es den Teams lediglich, Informationen über das Netzwerk zu sammeln, und das ist nach Ansicht von Edin „nicht genug“.
Netzwerkexperten sollten das Netzwerk beobachten, um Einblicke zu gewinnen und ein datengetriebenes System zu schaffen, mit dem sich Entscheidungen treffen lassen, die für die Entwicklung des Netzwerks am besten geeignet sind. Da immer mehr Anwendungen in die Cloud verlagert werden oder sich zu komplexen verteilten Systemen entwickeln, könnten Investitionen in Observability-Systeme, die auf der Endbenutzererfahrung basieren, das NetOps-Management vereinfachen. Im Idealfall sollte dieses System in der Lage sein, potenzielle Probleme vorherzusagen, Szenarien zu simulieren und Netzwerkverbesserungen zu empfehlen, so Edin.
2. Einsatz von Telemetrie für NetOps
Netzwerkprofis müssen ausreichend Daten erfassen, um ein System zu entwickeln, mit dem sich ihre Netzwerkdienste beobachten lassen. Sie müssen die relevantesten Telemetrieverfahren nutzen, um Daten zur Überwachung und Beobachtung von Netzwerkdiensten zu sammeln. Es gibt verschiedene Formen der Telemetrie. Aber die für das Netzwerk-Monitoring wichtigsten sind Datenkonfiguration, synthetische Daten und Gerätetelemetrie.
- Bei der Datenkonfiguration wählen die Netzwerkadmins Daten aus, die die operativen Ziele darstellen. Das Erkennen der operativen Ziele ist ein Schritt in Richtung Intent-based Networking und ermöglicht es Netzwerkexperten zu erfahren, wie sich ihre Netzwerke verhalten. Edin sagt, dass es seiner Erfahrung nach für Netzwerkprofis ohne Kenntnis der operativen Ziele schwierig ist, Endbenutzerdienste zu überwachen.
- Synthetische Daten ermöglichen es den IT-Teams, mit synthetischem Traffic zu testen, um die Endbenutzererfahrung zu simulieren. So lässt sich die Endbenutzererfahrung am besten nachahmen. Durch die Nachahmung der Benutzerinteraktion können die Administratoren beurteilen, wie die Anwender mit dem Netzwerk umgehen.
- Gerätetelemetrie bedeutet, dass Admins Metriken verwenden, um den Status des Netzwerks zu untersuchen. Diese Form der Telemetrie ist in Verbindung mit synthetischen Daten ein wertvolles Tool zur Datenerfassung für IT-Teams, da sie die Ursache eines Problems ermitteln können.
Diese Ansätze sind zwar nützlich, um Daten zu erheben, dienen aber in erster Linie dem Netzwerk-Monitoring. Sie gewinnen an Bedeutung, wenn IT-Teams Service Assurance bieten wollen, da sich anhand der Daten feststellen lässt, ob ein Netzwerk funktionsfähig ist und seine Dienste ordnungsgemäß arbeiten.
Um hochqualitative Daten zu erfassen, die für Network Observability verwendet werden können, müssen die Netzwerkteams sicherstellen, dass ihre gesammelten Daten relevant, kohärent, zugänglich, konsistent und wohldefiniert sind. Mit qualitativ hochwertigen Daten können sie erkennen, was in ihren Netzwerken funktioniert, was verbessert werden muss und wie etwaige Änderungen vorgenommen werden können.
3. Sicherstellen von Service Assurance
Network Observability ist Teil des Service-Assurance-Verfahrens. Sobald die Observability-Plattform oder das Observability-System mithilfe der Telemetriemethoden zur Überwachung eines Netzwerks aufgebaut ist, sollten die IT-Teams auch auf eine Datenvorverarbeitungsebene vorbereitet sein, die die mit den Telemetriemethoden gesammelten Daten bereinigen kann. Dieser Bereinigungsprozess stellt sicher, dass es sich um hochqualitative Daten handelt, so dass sie für die Observability-Plattform hilfreich sein können.
Netzwerkteams, die über die entsprechende Softwarekompetenz verfügen, können ihre eigenen Datenvorverarbeitungsebenen oder andere Service-Assurance-Systeme entwickeln. Darüber hinaus können sie 5G nutzen, um die Infrastruktur zu virtualisieren und Test-Agents auszuführen, und dadurch überprüfen, ob die Hochleistungsdienste eines Netzwerks funktionieren. Trotzdem muss die Observability-Plattform letztlich relevante Daten generieren, damit die Teams ihre Netzwerke verstehen und den Kunden Service Assurance bieten können.
Nach Meinung von Edin sollte Service Assurance zudem Teil des gesamten Service-Lifecycles sein.
„Auf diese Weise wird nicht nur das Risiko von Fehlern durch manuelle Verarbeitung beseitigt, sondern auch die Geschwindigkeit der Bereitstellung von Wochen oder Monaten auf mindestens Tage reduziert“, erläutert er. Durch die Beschleunigung des Prozesses würden außerdem die Arbeitskosten reduziert.
Integration von Observability in DevOps
Netzwerkteams können Service Assurance auch in einen DevOps-Prozess einbinden, indem sie die von Edin beschriebenen Schritte befolgen. Zunächst sollten sie die Endbenutzererfahrung messen. Daraus ergeben sich dann Fragen zu ihren Netzwerken, auf die sie Antworten benötigen. Wie einfach sich diese Fragen beantworten lassen, kann auch dabei helfen, herauszufinden, wie es um die Netzwerk-Observability bestellt ist.
Netzwerkexperten sollten die besten Telemetrieverfahren nutzen, um Einblicke in ihre Netzwerkdienste zu erhalten und ihre Systeme zu entwickeln. Edin empfiehlt Netzwerkteams, mit der Datenkonfiguration zu beginnen, um die operativen Ziele festzustellen.
„Stellen Sie sicher, dass Sie über diese Source of Truth verfügen, die Ihnen zeigt, welche Dienste es da draußen bei Ihnen gibt“, sagt er.
Danach sollten die IT-Teams Gerätetelemetrie und synthetische Daten verwenden, um die Endbenutzererfahrung kohärent zu interpretieren und den Erfolg der Systemressourcen zu untersuchen. Bei Bedarf können die IT-Teams weitere Telemetriemethoden ergänzen.
Schließlich empfiehlt Edin, auch Service Assurance in die Netzwerkautomation zu integrieren. Dieser gesamte Prozess sollte so oft wie nötig ausgeführt, überprüft und wiederholt werden.
Mit der zunehmenden Automatisierung von NetOps und der Entwicklung neuer Services besteht die Gefahr, dass die IT-Teams das Verhalten ihrer Netzwerke und damit auch die Endbenutzererfahrungen verändern. Wenn man Service Assurance sowie die anderen Schritte des Service-Lifecycles mithilfe von Network Observability sicherstellt, lässt sich dieses Risiko verringern.