Andrey Kuzmin - Fotolia
Service-Automatisierung: Die Folgen von Vorfällen reduzieren
Es gilt für Unternehmen das richtige Gleichgewicht zwischen menschlichem Fachwissen und Automatisierung zu erreichen. Das entlastet IT-Teams und hilft bei Problemlösungen.
Automatisierung im Incident Management verkürzt die für die Lösung von Vorfällen benötigte Zeit. Ein Ergebnis sind schnellere Reaktionszeiten. Eine größere Genauigkeit bei der Erkennung und Priorisierung reduziert das Potential für menschliche Fehler. Kunden und Anwender profitieren von besseren Service Levels.
Die Automatisierung im Service verschafft den IT-Teams noch einen weiteren Vorteil. Weniger Aufwand für manuelle Aufgaben spart Zeit und Stress. So können Burnout oder Fluktuation der Mitarbeitenden verringert werden. IT-Teams können sich wieder auf strategische Aufgaben und Innovationen konzentrieren. In Zeiten, in denen oft weniger Unternehmensbudget zur Verfügung steht, ist das besonders wichtig.
Das Hands-on-Problem
Eine von Forrester durchgeführte Studie ergab, dass sich Fachkräfte mit der Anzahl der manuellen Aufgaben und dem Arbeitsvolumen überfordert fühlen. Im aktuellen „State of Digital Operations“-Report von PagerDuty stuften 14 Prozent der Befragten ihre Teams als „manuell“ oder „reaktiv“ ein. Neun von zehn leitenden IT- und Entwicklungsmitarbeitern beklagten die derzeitigen ITOps-Ansätze. Die Teams verbringen fast die Hälfte ihrer Zeit damit, sich mit Vorfällen zu befassen – anstatt wichtige Innovationen voranzutreiben. Der finanzielle Schaden wird mit über 3 Millionen US-Dollar pro Unternehmen und Jahr beziffert.
Trotz des Wertes eines automatisierten Incident Managements sind manuelle Aufgaben in vielen Unternehmen nach wie vor üblich. Mitarbeitende verwenden eine Vielzahl von Überwachungstools. Die Pflege der verschiedenen Regelkonfigurationen bedeutet nicht nur einen hohen Verwaltungsaufwand. Die Daten sind in einer Reihe von Silosystemen organisiert. Das erschwert die Verarbeitung von Ereignisdaten; die Reaktionszeiten sind länger. Siloartige Systeme zur Reaktion auf Vorfälle und manuelle Prozesse belasten die ITOM-Teams (IT Operations & Management). Darunter leidet vor allem auf die mittlere Lösungszeit (MTTR, Mean Time To Repair) und die mittlere Zeit von den einzelnen Vorfällen verursachten Unterbrechungen (MTBI, Mean Time Between Incidents).
Die Teilnehmenden des genannten Reports beschrieben einige der qualitativen Auswirkungen der erhöhten Fluktuation auf sie und ihre Teams. Die häufigsten Antworten waren „mehr Bereitschaftsschichten“, „höhere Arbeitsbelastung“ und „erhöhte MTTR“. Diese Spirale einer immer höheren Arbeitsbelastung wirkt sich auf die Qualität der Leistung aus. Der Stresslevel steigt. Mitarbeitende sind unzufriedener und neigen zudem eher zur Abwanderung.
Burnout der Mitarbeitenden ist zudem eine große Bedrohung für die Sicherheit eines Unternehmens. Laut dem letzten „Global Incident Response Threats“-Report (PDF) von VMware leiden 69 Prozent der Befragten unter Burnout-Symptomen und haben schon einmal darüber nachgedacht, ihre Arbeit aufzugeben.
Befragte des „State of Digital Operations“-Berichts gaben an, zwischen den Bereitschaftsschichten weniger Zeit zum Ausruhen zu haben. Die Umfrage ergab auch, dass die Verantwortung im Job zunimmt. Überarbeitete Mitarbeitende aller Branchen und Umsatzsegmente tragen die Last der Unterbrechungen außerhalb ihrer Arbeitszeit. Unternehmen aller Größen und Branchen räumten ein, schlecht auf Vorfälle zu reagieren. Eine weitere Konstante in vielen Unternehmen ist die Flut an Alarmen. Das lenkt Mitarbeitende ab. Manuelle Prozesse verstärken den Effekt. Dies alles führt unweigerlich zu einem schlechteren Kundenerlebnis und erhöht die Angriffsfläche für Sicherheitsvorfälle.
COVID-19 als Treiber von Automatisierung
Die Pandemie hat die Digitalisierung vorangetrieben und Automatisierung unabdingbar gemacht. Unternehmen können ihre Kosten kontrollieren und senken, Mitarbeitende an entfernten Standorten unterstützen. Die Krise führte aber auch zu Risiken und Komplexität für IT-Teams durch parameterlose Netzwerke sowie die verbreitete Nutzung persönlicher Geräte. Die Widerstandsfähigkeit der Unternehmen litt.
Nach COVID-19 sind Investitionen in Automatisierung und KI-gestützte Plattformen der nächsten Generation von entscheidender Bedeutung. Mit der Automatisierung wiederkehrender Aufgaben kann ein Unternehmen seine Sicherheit und Service-Qualität drastisch verbessern. In der Post-COVID-19-Ära sind Lösungen zur Automatisierung von Vorfällen von entscheidender Bedeutung. Ähnlich wie die Menschen ihr Immunsystem an die Bedrohung durch das Coronavirus angepasst haben, müssen auch Unternehmen ihre Widerstandskraft stärken.
Automatisierung im Umgang mit Alarmen und Incidents beschleunigt den Prozess der Erkennung von Sicherheitsverletzungen und der Reaktion darauf. Mit künstlicher Intelligenz (KI) lässt sich eine Vielzahl von Sicherheitsaufgaben automatisieren, darunter:
- Untersuchung von Bedrohungen: KI-fähige Tools können das Sicherheitsteam priorisiert auf besonders risikoreiche oder verdächtige Aktivitäten hinweisen.
- Reaktion auf Vorfälle: Algorithmen legen fest, wie Systeme auf ein Ereignis reagieren sollen. Zu den automatisierten Reaktionen kann die Isolierung eines gefährdeten Geräts oder das Löschen verdächtiger Dateien gehören.
- Erstellung von Playbooks: Best Practices helfen bei der Definition von Arbeitsabläufen von Routineaufgaben.
- Verwaltung von Berechtigungen: Automatisierung bei Bereitstellung und Aufhebung von Konten (On-/Off-Boarding) sowie die Moderation von Anfragen für Änderungen oder neue Berechtigungen reduziert die Angriffsfläche.
- Berichterstattung und Compliance: Routinemäßige Protokollierungs- und Berichtsaktivitäten weisen frühzeitig auf Probleme bei der Einhaltung gesetzlicher Vorschriften hin.
Für die Automatisierung ist maschinelles Lernen (ML) von entscheidender Bedeutung. Durch die Analyse von Daten lernen Plattformen ständig dazu. Die Geschwindigkeit des maschinellen Lernens ermöglicht automatisierte Reaktionen in Echtzeit in einer dynamischen Servicelandschaft. Die Unterstützung von ITOM-Teams durch KI wird auch AIOps genannt.
Intelligente Werkzeuge für zufriedenere Mitarbeitende
AIOps-Lösungen automatisieren und zentralisieren die Orchestrierung von Ereignissen und befreien Alarme von Störgeräuschen (Rauschen). Unternehmen berichten von bis zu 44 Prozent weniger Vorfällen, die ein manuelles Eingreifen erfordern. Teams können sich auf neue – strategische – Aufgaben konzentrieren, die dem Unternehmen Wettbewerbsvorteile verschaffen. Die Investition in intelligente Automatisierungstechnologie ist also auch wirtschaftlich sinnvoll.
„Egal wie aufregend neue und automatisierte Prozesse sein können: Fachwissen und Urteilsvermögen sind ein wertvolles Werkzeug bei der Reaktion auf Vorfälle.“
Sean Scott, PagerDuty
Die Lösung liegt jedoch nicht nur in der neuesten Technologie allein. Unternehmen müssen auch in eine neue Kultur investieren. Laut dem „State of Digital Operations“-Report steigern Investitionen in DevOps den betrieblichen Reifegrad der ITOM-Teams schneller. Diese betriebliche Reife korreliert mit einer gleichmäßigen Verteilung der Arbeit im Team und einer effizienteren Reaktion auf Incidents. Im Gegenzug sinkt die Burnout-Rate. Geringe Lernkurven helfen auch bei der Schließung personeller Lücken. Jüngere oder weniger erfahrene Mitarbeitende können schneller in ihrem Aufgabengebiet wachsen und eigenverantwortlicher arbeiten.
Auto-Ops ist die Zukunft im Servicemanagement
In einem zunehmend komplexen und dynamischen Markt müssen sich Unternehmen kontinuierlich auf Verbesserungen konzentrieren. Schnellere Reaktionszeiten und geringere Arbeitsbelastung verbessern die Sicherheit und Wirtschaftlichkeit eines Unternehmens gleichermaßen.
Die Automatisierung der Triage und Untersuchung von Vorfällen hilft ITOM- und Service-Teams, die Ursache von Vorfällen schnell zu identifizieren. Weniger Zeitaufwand für manuelle Aufgaben führt zu weniger Burnout und mehr Zeit für die Ausarbeitung effektiver Reaktionsstrategien. Darüber hinaus unterstützen automatisierte Workflows die Konsistenz des Reaktionsprozesses auf Vorfälle und reduzieren menschliche Fehler. Die höhere Servicequalität verbessert die Kundenerfahrung.
Dennoch ist es wichtig, das menschliche Element nicht zu vernachlässigen. Egal wie aufregend neue und automatisierte Prozesse sein können: Fachwissen und Urteilsvermögen sind ein wertvolles Werkzeug bei der Reaktion auf Vorfälle. Es ist daher wichtig, auch in neue Kulturen wie DevOps und die Aus- beziehungsweise Weiterbildung von Mitarbeitenden zu investieren.
Nach COVID-19 können Organisationen mit den richtigen internen Unterstützungsstrukturen ein perfektes Gleichgewicht zwischen menschlichem Fachwissen und Automatisierung erreichen. Für die Kunden macht vor allem erstes den entscheidenden Unterschied aus.
Über den Autor:
Sean Scott ist Chief Product Development Officer bei PagerDuty. Er ist verantwortlich für die Entwicklung und Bereitstellung der PagerDuty Operations Cloud-Plattform und -Roadmap, einschließlich der KI- und generativen KI-Lösungen, sowie für die Aufrechterhaltung der Integrität und Sicherheit des Datenmodells. Er leitet die Teams für Produktmanagement, Technik, Design, Preisgestaltung sowie Customer Success., um Wachstum und Innovation durch nahtlose, schnell umsetzbare und nutzerorientierte Lösungen zu fördern. Sean verfügt über mehr als 20 Jahre Erfahrung in der Technologiebranche, die meisten davon bei Amazon.
Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.