AIOps (Artificial Intelligence for IT Operations)
Artificial Intelligence for IT Operations (zu deutsch: Künstliche Intelligenz für IT-Operationen), kurz AIOps, ist ein Überbegriff für den Einsatz von Technologien der Big Data Analytics, des maschinellen Lernens (ML) und anderer künstlicher Intelligenz (KI) zur Automatisierung der Identifizierung und Lösung gängiger Probleme der Informationstechnologie (IT). Die Systeme, Dienste und Anwendungen in einem großen Unternehmen produzieren immense Mengen an Protokoll- und Leistungsdaten. AIOps verwendet diese Daten zur Überwachung von Anlagen und zur Gewinnung von Einblicken in Abhängigkeiten ohne und außerhalb von IT-Systemen.
Eine AIOps-Plattform sollte drei Fähigkeiten in das Unternehmen einbringen:
- Automatisierung von Routineverfahren.
Zu den Routinepraktiken gehören sowohl Benutzeranfragen als auch unkritische IT-Systemwarnungen. Beispielsweise können AIOps ein Helpdesk-System in die Lage versetzen, eine Benutzeranfrage zur automatischen Bereitstellung einer Ressource zu bearbeiten und zu erfüllen. AIOps-Plattformen können auch falsche Alarmmeldungen erkennen, indem sie einen Alert auswerten und feststellen, dass kein Handlungsbedarf besteht, da die verfügbaren relevanten Metriken und unterstützenden Daten innerhalb normaler Parameter liegen.
- Erkennen schwerwiegender Probleme schneller und mit größerer Genauigkeit als Menschen.
IT-Fachleute können ein bekanntes Malware-Ereignis auf einem unkritischen System behandeln, aber einen ungewöhnlichen Download oder Prozess, der auf einem kritischen Server startet, ignorieren, weil sie nicht auf diese Bedrohung achten. AIOps geht dieses Szenario anders an, indem das Ereignis auf dem kritischen System als möglicher Angriff oder Infektion priorisiert wird, weil das Verhalten außerhalb der Norm liegt, und das bekannte Malware-Ereignis durch Ausführen einer Antimalware-Funktion weniger priorisiert wird.
- Rationalisieren von Interaktionen zwischen Rechenzentrumsgruppen und -teams.
AIOps versorgt jede funktionale IT-Gruppe mit relevanten Daten und Perspektiven. Ohne KI-aktivierte Operationen müssen die Teams Informationen austauschen, analysieren und verarbeiten, indem sie sich treffen oder Daten manuell verschicken. AIOps sollten lernen, welche Analyse- und Überwachungsdaten jeder Gruppe oder jedem Team aus dem großen Pool von Ressourcenmetriken angezeigt werden können.
Anwendungsfälle
AIOps wird im Allgemeinen in Unternehmen verwendet, die DevOps oder Cloud Computing einsetzen, sowie in großen, komplexen Unternehmen. AIOps unterstützt Teams, die ein DevOps-Modell verwenden, indem es den Entwicklungsteams zusätzliche Einblicke in ihre IT-Umgebung gewährt, wodurch die Betriebsteams mehr Einblick in Änderungen in der Produktion erhalten. AIOps beseitigt auch viele Risiken, die mit hybriden Cloud-Plattformen verbunden sind, indem es die Betreiber in ihrer gesamten IT-Infrastruktur unterstützt. In vielen Fällen können AIOps jedem großen Unternehmen helfen, das über eine umfangreiche IT-Umgebung verfügt. Die Möglichkeit, Prozesse zu automatisieren, Probleme in einer IT-Umgebung früher zu erkennen und die Kommunikation zwischen den Teams zu erleichtern, wird den meisten großen Unternehmen mit umfangreichen oder komplizierten IT-Umgebungen helfen.
AIOps-Technologien
AIOps verwendet ein Konglomerat verschiedener KI-Strategien, einschließlich Datenausgabe, Aggregation, Analytik, Algorithmen, Automatisierung und Orchestrierung, maschinelles Lernen und Visualisierung. Die meisten dieser Technologien sind recht gut definiert und ausgereift.
AIOps-Daten stammen aus Log-Dateien, Metriken und Überwachungstools, Helpdesk-Ticketing-Systemen und anderen Quellen. Große Datentechnologien aggregieren und organisieren den gesamten Output der Systeme in einer nützlichen Form. Analysetechniken können die Rohinformationen interpretieren, um neue Daten und Metadaten zu erstellen. Analyseverfahren reduzieren das Rauschen, das heißt nicht benötigte oder falsche Daten, und erkennen auch Trends und Muster, die es dem Tool ermöglichen, Probleme zu identifizieren und zu isolieren, den Kapazitätsbedarf vorherzusagen und andere Ereignisse zu behandeln.
Die Analytik erfordert auch Algorithmen zur Kodifizierung des IT-Fachwissens, der Geschäftspolitik und der Ziele der Organisation. Algorithmen ermöglichen es einer AIOps-Plattform, die wünschenswertesten Aktionen oder Ergebnisse zu liefern - Algorithmen sind die Art und Weise, wie das IT-Personal sicherheitsrelevante Ereignisse priorisiert und der Plattform Entscheidungen zur Anwendungsleistung beibringt. Die Algorithmen bilden die Grundlage für das maschinelle Lernen, wobei die Plattform eine Grundlinie normaler Verhaltensweisen und Aktivitäten festlegt und dann neue Algorithmen entwickeln oder erstellen kann, wenn sich die Daten aus der Umgebung im Laufe der Zeit ändern.
Automatisierung ist eine grundlegende Schlüsseltechnologie, um AIOps-Tools zum Handeln zu bewegen. Automatisierte Funktionen treten auf, wenn sie durch die Ergebnisse der Analytik und des maschinellen Lernens ausgelöst werden. Wenn beispielsweise die prädiktive Analyse und ML eines Tools feststellen, dass eine Anwendung mehr Speicherplatz benötigt, wird ein automatisierter Prozess gestartet, um zusätzlichen Speicher in Inkrementen zu implementieren, die den algorithmischen Regeln entsprechen.
Schließlich liefern Visualisierungstools menschenlesbare Dashboards, Berichte, Grafiken und andere Ausgaben, damit die Benutzer Änderungen und Ereignisse in der Umgebung verfolgen können. Mit diesen Visualisierungen können Menschen auf Informationen reagieren, die Entscheidungsfindungsfähigkeiten erfordern, die über die der AIOps-Software hinausgehen.
Vor- und Nachteile des AIOps
Wenn eine AIOps-Plattform richtig implementiert und geschult ist, reduziert eine AIOps-Plattform die Zeit und Aufmerksamkeit des IT-Personals, die für alltägliche, routinemäßige Warnmeldungen aufgewendet werden müssen. Das IT-Personal unterrichtet die AIOps-Plattformen, die dann mit Hilfe von Algorithmen und maschinellem Lernen weiterentwickelt werden, wobei das im Laufe der Zeit erworbene Wissen wiederverwendet wird, um das Verhalten und die Wirksamkeit der Software weiter zu verbessern. AIOps-Tools führen auch eine kontinuierliche Überwachung ohne Schlafbedarf durch. Die Menschen in der IT-Abteilung konzentrieren sich auf ernste, komplexe Probleme und auf Initiativen, die die Leistungsfähigkeit und Stabilität des Unternehmens erhöhen.
AIOps-Software kann kausale Beziehungen über mehrere Systeme, Dienste und Ressourcen hinweg beobachten, wobei unterschiedliche Datenquellen geclustert und korreliert werden können. Diese Analyse- und ML-Fähigkeiten ermöglichen es der Software, eine leistungsstarke Ursachenanalyse durchzuführen, was die Fehlersuche und Behebung schwieriger und ungewöhnlicher Probleme beschleunigt.
AIOps können die Zusammenarbeit und die Workflow-Aktivitäten zwischen IT-Gruppen sowie zwischen der IT und anderen Geschäftsbereichen verbessern. Mithilfe maßgeschneiderter Berichte und Dashboards können Teams ihre Aufgaben und Anforderungen schnell verstehen und mit anderen zusammenarbeiten, ohne alles zu lernen, was das andere Team wissen muss.
Obwohl die AIOps zugrundeliegenden Technologien relativ ausgereift sind, ist es noch ein frühes Feld, was die Kombination der Technologien für den praktischen Einsatz betrifft. AIOps ist nur so gut wie die Daten, die es erhält, und die Algorithmen, die ihm beigebracht werden. Der Zeit- und Arbeitsaufwand für die Implementierung, Wartung und Verwaltung einer AIOps-Plattform kann beträchtlich sein. Die Vielfalt der verfügbaren Datenquellen sowie die ordnungsgemäße Datenspeicherung, -sicherung und -aufbewahrung sind allesamt wichtige Faktoren für die Ergebnisse von AIOps.
AIOps erfordert Vertrauen in die Werkzeuge, was für einige Unternehmen ein treibender Faktor sein kann. Damit ein AIOps-Tool autonom agieren kann, muss es Änderungen innerhalb seiner Zielumgebung genau verfolgen, Daten sammeln und sichern, korrekte Schlussfolgerungen auf der Grundlage der verfügbaren Algorithmen und des maschinellen Lernens ziehen, Aktionen richtig priorisieren und die geeigneten automatisierten Maßnahmen ergreifen, um den Geschäftsfachleuten und Zielen gerecht zu werden.
Implementierung von AIOps und AIOps-Anbietern
Um den Wert des Einsatzes von AIOps zu demonstrieren und das Risiko zu mindern, sollte die Technologie in kleinen, sorgfältig orchestrierten Phasen eingeführt werden. Entscheiden Sie sich für das geeignete Hosting-Modell für das Tool, zum Beispiel vor Ort oder als Dienstleistung. Das IT-Personal muss das System verstehen und dann bedarfsgerecht schulen, und dazu müssen ihm umfangreiche Daten aus den überwachten Systemen zur Verfügung stehen.
AIOps ist ein aufstrebender Bereich, aber es gibt eine wachsende Zahl von Produktangeboten, die von Unternehmen geprüft und bewertet werden müssen, einschließlich, aber nicht beschränkt auf, AIOps:
- IT Service Intelligence (ITSI) von Splunk
- TrueSight-Plattform von BMC
- Crosswork Situation Manager von Cisco, der AIOps-Teil der Cisco Crosswork Network Automation Produktfamilie
- Moogsoft AIOps
- DRYiCE AIOps von HCL Technologies
Die Merkmale und Funktionen der AIOps erscheinen auch in bestehenden Produktsuiten. Beispiele hierfür sind:
- New Relic Applied Intelligence (NRAI), das KI-basierte Radar- und Fehlerprofil-Funktionen in die New Relic Digital Intelligence-Plattform integriert
- Trebuchet Application Deployment Platform von Datapipe, die sich zur Verbesserung der DevOps-Prozesse auf KI verlässt