AlienCat - stock.adobe.com

Wie künstliche Intelligenz Administratoren unterstützt

Künstliche Intelligenz wird alle Bereiche der IT – von der Entwicklung bis zur Administration nachhaltig verändern. Wir erklären, wie eine AIOps-Strategie im Idealfall aussieht.

Künstliche Intelligenz (KI) – oder der englische Begriff AI (Artificial Intelligence) wird als Begriff häufig inflationär verwendet. Viele so genannte KI-Systeme auf dem Markt sind nichts anderes als ziemlich einfache regelbasierte Maschinen und eben keine richtige künstliche Intelligenz.

Ein besseres Verständnis für die Einsatzgebiete von DevOps erhalten Entscheider, wenn sie vergleichen, wie ihre Teams bestimmte Probleme bisher behandeln – und wie künstliche Intelligenz diese Aufgaben übernehmen oder verändern könnte.

Dazu gehört ein Vergleich zwischen der KI und dem, was sie ersetzen oder erweitern soll: dem menschlichen Gehirn. Menschen erkennen beispielsweise schnell, wenn ein Ereignis von gewohnten Mustern abweicht. So sind sie zum Beispiel in der Lage, auf einem HD- oder 4K-Bildschirm einzelne tote Pixel zu erkennen.

Für die Überwachung einer vollständigen IT-Plattform reichen menschliche Fähigkeiten jedoch nicht aus – hier gibt es zu viele Faktoren und Variablen gleichzeitig, als dass ein Mensch sie alle im Blick behalten könnte.

Daher aggregieren IT-Überwachungssysteme in Unternehmen Systemprotokolle und analysieren Muster und Abweichungen von diesen. Wenn solche Systeme feststellen, dass etwas nicht in Ordnung ist, senden sie eine Warnung an den Systemadministrator, so dass dieser geeignete Gegenmaßnahmen einleiten kann.

Rule Engines können in solchen Managementplattformen häufige Probleme automatisiert behandeln. Sie reagieren auf einen festen Auslöser innerhalb der Vorgaben mit immer derselben Lösung. Das kann in vielen Fällen hilfreich sein, lässt aber immer noch viel zu wünschen übrig. Hier tritt die KI auf den Plan.

Für den Einsatz von KI gibt es drei grundlegende Ansätze:

  • fortgeschrittene Wenn-Dann-Logik

  • einfache Intelligenz

  • fortgeschrittene Intelligenz

Im Folgenden untersuchen wir, wie diese Ansätze der KI im IT-Betrieb angewendet werden könne.

AIOps und wenn-dann-Sätze

Auch Menschen, die auf ein Problem stoßen, das sie schon einmal gelöst haben, neigen dazu, als erstes die bereits bekannte Lösung anzuwenden. Sie handeln dann ähnlich einer einfachen Rule Engine und haben damit meistens auch Erfolg.

AIOps-Systeme sind hierzu ebenfalls in der Lage. Alles, was sie brauchen, ist ein Satz bereits bekannter Probleme und Lösungen und die Fähigkeit, während des Betriebs neue Probleme und Lösungen zu erkennen und ihrem Wissensbestand hinzuzufügen. So könnte die KI lernen, wenn es einen neuen Patch gibt und diesen in ihr Lösungsrepertoire aufnehmen, oder sie lernt im Laufe der Zeit, wie sich Ressourcen Workloads besser zuweisen lassen.

Aufgaben für einfache KI

Doch was passiert, wenn die erlernte Lösungsstrategie fehlschlägt? Wenn beispielsweise das Problem nach dem Patch immer noch auftritt? Ein Mensch würde nun dazu neigen, seine Schritte nachzuvollziehen, um das System in den vorherigen Zustand zu bringen, in dem es noch problemlos lief.

Ein AIOps-System sollte also stets selbstständig einen Wiederherstellungspunkt erstellen, bevor es eine Änderung anwendet; es könnte dann, sobald es einen Fehler erkennt, den es selbst verursacht hat, seine Änderungen rückgängig machen.

Noch besser wäre es natürlich, wenn die künstliche Intelligenz selbstständig den Grund für das Scheitern einer Aktion ermitteln könnte. Lässt sich die Ursache beheben? Wie hoch sind die Chancen, dass die Korrektur funktioniert? Wie lange wird es dauern – und wie wird sich das auf die Workloads auswirken? In einem solchen Szenario müsste die KI in der Lage sein, betriebliche und damit finanzielle Auswirkungen verschiedener Vorgehensweisen gegeneinander abzuwägen, um eine Risikobewertung durchzuführen und dann die günstigste Entscheidung zu treffen. Das erfordert jedoch fortgeschrittene KI-Fähigkeiten.

Anspruchsvollere Einsatzszenarien für KI

Was passiert, wenn eine KI mit einem komplett unbekannten Problem konfrontiert ist? Der Mensch jedenfalls reagiert darauf mit einer Palette von Möglichkeiten, von weniger hilfreichen, emotionalen Reaktionen bis hin zu Humor oder ruhigem, strategischem Vorgehen. Mitunter alles zur selben Zeit.

In diesem Fall muss die KI in der Lage sein, das Problem auf ihre eigene Weise zu bearbeiten. Bei einem DDoS-Angriff hat sie die Option, Zugriffe vollständig zu blockieren, oder den Workload zu verlagern, um die Auswirkungen zu minimieren. Oder handelt es sich lediglich um einen Fehlalarm, weil ein Nutzer von einem unbekannten Gerät zugreift oder sich anderweitig verdächtig verhält.

Es ist hier für KI und Mensch gleichermaßen schwierig, die richtige Entscheidung zu treffen. Nehmen wir an, das Überwachungssystem zeigt deutliche Anzeichen, dass mit der Plattform etwas nicht stimmt, doch es ist nicht ganz eindeutig, was. Menschen würden nun den Kontext ihres Erfahrungsschatzes heranziehen. Eventuell sind sie im Laufe ihres Berufslebens auf etwas Ähnliches gestoßen, das sie zu einer Lösung inspirieren könnte. Alternativ können sie Andere um Rat oder Anregungen bitten.

Ein AIOps-System kennt keine Kontexte, kann aber dafür eine größere Menge Lösungsvorschläge überprüfen und abgleichen als ein Mensch. Wenn die installierten Regeln und plattformspezifische Problemdatenbank kein Ergebnis liefern, gleicht sie ihr Problem mit einer Cloud-Datenbank ab, in der andere KIs ihre Problemlösungen abgespeichert haben.

Unter tausenden von abgespeicherten Datensätzen findet sie möglicherweise den gleichen Fehler und eine Lösung dafür. Für die Kommunikation benötigen Mensch wie Maschine ein möglichst eindeutiges Vokabular, im Fall der künstlichen Intelligenz eine standardisierte Taxonomie zur Beschreibung des Problems. Nur so kann letztere sinnvolle Antworten aus externen Ressourcen zurückerhalten.

Die KI-Engine muss dann in der Lage sein, das Problem anhand der neuen Informationen noch einmal zu analysieren. Jede mögliche Lösung muss gegen die potenziellen Risiken abgewogen werden, denen das Unternehmen im Falle eines Scheiterns ausgesetzt wäre. Wenn das Geschäftsrisiko zu hoch ist, muss das AIOps-System schließlich den Menschen hinzuziehen.

Wir befinden uns noch im Anfangsstadium solcher ausgefeilter KI im IT-Betrieb. Wir sollten jedoch damit rechnen, dass diese Technologien sich in den kommenden Jahren erheblich weiterentwickeln werden und ihre Akzeptanz mit zunehmendem Reifegrad steigen wird. Entscheider sollten sicherstellen, dass ihre Systeme bis dahin für den Einsatz von KI bereit sind – und ihre Erwartungen dem anpassen, was KI wahrscheinlich leisten können wird.

Erfahren Sie mehr über Disaster Recovery