Vasily Merkushev - stock.adobe.c
Sieben prognostische Analyse-Tools für Storage-Umgebungen
Viele Storage-Management-Lösungen setzen heute KI-Algorithmen ein, um prognostische Aussagen über Leistung und Kapazitätsbedarf zu treffen oder die Ursache von Störungen zu finden.
Maschinenlernen (Machine Learning), computergestützte Statistik und diverse Deep-Learning-Modelle haben künstliche Intelligenz (KI) zu einer gängigen Technologie gemacht. Soziale Netzwerke, Suchmaschinen und Shopping-Webseiten verwenden KI-Anwendungen unter anderem für Personalisierungs- und Produktempfehlungs-Engines, die Analyse von Clickstreams, die Bildidentifikation und -klassifizierung und die Preisoptimierung.
Unternehmen wie Amazon, Google oder Microsoft bieten KI-Dienste im Paket aus der Cloud an. Entwickler müssen die komplizierten Algorithmen so nicht im Detail kennen. In den vergangenen Jahren wurden entsprechende KI-Verfahren auch auf viele Aufgaben von IT-Betrieb und -management angewendet. Hier spricht man von AIOps.
Besonders wichtig ist der Einsatz von AIOps in Produkten, die Infrastruktur umfassend verwalten und betreiben. KI fließt inzwischen auch in mit Rechenzentrumshardware gebündelte Managementsoftware ein. Das gilt auch für Storage-Systeme.
Wie in diesem früheren Artikel beschrieben wird die KI-Disziplin Maschinenlernen (ML) beim Storage-Management verwendet, um die gigantischen erzeugten Datenmengen über System-Events, interne Parameter, Workload-spezifische Messungen sowie die Kapazitätsauslastung zu analysieren.
Die Genauigkeit der ML-Modelle korreliert direkt mit der Datenqualität der Trainingsdaten. Daher aggregieren die meisten Storage-Anbieter anonymisierte Daten aller ihre Kunden in gigantischen Datensammlungen. Sie bilden nahezu jedes denkbare Szenario, jede Workload und jede Anomalie ab, die bei Anwendern vorkommen kann.
Die Kombination von KI und gerätegebundener Telemetrie führt zu prognostischen (prädiktiven, voraussagenden) Produkten für die Storage-Analyse. Sie beschleunigen das Setup signifikant, optimieren automatisch Konfigurationen, warnen proaktiv vor sich anbahnenden Problemen und beheben sogar verbreitete Fehler, ohne dass sich ein Storage-Administrator darum kümmern muss. Es folgen einige Details zu Storage-Management-Produkten von Herstellern, die KI-basierte Analytik nutzen, um den Betrieb der Arrays und die Effizienz des Storage-Managements zu verbessern.
Typische Eigenschaften und Fähigkeiten AI-basierter Storage-Tools
Bevor man sich mit den analytischen Fähigkeiten der Produkte befasst, ist es wichtig, einige Grundlagen zu verstehen.
-
Der Begriff KI als trendige, neue Technologie führt mitunter zu bemerkenswerte Übertreibungen und falscher Verwendung – das sogenannte KI-Washing. Frühere Standard-Funktionen werden minimal aufgebessert, so dass sie neue Daten erfassen können, und schon spricht der Anbieter von KI-basierten neuen Fähigkeiten.
-
Hersteller lassen es oft im Unklaren, wofür die KI in ihren Produkten genau eingesetzt wird und wie sie das Management gegenüber der bisherigen Funktionalität verbessert haben.
Die meisten Produkte verwenden die maschinelle Datenanalyse, um eine oder mehrere der folgenden fünf Funktionen zu realisieren:
- Automatisierung alltäglicher Supportaufgaben wie Kapazitätsmanagement.
- Optimierung der Konfiguration von Geräten und der Einrichtung von Volumes.
- Aktualisierung der Systemsoftware, Patching, Geräte- und installationsspezifische Hot-Fixes.
- Planung von Kapazitätserweiterungen mittels prognostischer Trends und Szenarienanalyse.
- Management von Virtualisierungs-Plattformen durch plattformspezifische Optimierungen und Metriken.
Mit interessanten Funktionen versuchen Storage-Anbieter, die analytischen Fähigkeiten ihres KI-basierten Storage von denen anderer Produkte zu differenzieren. Die Qualität, mit der die Software eines Produkts arbeitet, bestimmt, wie gut es die Versprechen der KI einlöst. Die Vorteile von KI für Storage-Administratoren sind bedeutend. Dazu gehören:
-
Niedrigere Betriebsausgaben durch Automatisierung, besonders bei Aufgaben wie Kapazitäts- und Leistungsmanagement, die sonst häufig zu ungeplanten Schnelleinsätzen führen.
-
Höhere Systemverfügbarkeit durch proaktive Problemlösung, beispielsweise die automatische Erweiterung voller Volumes, das Ausbalancieren der Ressourcennutzung durch den Wechsel auf ein anderes Gerät oder die rechtzeitige Warnung vor Laufwerksausfällen, bevor sie Schaden anrichten können.
-
Bessere Ressourcenausnutzung und -effizienz durch Empfehlung optimaler Konfigurationen und Workload-Platzierungen, Parameteroptimierung bei sich ändernden Telemetrie-Daten und kein Überprovisionieren von Data-Set-Kapazitäten.
Prognostische Storage-Analyse-Tools ermöglichen Systemen und Administratoren also, effektiv, effizient und verlässlich zu arbeiten.
Im Folgenden geht es um durch KI verbesserte Storage-Produkte, ihre wichtigsten Eigenschaften und Funktionen. Dabei erhebt der Artikel keinen Anspruch auf Vollständigkeit, sondern konzentriert sich auf Lösungen wichtiger Hersteller.
Dell EMC CloudIQ
Dell EMC CloudIQ SaaS ist für Kunden der Storage-Systeme des Herstellers kostenlos erhältlich. Dies gilt für Unity XT, PowerMax, XtremIO, SC Series, PowerVault, Isilon und Connectrix Fibre Channel Switches. Die Funktionen von CloudIQ umfassen konsolidiertes Monitoring, prognostische Analyse und die Detektion von Auffälligkeiten. All dies wird durch Maschinenlernen ermöglicht. Zu den Fähigkeiten gehören:
- konsolidierte Überwachung aller Storage-Systeme in einer Umgebung
- prognostische Analysen, um vorbeugend vor sich anbahnenden Kapazitätsengpässen zu warnen
- Detektion von Auffälligkeiten mit Risikopotential für Leistung und Sicherheit anhand der Abweichungen von einem erlernten Normalzustand
- Ursachenanalyse von Problemen
Die Dashboards von CloudIQ, Warnungen und Prognosen basieren auf Daten aus System-Benachrichtigungen, Leistungsmetriken, Kapazitätsauslastung und der Systemadministration. Sie können in Logs oder über Dashboards, Visualisierungen und rechnergestützte Metriken angezeigt werden.
CloudIQ fasst Daten zu einer sogenannten proaktiven Systemgesundheits-Kennziffer zusammen („Proactive Health Score“). Dieser Wert weist auf den Gesundheitszustand des Gesamtsystems hin. Die normalisierte Skala reicht von 1 bis 100 und basiert auf Daten über die Ausfälle von Komponenten, die Schwachstellen von Konfigurationen, über Leistungs- und Kapazitätsprobleme sowie den Datenschutz.
CloudIQ ist über das Web oder eine mobile Nutzerschnittstelle verwendbar. Das Tool bietet Informationen von den übergreifenden Health Score für Systeme in einer Umgebung bis zu Details über individuelle Arrays und Storage Volumes.
Hewlett Packard Enterprise InfoSight
InfoSight ist ein Cloud-basiertes prognostisches Storage Analytics Tool. Es verwendet wie die übrigen hier erwähnten Produkte Maschinenlernen, um Server, Storage und Virtuelle Maschinen in einer Umgebung zu analysieren. Laut HPE kann das Produkt 86 Prozent aller Systemprobleme vorhersagen und proaktiv lösen, bevor sie den Betrieb oder einzelne Workloads beeinträchtigen.
InfoSight bietet eine zentrale Management-Konsole, die Events aus dem gesamten Infrastruktur-Stack analysieren und korrelieren kann – einschließlich Storage, Server und VMs. Es handelt sich um ein ausgereiftes Produkt, das HPE mit dem Aufkauf von Nimble Storage übernommen hat. Nimble war einer der Pioniere beim Einsatz aggregierter, anonymisierter Daten für die Prognose von Storage-Leistung und Ressourceneinsatz.
Wie Wettbewerbsprodukte auch analysiert HPE Kundendaten, um die ML-Modelle von InfoSight auszubauen und zu verfeinern. Das System kann Probleme erkennen und manchmal auch beheben, die noch nicht eingetreten sind. Außerdem integriert HPE InfoSight mit den Support, so dass automatisch eine Störungsmeldung erstellt wird, wenn das System ein festgestelltes Problem nicht automatisiert lösen konnte.
Hitachi Ops Center Analyzer
Hitachi Ops Center Analyzer gehört zu Hitachis Software Suite Ops Center. Die ML-basierte Managementsoftware eignet sich für gemeinsam genutzte Storage-Systeme, Server, VMs und SAN-Switches. Sie ist als installierbares Produkt oder SaaS verfügbar. Zu den wichtigsten Fähigkeiten gehören:
- eine konsolidierte Sicht der überwachten Ressourcen auch über mehrere Rechenzentren hinweg
- vorausschauende Analyse mit vorbeugenden Warnungen vor Ressourcenknappheit und Unterstützung bei der Planung
- Anomalieerkennung auf Basis kalkulierter historischer Muster
- durch ML angereicherte Problemanalyse, um bei Problemen durch die Korrelation von Events, Leistungsmessdaten und Konfigurationsänderungen automatisch deren Ursache zu finden und Lösungen zu empfehlen
Die Software für die vorausschauende Storage-Analyse ist in Hitachis übrige Software für den IT-Betrieb einschließlich Ops Center Automator integriert. Wie Dells Produkt besitzt Hitachi Ops Center Analyzer ein zusammenfassendes Dashboard der überwachten Ressourcen. Es hebt kritische Benachrichtigungen, Warnungen und Leistungstrends hervor, ermöglicht Storage-Admins aber auch, sich auf spezifische Storage-Systeme zu konzentrieren.
IBM Storage Insights
Storage Insights ist ein frei erhältliches Kapazitäts- und Managementprodukt von IBM. Diese Edition unterstützt IBM und einige Block- und virtualisierte Storage-Systeme von Drittherstellern. Zusätzlich sammelt Storage Insight automatisch Log-Daten der Systeme und fasst sie zusammen.
Dadurch entsteht ein Verzeichnis der Systeme mit grundlegenden Daten zu ihrer Konfiguration, Kapazität, Leistung und ihrem Gesundheitszustand. Konfigurationen, die nicht den Empfehlungen von IBM entsprechen, werden markiert. Die Software macht Migrations- und Aktualisierungsvorschläge.
Ein Pro-Abo erweitert die Funktionen um Unterstützung für IBMs File- und Object-Storage-Systeme sowie EMCs VNX und VMAX-Produkte. Mit Pro-Abo profitieren Anwender von IBM Storage Insights zudem von umfassenden Inventarisierungs- und Überwachungsoptionen, Optimierungs- und Platzierungsempfehlungen für Tiered-Storage-Umgebungen und kundenspezifischen Benachrichtigungen.
Beide Ausgaben haben Dashboards, die an unterschiedliche IT-Aufgaben angepasst werden können. Dazu gehören Systembetrieb, Konfigurationsoptimierung, Leistung, Kapazitätsplanung, Problemlösung und Produktsupport.
Infinidat Infiniverse
Infinidat dehnt die Reichweite seiner ML-Funktionen mit Hilfe eines intelligenten Daten-Cache von der Managementebene auf das Storage-System aus. Der Cache-Management-Algorithmus, Neural Cache, verwendet die Daten zu vorangegangenen Datenzugriffen und Ein-/Ausgabevorgängen, um Zugriffsmuster und Korrelationen zu identifizieren. Damit verwaltet der Algorithmus das Cache-Storage und erhöht so die Leistung.
Das Managementprodukt InfiniVerse, das mit allen Storage-Systemen von Infinidat kommt, bietet konsolidierte Monitoring-Funktionen für System und Leistung. Dazu gehören ML-basierte Analytik, die mit anonymisierten Metadaten der Infinidat-Kunden trainiert wird.
Diese KI-basierte Analytik identifiziert Veränderungen, um die Kapazitätsauslastung zu verbessern, Leistungsengpässe zu beseitigen und die Platzierung von Workloads zu optimieren. Das System findet brachliegende, also zugewiesene, aber nicht benötigte, Storage-Kapazitäten, Hardwarefehler oder abweichende Anwendungszustände – etwa, wenn die Anfragen und Abfragen eines Datenbankservers unakzeptabel verzögert werden.
2020 plant Infinidat die Erweiterung um automatisierte Workload-Mobilität. Das heißt, dass Workloads automatisch zwischen den Racks eines verteilten Storage-Clusters verschoben werden können. Die Funktion soll Leistung und Zuverlässigkeit erhöhen.
NetApp Active IQ
Active IQ hat ebenfalls die bereits weiter oben genannten fundamentalen ML-basierten Analyse- und Managementfunktionen. Auch dieses Produkt verwendet wie die meisten in dieser Kategorie bei NetApp-Kunden gesammelte Metadaten, um seine Vorhersagemodelle zu trainieren. Wie HPE integriert NetApp Active IQ mit dem Supportteam: Die Software generiert Störungsmeldungen, sobald ein Problem auftritt, das sie nicht automatisch lösen kann.
Wie andere hier besprochene Storage-Produkte erzeugt ActiveIQ nicht nur Statistik und System-Dashboards. Darüber hinaus verwendet die Softwareanalysen, um Handlungsempfehlungen zur Lösung von identifizierten Problemen zu erzeugen.
Risikoberichte beispielsweise weisen entsprechende Vorkommnisse sechs Basiskategorien zu. Dazu gehören Hardwareausfälle, nicht unterstützte Konfigurationen und Ressourcenknappheit. Sie erzeugen dazu ein Feld „Corrective Action“, das mit Bulletins des Kundensupports, Fehlerberichten und Artikeln aus der Wissensbasis mit Bezug zum Thema verlinkt ist.
Über eine durch Token gesicherte Programmierschnittstelle (API, Application Programming Interface) können Funktionen und Daten aus ActiveIQ auch in eine DevOps-Automatisierungspipeline oder mit KPI-Dashboards(Key Performance Indicator) integriert werden.
Pure Storage Pure1 Meta
Pure1 Meta ist die Analytik-Plattform der Arrays von Pure Storage. Sie aggregiert laut Pure Storage mehr als eine Billion Datenpunkte pro Tag, die von den über die Cloud angebundenen Kunden erzeugt werden. Die Daten fließen in einen mehrere Petabyte großen Data Lake und die prognostischen Modelle für das Kapazitäts- und Leistungsmanagement trainiert.
Laut Pure Storage decken die Daten seiner rund 10.000 Kunden mindestens 100.000 unterschiedliche Anwendungen und Workload-Profile ab. Dadurch kann das System sowohl die übergreifende Leistung als auch die Interaktion zwischen den Applikationen auf einem Array modellieren und so bei Workload-Platzierung, Konsolidierung und der Optimierung der Konfigurationen helfen.
Mit der aggregierten Datensammlung kann Pure1 Meta Schwachstellen schon beim ersten Auftreten bei einem Kunden kennzeichnen und sie dann erkennen, bevor sie anderswo Sicherheits- oder Zuverlässigkeitsprobleme erzeugen. Wird eine Schwachstelle entdeckt, benachrichtigt Pure1 Meta die Storage-Administratoren und erzeugt eine Störmeldung, die an den Pure1-Support geht.
Zu Pure1 Meta gehört auch eine Simulationsfunktion. Sie prognostiziert den Einfluss neuer Workloads, von Volume-Verlagerungen und Hardwareveränderungen in der Umgebung. Durch den Test unterschiedlicher Szenarien vor dem Deployment können Storage-Administratoren Workloads besser platzieren und bessere Kaufentscheidungen bezüglich neuer Storage-Hardware treffen.
Pure1 Meta ist über eine Webschnittstelle oder als mobile App für iOS und Android verfügbar.
Der Markt für KI-basierte Storage entwickelt sich weiter
KI-basierte analytische Software gehört bei Storage-Herstellern inzwischen zum Standard. Die Qualität der prognostischen und beratenden Analytik und ihre Integration in Management- und Supportsoftware ist inzwischen ein kritisches Thema, wenn Kunden entsprechende Software evaluieren.
Die hier beschriebenen Produkte für vorausschauende Storage-Analyse konzentrieren sich auf die Hardware des jeweiligen Herstellers. Doch inzwischen wird KI-gestützte Managementsoftware auch für Multi-Cloud-Umgebungen verfügbar. Schon bald sollten daher auch heterogene Storage-Umgebungen von solchen Funktionen profitieren.