blackzheep - stock.adobe.com
Predictive Storage Analytics: Die 5 wichtigsten Features
Prädiktive Speicheranalyse-Tools etablieren sich in den Unternehmen. Dafür sollten Anwender diese fünf wichtigsten Funktionen, ihre Funktionsweise und Vorteile kennen.
Die meisten IT-Verantwortlichen kennen die Leistungsfähigkeit, den Komfort und die Genauigkeit der prädiktiven Datenanalyse. Ob es nun darum geht, etwas Neues auf Netflix zu sehen, Angebote zu durchsuchen, die sich auf einen Artikel beziehen, den man letzte Woche bei Amazon gekauft hat, oder die fehlerhafte Autokorrektur unseres Telefons zu verfluchen, die Vorhersageanalyse wird zunehmend eingesetzt, um Routineaufgaben zu automatisieren, Informationen zu filtern, bessere Entscheidungen zu treffen und den Kundendienst zu verbessern.
Dieselben Funktionen sind unter der Rubrik AIOps (Artificial Intelligence for IT Operations) in das Rechenzentrum gekommen, einer neuen Kategorie von Infrastrukturmanagement-Funktionen mit erheblichen Auswirkungen auf das Storage.
Die meisten frühen Anwendungen der prädiktiven Analytik konzentrierten sich auf Verbraucheranwendungen, bei denen riesige Datenmengen von Millionen von Nutzern gesammelt werden konnten, was es einfacher macht, die hohen Investitionen in Datenerfassung, Verarbeitung und Modellentwicklung zu rechtfertigen. Die Hürde für den ROI der prädiktiven Analyse ist hoch, weil es sich um ein anspruchsvolles Unterfangen handelt. Es geht weit über die traditionellen statistischen und probabilistischen Techniken hinaus und nutzt maschinelles Lernen und in einigen Fällen neuronales netzbasiertes Deep Learning, um Modelle zu trainieren und Vorhersagen auf der Grundlage großer Datensätze zu treffen. Der datengesteuerte Ansatz ist perfekt für die Automatisierung des IT-Systemmanagements angesichts der enormen Größe von Ereignisprotokollen, Systemtelemetrie und Performance-Metriken, die die heutige Infrastruktur bietet.
Fertigungs-, Logistik- und Anlagensteuerungssysteme sind wegweisend für den industriellen Einsatz der prädiktiven Analytik. Rolls-Royce beispielsweise nutzt die prädiktive Analytik, um die Wartung proaktiv zu planen und die Effizienz seiner Flugzeugtriebwerke zu verbessern. Im Speicher wird die prädiktive Analyse eingesetzt, um Geräteausfälle vorherzusagen und proaktiv zu beheben, Leistungsengpässe zu identifizieren und die Systemkonfiguration auf der Grundlage historischer Messungen zu optimieren.
All die Daten verarbeiten
Ob Netflix oder Google Assistant, es zeigt sich zweifellos, dass je mehr ein System genutzt wird, desto besser sind dessen Empfehlungen, denn die schrittweise Verbesserung der Genauigkeit hängt in erster Linie davon ab, dass Sie mehr Daten zur Verfügung haben. Gleiches gilt für die prädiktive Speicheranalyse. Die Software ist nur so genau wie die Daten, die sie hat, und sowohl Quantität als auch Qualität zählen: ein Vorhersagemodell, das auf falschen oder ungenauen Daten basiert, wird fehlschlagen.
Für die Software zur prädiktiven Speicheranalyse bedeutet der Datenbedarf das Sammeln riesiger Mengen von Systemereignissen, internen Parametern, Performance-Messungen und arbeitslastspezifischen Metriken. Die Basis-Telemetrie enthält:
- Ereignis- und Fehlerprotokolle, wie zum Beispiel Systemfehler und Anomalien
- Leistungskennzahlen, wie Gesamt- und Volumen-IOPS, Durchsatz für verschiedene Operationen – wie sequentielles Lesen, zufälliges Lesen und sequentielles Schreiben – und Latenzzeiten
- Bandbreitennutzung und Latenzzeit, aufgeteilt nach Workload
- Working Set (Hot Data) und Cache-Nutzung
Je größer der Datensatz für die Modellentwicklung und das Training ist, desto höher ist die Genauigkeit eines prädiktiven statistischen oder maschinellen Lernmodells. Angesichts dessen aggregieren und anonymisieren viele Anbieter Daten von allen ihren Kunden. Die Verwendung von Daten aus einer viel breiteren und vielfältigeren Stichprobe von Installationen ermöglicht es den Anbietern, ihre Prognosen deutlich zu verbessern und Leistungs-, Sicherheits- und Hardwareanomalien besser zu erkennen.
So sammelt beispielsweise Hewlett Packard Enterprise InfoSight, ein Ergebnis der Nimble-Akquisition von HPE, 30 bis 70 Millionen Sensordatenpunkte pro Tag aus praktisch jedem eingesetzten Nimble-Array. Das Unternehmen behauptet, dass 90 Prozent der identifizierten Probleme behoben werden können, bevor Kunden ein Problem erkennen.
Da der Trainingsdatensatz nur vom Anbieter der Storage-Software für die prädiktive Modellentwicklung verwendet wird, benötigt er keine Informationen, die bestimmte Kunden identifizieren, und jeder Kunde kann von den Erfahrungen anderer profitieren. Erstens nutzen Storage-Anbieter die aggregierten Daten, um prädiktive Modelle während der so genannten Trainingsphase des maschinellen oder Deep Learnings zu verbessern. Dann schieben sie die Modelle an die Systemmanagement-Software weiter, die während der Inference-Phase Echtzeit-Überwachungsdaten von einzelnen Systemen bezieht. Andere Modelle werden für die Systemkonfiguration, Kapazitätsplanung und Fehlersuche verwendet, um eine Ursachenanalyse durchzuführen.
Die Software für die prädiktive Speicheranalyse wird typischerweise verwendet, um eine Reihe von Aufgaben zu verbessern. Bei der Bewertung von Produkten sollten Sie sich vergewissern, wie sich die einzelnen Produkte in Bezug auf diese fünf Hauptmerkmale und -funktionen bewerten lassen:
1. Die Support-Automatisierung prognostiziert und verhindert Leistungs-, Kapazitäts-, Verfügbarkeits- und Sicherheitsprobleme. Kapazitätsmanagement ist die häufigste Anwendung der Software für die prädiktive Speicheranalyse. Modelle können die Nutzung pro Gerät, Volume und Anwendung in Echtzeit analysieren und proaktiv warnen, wenn sie die Auslastungsziele erreichen. Nach Ermessen des Administrators können Systeme automatisch zugewiesenen Speicherplatz hinzufügen oder vorhandene Kapazitäten neu ausbalancieren, um zu verhindern, dass sie ausgehen. Predictive Speicheranalysen können auch bei der Fehlersuche und der Ursachenanalyse helfen, indem sie Ereignisse im Zusammenhang mit einem bestimmten Problem korrelieren und identifizieren. Die Verwendung aggregierter Kundendaten ist besonders nützlich für die Fehlersuche, da sie dem Managementsystem eine Übersicht über die Obermenge der Probleme aller Kunden bietet und es ermöglicht, selbst subtile, bisher unsichtbare Probleme zu erkennen, die eine forensische Signatur mit ähnlichen Problemen teilen, die anderswo aufgetreten sind.
2. Management- und Konfigurationsfunktionen werden in Modellen dargestellt, die automatisch Leistung, Ressourcenverbrauch, Kapazitätsbasislinien und Trends bestimmen können. Dazu gehören solche, die nicht zu einfachen statistischen Modellen passen, wie lineare, polynomische Regression oder periodische zeitliche Schwankungen (saisonal, monatlich, wöchentlich). Baseline und Trends können verwendet werden, um die Einrichtung und Verwaltung von Speichersystemen zu automatisieren und die Ressourcennutzung und -effizienz zu verbessern, indem Konfigurationseinstellungen optimiert und die Workload-Platzierung unterstützt werden.
3. Update- und Patch-Funktionen für Systemsoftware wenden proaktiv Korrekturen an - vorbehaltlich der Zustimmung des Administrators - einschließlich Hotfixes, die zuvor identifizierte Systemprobleme beheben. Einige Anbieter verwenden Analytics, um Beta- oder Alpha-Level-Code nur für Standorte verfügbar zu machen, die ein bestimmtes Problem haben und Hardware- oder andere Systemanforderungen erfüllen, in der Hoffnung, dass der Fix dringende Probleme löst, ohne die Zuverlässigkeit anderer Kunden unnötig zu gefährden.
4. Ressourcenplanungsfunktionen verwenden dieselben Trends erkennenden prädiktiven Algorithmen für Energieplanungssimulationen und Was-wäre-wenn-Analysen, die es Speicheradministratoren ermöglichen, verschiedene Szenarien schnell zu simulieren und Kapazität, IOPS und Bandbreitenbedarf vorherzusagen und System-Upgrades vorzuschlagen.
5. Verwaltungsfunktionen für virtuelle Maschinen, die in verschiedene Virtualisierungs-Plattformen integriert werden können, insbesondere in VMware vSphere, um Workload-spezifische Leistungs- und Kapazitätskennzahlen bereitzustellen und Trends bei der Nutzung zu erkennen.
Vorteile und Empfehlungen
Prädiktive Algorithmen, die oft mit anderen Automatisierungs- und Konfigurationsmanagement-Tools kombiniert werden, werden zur Standardausrüstung auf Speicherplattformen und bieten viele Vorteile gegenüber reaktiven Ansätzen zur Speicherverwaltung. Dazu gehören:
- Senkung der Betriebskosten durch Automatisierung von Speicheraufgaben im Zusammenhang mit dem Kapazitäts- und Performance-Management
- Erhöhung der Verfügbarkeit durch proaktive Behebung von Problemen, wie zum Beispiel Kapazitätsengpässe auf einem bestimmten Volume
- Steigerung der Ressourcenauslastung und -effizienz und Verbesserung der Anwendungsleistung durch Empfehlungen für optimale Konfigurationen
Neben der Vorhersage und Lösung von Problemen, bevor der Kunde sie bemerkt, behauptet HPE mit InfoSight den Zeitaufwand für die Verwaltung und Lösung von Speicherproblemen um 85 Prozent zu senken und 79 Prozent der Betriebskosten zu sparen.
Speicheranbieter bieten in der Regel Verwaltungssoftware an; daher empfehlen wir, die prädiktive Speicheranalyse und andere von der KI abgeleitete Techniken zu einem wichtigen Punkt bei zukünftigen Produktbewertungen zu machen. Dasselbe gilt für Unternehmen, die geräteunabhängige, softwaredefinierte Speicher wie Cohesity, DataCore, Red Hat Ceph und Gluster sowie VMware vSAN verwenden. Verwenden Sie die obige Funktionsliste als Teil einer Checkliste für die Produktbewertung, um diejenigen zu ermitteln, die Ihren Anforderungen und der breiteren Infrastrukturverwaltungsumgebung am besten entsprechen.