Vasily Merkushev - stock.adobe.c

Cloud-basierte Predictive Analytics auf dem Vormarsch

Predictive Analytics sind auch geeignet, um Speicherprozesse genauer zu beobachten und zu Ersparnissen zu führen.

Da Flash-Arrays immer mehr in den Unternehmen Verbreitung finden, suchen IT-Teams nach Storage-Produkten, die auch über Predictive Analytics verfügen, um Trends vorherzusagen, den Einsatz von Infrastruktur-Komponenten zu planen und Overhead zu reduzieren. Cloud-basierte Predictive Analytics benutzen Machine Learning und andere fortgeschrittene Techniken, um im Storage-Stack gesammelte Messdaten der Telemetrie zu analysieren und auf diese Weise proaktiv Speicherprobleme zu erkennen, bevor sie massiv auftreten.

Predictive Analytics ist eine bestimmte Form von Analysen, die statistische Methoden zur Vorhersage spezifischer Eigenschaften oder Vorkommnisse verwenden und die sich auf noch nicht aufgedeckte Muster in historischen oder gegenwärtigen Daten stützen. Die Methodologie kann solche fortgeschrittene Techniken wie Data Mining, analytische Abfragen (Queries), vorausschauende Modelle und Machine Learning umfassen.

Machine Learning ist besonders wichtig, weil es die vorausschauenden Algorithmen automatisch trainiert, indem die Ergebnisse fortlaufend aufgefrischt werden, wenn neue Daten verfügbar sind. Wenn Workloads entstehen, stützen sich Predictive Analytics auf Machine Learning, um sich entwickelnde Fragen und Probleme effektiv zu erkennen, zu diagnostizieren und anschließend mit minimalen Mitteln und Eingriffen zu behandeln.

Mit Predictive Analytics und Machine Learning wird es möglich, Storage-bezogene Fragen und Probleme zu entdecken, bevor sie überhaupt auftreten, und das notwendige Wissen für Vorhersagen zu entwickeln, wie und wann Veränderungen an Hardware und Software vorzunehmen sind.

Um diese Maßnahmen durchzuführen, muss ein Cloud-basiertes Produkt für Predictive Analytics kontinuierlich Telemetriedaten von den Flash-Arrays und den sie unterstützenden Infrastruktur-Komponenten sammeln. Die Daten sollten Details über IOPS, Bandbreite, Fehler, Latenzen und andere relevante Informationen umfassen. Das Produkt muss in der Lage sein, Predictive Analytics und Machine Learning für historische und für aktuelle Daten anzuwenden – und es wird sich so fortlaufend mit ihnen weiterentwickeln.

Predictive Analytics für Enterprise Storage anzuwenden, bietet eine Reihe von Vorteilen, was die Vorhersage von Trends, die Planung der Infrastruktur und die Reduzierung des Overheads im Unternehmen beziehungsweise die Einsparung von Kosten angeht. Obwohl sich diese Punkte teilweise überschneiden, sind sie doch ein brauchbares Mittel, um sich die Ziele eines effektiven Tools für Predictive Analytics klarzumachen.

Trends vorhersagen 

Weil ein Tool für Predictive Analytics Trends vorhersagen kann, kann es auch proaktiv in Sachen Storage tätig sein und Speicherprobleme adressieren und sie schon identifizieren, bevor sie in voller Breite auftreten und Anwender betroffen sind. Das Produkt für Predictive Analytics kann dann versuchen, dagegen zu steuern oder – wenn ein Problem nicht automatisch gelöst werden kann – die Verantwortlichen mit Hinweisen und Tipps informieren. Dieser Ansatz kann die Anzahl von Systemausfällen reduzieren und gleichzeitig die Verfügbarkeit und Performance von Anwendungen erhöhen. Außerdem werden die Produktivität insgesamt und die Anwendererfahrungen deutlich verbessert. 

So sieht der Machine-Learning-Prozess aus
Abbildung 1: So sieht der Machine-Learning-Prozess aus

Die Fähigkeit, Trends vorherzusagen, erfordert große Datenmengen von mehreren Systemen, um auf dieser Basis die Speichersituation genau zu analysieren. Zum Beispiel verwendet der Pure1 Cloud Management Service die akkumulierten Daten von mehr als 10.000 miteinander verbundenen Arrays und sammelt so über eine Billion Daten pro Tag. Der Dienst verwendet die Pure1 Meta AI Engine, um analytische Berechnungen über den Zustand und das Funktionieren von Storage und anderen Komponenten im Anwendungs-Stack zu erhalten.

InfoSight von Hewlett Packard Enterprise (HPE) liefert einen ähnlichen Cloud Management Service. Aufbauend auf der Akquisition von Nimble Technologies sammelt und analysiert  InfoSight Hunderte von Milliarden von Sensordaten von über 9.000 Kunden-Installationen, wobei in jeder Sekunde Millionen von Sensor-Messungen in der Cloud-Zentrale einlaufen. InfoSight lernt kontinuierlich aus den gesammelten Daten in der Absicht, Probleme vorherzusagen, zu verhindern und zu lösen. In dem Maße, wie InfoSight lernt, wird die Infrastruktur „smarter“ und verbessert sich – Abläufe werden automatisiert und „Fragen werden beantwortet, bevor sie überhaupt gestellt wurden“, wie es in bester Marketingsprache bei HPE heißt.

InfoSight war der entscheidende Impuls hinter der Entscheidung von HPE, Nimble zu kaufen. Predictive Analytics in Echtzeit standen auch hinter der Entscheidung von DDN (DataDirect Networks), in diesem Jahr die Technologien von Tintri zu kaufen.

Tintri Analytics, ebenfalls ein Cloud-basierter Management Service, beruht ebenfalls auf einem sehr großen Pool von Telemetrie-Daten, um Predictive Analytics anbieten zu können. Der Service von Tintri – jetzt DDN – ist in der Lage, in einem Zeitraum von bis zu drei Jahren Daten von Hunderttausenden Umgebungen in weniger als einer Sekunde zu analysieren, wobei unterschiedliche Messzahlen verwendet werden. Zum Beispiel umfassen die Telemetriedaten eine Kategorie für I/O-Performance, die solche Informationen wie I/O-Größe und Read/Write-Durchsatz liefern. Wie Pure1 und InfoSight betrachtet Tintri Analytics den gesamten Applikations-Stack, um sicherzustellen, dass Vorhersagen genau die richtigen Fragen angeben und genaue Resultate liefern.

Die Infrastruktur planen

Services wie Pure1, InfoSight und Tintri schließen auch Fähigkeiten ein, Änderungen bei der Infrastruktur genauer zu planen. Predictive Analytics nutzt in dieser Hinsicht die große Fülle an Telemetriedaten, um zukünftige Anforderungen bei Kapazität, Bandbreite und Performance vorherzusagen und empfiehlt auf dieser Basis Änderungen, die zukünftige Probleme ausschalten. Unnötige oder risikoträchtige Upgrades von Komponenten der Infrastruktur können vermieden werden.

Tintri Analytics sammelt zum Beispiel auf einem genügend granularen Niveau Daten bei Compute- und Storage-Ressourcen, um die historischen Benutzungsmuster von Applikationen aufzudecken. Die Muster können anschließend benutzt werden, um Kapazitäts- oder Performance-Anforderungen zu modellieren. Selbst wenn ein Unternehmen sich in erster Linie um Storage-Fragen kümmert, kann man diese Daten in Beziehung zum gesamten Anwendungs-Stack setzen und so ein genaueres Bild von zukünftigen Speicherbedürfnissen bekommen.

Ein anderes Beispiel ist InfoSight. Dieses Tool liefert nach der Analyse Empfehlungen, wie zukünftige Probleme zu verhindern sind, optimiert Ressourcen und verbessert die Performance, wobei I/O-Workload-Muster und andere Variablen Berücksichtigung finden, die die Performance beeinflussen können. InfoSight verfeinert kontinuierlich seine Modelle für Machine Learning, um genauere Empfehlungen geben zu können – einschließlich mehrerer Was-Wenn-Szenarios.

Predictive Analytics ist eine bestimmte Form von Analysen, die sich auf noch nicht aufgedeckte Muster in historischen oder gegenwärtigen Daten stützen.

Pure1 benutzt ebenfalls Cloud-basierte analytische Fähigkeiten, um Kapazitäts- und Performance-Anforderungen im Zeitverlauf vorherzusagen. Indem Daten von über 100.000 Workloads genutzt werden, erzeugt Pure1 Meta analytische Profile von Performance-Eigenschaften. Zugleich werden die Profile laufend verbessert, um den Kunden kritische und aktualisierte Erkenntnisse zur Verfügung zu stellen. Zum Beispiel ist Pure1 in der Lage, Informationen darüber zu liefern, wie Workloads in einem Flash-Array miteinander kommunizieren, wie Kapazitäts- und Performance-Anforderungen mit der Zeit wachsen und ob ein Array zusätzliche Workloads verkraften kann.

Den Overhead reduzieren 

Ein Cloud-basiertes Tool für Predictive Analytics kann dabei helfen, den administrativen Overhead zu reduzieren, indem die IT-Teams weniger Zeit mit Troubleshooting und der Vorbereitung von Lösungen verbringen müssen. Die Kunden brauchen auch weniger Zeit, um mit dem Help Desk zu telefonieren, da viele Probleme proaktiv und im Ansatz automatisch angegangen werden. Alle diese Faktoren können zu größeren Ersparnissen führen, zusätzlich zu den Ersparnissen, die bereits durch das effektivere System-Management erzielt werden. 

Laut HPE profitieren Kunden, die InfoSight für ihre Nimble Storage Arrays nutzen, zum Beispiel auf diese Weise: 

  • 79 Prozent geringere Ausgaben für den Speicherbetrieb;
  • 85 Prozent weniger Zeit für die Lösung Storage-bezogener Probleme;
  • 100 Prozent der Probleme gehen direkt an den Level-3-Support, anstatt zunächst an Level 1 und 2;
  • um 69 Prozent schnellere Lösungen bei Level-3-Tickets.

Obwohl diese Zahlen aus HPE-Quelle stammen (und insofern nicht unparteiisch sind), stimmen sie prinzipiell mit allgemein in der IT-Industrie geltenden Ansichten über die Wirksamkeit von Performance-Analytics überein: Letztlich kommt es auf die Senkung der laufenden Betriebskosten an. 

Predictive Analytics und „smarter“ Storage

Predictive Analytics auch auf Storage-Themen anzuwenden, ist ein relativ neues Phänomen, aber die entsprechende Technologie verbreitet sich schnell. Die Techniken, die zur Analyse von Daten und zur Vorhersage von Trends zum Einsatz kommen, können mit Sicherheit auch auf diesen Bereich angewendet werden, zumal sie ständig verbessert werden. 

Letztlich kommt es jedoch nicht darauf an, über immer genauere und präzisere Analytics zu verfügen, sondern es müssen selbstheilende Infrastrukturen implementiert werden, die schon mit kleinen Interventionen autonom Probleme identifizieren und lösen. Predictive Analytics zusammen mit Machine Learning und anderen fortgeschrittenen analytischen Techniken verspricht auf jeden Fall, Enterprise Storage zumindest in der gleichen Weise zu revolutionieren, wie es Flash-Arrays schon getan haben.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Bessere Überwachung verteilter Apps mit Predictive Analytics

IoT und Predictive Analytics: künftige Mobility-Trends

Unterschied Business Intelligence und Predictive Analytics

Erfahren Sie mehr über Cloud Storage