Datadog Forecasts: Cloud Monitoring mit Predictive Tools

Inzwischen erprobte KI-Technologien zu Predictive Maintenance werden von Datadog nun auch für Vorhersagen von möglichen Ausfällen im IT-Betrieb verwendet.

Datadog, ein auf das Monitoring von komplexen Cloud-Umgebungen spezialisiertes Start-up, hat auf seiner Entwicklerkonferenz Dash in New York die nächste Generation einer neuen System-Management-Anwendung vorgestellt. Hinter dem schlichten Namen Forecasts verbirgt sich ein Tool, das sich viele Administratoren wohl schon lange gewünscht haben.

„Bislang unterstützen alle System-Management-Programme die Analyse von bereits aufgetretenen Fehlern und Engpässen – mit Forecasts warnen wir aber bereits frühzeitig vor möglichen Problemen und Schwachstellen“, sagt Brad Menezes, Product Manager für künstliche Intelligenz (KI) und Machine Learning (ML) bei Datadog in seiner Keynote vor rund 1.000 Teilnehmern.

Die KI- und ML-Modelle von Datadog greifen dabei auf Datenbestände des IT-Betriebs zu. „Unsere Prognosemodelle basieren auf Billionen an Datenpunkten von vielen Tausend Servern, die wir täglich beobachten“, erläutert Menezes. Die Ergebnisse dieser Modelle sind dann Vorwarnungen, die sich nicht nur auf Tage, sondern auch auf Wochen oder gar Monate beziehen können – genug Vorlaufzeit, um rechtzeitig gegenzusteuern.

„Moderne Monitoring Tools, die mit ausgefeilten ML-Algorithmen ausgestattet sind, können Trends aufzeigen und aufziehende Probleme erkennen – und zwar sowohl im Business als auch in der Industrie und natürlich erst recht innerhalb der IT“, sagt Nancy Gohring, Analystin bei The 451 Group.

Bei der Observability geht es um das Verstehen.
James Turnball CTO, Empatico

Observability statt Monitoring

Die intelligente Auswertung von Logdateien ist eine der Kernkompetenzen von Datadog. Kontextbezogene Loganalysen heißt das bei Datadog und wird unter dem Begriff Observability zusammengefasst. „Beim Monitoring geht es um die Symptome, bei der Observability dagegen um das Verstehen“, erklärt James Turnbull den Unterschied. Turnbull ist CTO bei Empatico und ebenfalls Berater bei Datadog.

In puncto Logfiles gab es noch eine weitere Neuankündigung: Logging ohne Grenzen besteht aus einem Toolset, mit dem IT-Ingenieure die immensen Logfile-Daten von komplexen Cloud-scale Applikationen äußerst kosteneffizient managen. Besonders wichtig sei hierbei der Kostenaspekt. „Log-Management-Tools sind für moderne Cloud-Umgebungen teuer. Das geht noch auf die Zeiten zurück, in denen es noch keine Microservices und kein massives horizontales Scale-Out gab“, sagt Renaud Boutet, Director of Product Management bei Datadog.

James Turnball, CTO Empatico, auf der Dash-Konferenz.
Abbildung 1: James Turnball, CTO Empatico, auf der Dash-Konferenz.

Ein Wachhund fürs APM

Schließlich gab es auch zum Kernangebot von Datadog, dem Application Performance Management (APM), einige Neuigkeiten auf der Dash-Konferenz. Unter dem Namen Watchdog bietet das Unternehmen jetzt eine KI-basierte Kontroll- und Management-Plattform an.

„Die bisherigen APM-Tools basieren darauf, dass die richtigen Fragen gestellt werden, die sich dann näher untersuchen lassen – Watchdog beobachtet selbstständig das Netz und alle Anwendungen und sucht nach Anomalien“, sagt Ilan Rabinovitch, Vice President of Product Management bei Datadog.

Viel Konkurrenz

Mit seinen Angeboten im Bereich Application Performance Management und den exzessiven Logfile-Auswertungen konkurriert Datadog sowohl mit verschiedenen neuen Spezialanbietern, als auch mit etablierten Softwareunternehmen. Zur ersten Kategorie gehören unter anderen Dynatrace, Splunk, Grafana, SignalFx, LogicMonitor, Nagios und Sensu. Zur zweiten Kategorie vor allem BMC, CA Technologies und Cisco (mit der Tochter AppDynamics).

An großen Partnern mangelt es bei Datadog nicht. So waren Amazon und Google die Hauptsponsoren der Veranstaltung in New York. Doch trotz des Supports der beiden Cloud-Giganten wachsen deren Bäume nicht in den Himmel. Skalierung scheint eines der Hauptprobleme zu sein. „Es gibt Kunden, die aufgrund von Skalierungsproblemen von Datadog zur Konkurrenz gewechselt sind, sagt Analystin Gohring, ohne dabei konkrete Namen zu nennen.

Nischenmarkt für IT-Experten

Gemäß den Marktforschern von Market Prognosis wird der Weltmarkt für Cloud-Monitoring-Software von 750 Millionen in 2017 bis 2026 auf über 3,9 Milliarden Dollar ansteigen. Das bedeutet zwar im Mittel ein Plus von 20 Prozent pro Jahr, trotzdem bleibt es ein Nischenmarkt. Denn derzeit befassen sich vor allem IT-Spezialisten mit dem Thema, wogegen bei vielen Managern die komplexen Probleme des Cloud- und Web-Monitorings kaum bekannt sind.

Diese Situation wird sich aber bald ändern. „In den Fachabteilungen steigt das Interesse an APM und stabilen Cloud-Umgebungen rasant an. Es hat sich herumgesprochen, dass langsame Webseiten, schwache Anwendungen, sonstige Flaschenhälse und erst recht Totalausfälle das Business erheblich gefährden“, erläutert Datadog-Produktchef Amit Agarwal die künftige Unternehmensstrategie. „Wir können zeigen, welche Auswirkungen unsere Technologie auf die Bottom Line haben kann.“

Zu den Branchen, die hier bereits am aktivsten sind, gehören die klassischen E-Commerce-Bereiche, wie Handel, Medien und Banken. Neuerdings interessieren sich dafür aber auch andere Dienstleister wie das Gesundheitswesen und die Touristik. In Deutschland gehören zum Beispiel Media-Saturn und Lufthansa zu den Datadog-Referenzkunden.

Deutschland als wichtiger Markt

Insgesamt sieht man bei Datadog den deutschen Markt als bedeutend an. Das zeigt sich unter anderem daran, dass man hier ein eigenes Cloud-Rechenzentrum errichten will.

„Deutschland hat die schärfsten Datenschutzregeln, viele Kunden sind unbesorgt, wenn die Daten in Deutschland abgespeichert sind“, begründet Agarwal das Infrastrukturprojekt an. Doch über das genaue wann und wo des neuen Rechenzentrums schweigt er sich aus. „Wir arbeiten daran“, war alles, was Agarwal zu diesen Punkten sagen wollte.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Welche Silicon-Valley-Ideenschmieden derzeit hervorragen.

Cloud-Monitoring für Azure: Activity Log und Diagnostic Log.

Netzwerk-Monitoring-Tools für den Fall, dass Cloud-Monitoring-Tools nicht reichen.

Erfahren Sie mehr über Cloud Computing