kentoh - Fotolia

Feature

GridGain Cloud ist der einzige In-Memory Cache as a Service

GridGain ist Hauptantreiber hinter der Open Source In-Memory-Plattform Ignite. Im Interview verrät GridGain CEO Abe Kleinfeld, was das Apache-Projekt auszeichnet.

von

Tobias Servaty-Wendehost, Senior Online Editor

Zuletzt aktualisiert: 10 Okt. 2018

GridGain stellt eine Datenbanksoftware auf Basis des Open-Source-Projekts Apache Ignite sowie Java, den .NET-Framework und C++ bereit. Ursprünglich von GridGain entworfen, wurde Ignite 2014 an die Apache Software Foundation übergeben, wo es sich in weniger als einem Jahr zum Top-Level-Projekt mauserte.

Auch auf wirtschaftlicher Seite hat sich bei GridGain in den letzten Jahren viel getan: durchschnittliche Wachstumsraten von 130 Prozent und mehr als 30 Millionen Dollar Investitionskapital verschaffen dem Unternehmen eine gute Ausgangsbasis, um im Wettbewerb mit großen In-Memory-Computing-Anbietern zu konkurrieren.

Im Interview verrät Abe Kleinfeld, Geschäftsführer von GridGain Systems, was aktuell bei seinem Unternehmen auf der Agenda steht, was das neue Cloud-Angebot künftig für seine Kunden bereithält und welche Ziele der In-Memory-Computing-Anbieter für den EMEA-Markt hat.

GridGain bietet eine In-Memory-Lösung auf Basis von Apache Ignite an. Was steckt hinter dem Ignite-Projekt?

Abe Kleinfeld: GridGain hat den Code zur Beschleunigung und Skalierung von Anwendungen mit In-Memory-Computing-Technologie in die Apache Software Foundation eingebracht. Das Apache Ignite-Projekt ermöglicht dessen Weiterentwicklung mithilfe der Community-Mitglieder. GridGain Systems bietet eine In-Memory-Computing-Plattform auf Basis von Apache Ignite an, die Add-ons auf Enterprise-Niveau, Support-Services und Professional Services umfasst. Wie die meisten Apache-Projekte ist das eine Win-Win-Situation für Kunden und Anbieter. Kunden erhalten einen kostengünstigeren Weg zur Implementierung einer neuen Technologie, während wir von der Community profitieren. Und obwohl Apache Ignite ziemlich neu in der Apache Software Foundation ist, verfügt es über eine ausgereifte Codebasis, die 2007 entstand. Es wurde 2014 an die Apache Software Foundation übergeben und in weniger als einem Jahr als Top-Level-Projekt eingestuft – das zweitschnellste Apache-Projekt nach Apache Spark.

Apache Ignite und GridGain lassen sich als In-Memory-Computing-Schicht zwischen vorhandenen Daten- und Anwendungsschichten eines Unternehmens einsetzen. So kann beispielsweise ein Ignite- oder GridGain-Cluster zwischen Apache Cassandra sowie eine bestehenden Anwendungsschicht eingefügt werden und unterstützt ANSI-99-SQL- und ACID-Transaktionen für den Datenbestandteil im Ignite-Cluster. Dies gehört zu den wichtigsten Funktionen von Apache Ignite und GridGain. Ignite funktioniert aber genauso gut mit NoSQL-, RDBMS- und Hadoop-Data-Stores. Für Ignite und GridGain müssen keine bestehenden Datenbanken ersetzt werden, was praktisch für Unternehmen mit einer bestehenden Datenbanklandschaft ist.

Sie haben im März GridGain Professional Edition 2.4 eingeführt. Was hat sich gegenüber der Vorgängerversion geändert?

Kleinfeld: GridGain Professional Edition 2.4 ist eine voll unterstützte Version von Apache Ignite 2.4. Die wichtigste Neuerung in GridGain Professional Edition 2.4 ist ein Continuous Learning Framework, das Machine Learning und ein mehrschichtiges, neuronales Perceptron-Netzwerk beinhaltet. Das Continuous Learning Framework erlaubt es Organisationen, Machine- und Deep-Learning-Algorithmen in Echtzeit mit operativen Datensätzen zu vergleichen.

In GridGain Professional Edition 2.4 haben wir die native Spark-Integration um die Speicherung und Verwaltung von Spark DataFrames erweitert. Dies geschieht zusätzlich zur GridGain RDD API für den Zugriff auf Daten in GridGain als veränderliche Spark RDD [Anm. der Red. Resilient Distributed Datasets] sowie zum Ignite File System (IGFS) für die Verwendung von GridGain als In-Memory-Implementierung des Hadoop Distributed File System.

Spark kann nun verwendet werden, um Daten in GridGain als DataFrames oder RDD zu verarbeiten und außerdem, um DataFrames oder RDDs in GridGain für die spätere Verwendung zu speichern. GridGain lässt sich von Spark-Entwicklern als In-Memory-Speicher verwenden, um Informationen zwischen Spark Jobs abzurufen, zu speichern und auszutauschen. Apache Spark kann verteiltes SQL von GridGain verwenden, was die Ad-hoc-Abfrageleistung bis zu eintausend Mal beschleunigt. Spark-Entwickler können das Continuous Learning Framework verwenden, um Entscheidungen zu automatisieren und Modelle kontinuierlich zu aktualisieren.

Ein wichtiger Bestandteil der neuen Version sind Machine Learning und Deep Learning Features. Wie funktionieren diese Komponenten?

Kleinfeld: Die integrierten Machine-Learning- und Deep-Learning-Funktionen ermöglichen kontinuierliches Lernen auf Basis des operativen In-Memory-Datensatzes in GridGain. Die Machine-Learning- und Deep-Learning-Bibliotheken wurden für die Massenparallelverarbeitung [Anm. der Red. Massively Parallel Processing] für Daten im In-Memory-Cluster optimiert, wodurch ein schnelleres Modelltraining in umfangreichen Machine Learning Use Cases möglich ist.

Ein kontinuierlicher Lern-Workflow kann durch die direkte Datenverarbeitung im Ignite-Cluster etabliert werden. Es ist nun außerdem möglich, Modelle mit In-Memory-Geschwindigkeit zu trainieren, ohne operative Daten vor dem Modelltraining in eine separate Datenbank übertragen zu müssen. Dies führt zu einem Echtzeit-Modelltraining oder kontinuierlichen Modelltrainings mit geringerer Komplexität und wesentlich niedrigeren Kosten als herkömmliche Ansätze, die auf einem ETL-Prozess beruhen, um Daten in eine analytische Datenbank für Trainingszwecke zu laden.

Für welche Aufgaben können Unternehmen diese Funktionen verwenden?

Kleinfeld: Das GridGain Continuous Learning Framework kann als Baustein für prozessinterne HTAP-Anwendungen [Anm. der Red. Hybrid Transactional/Analytical Processing] eingesetzt werden, die ein Datenmodell auf Basis eingehender Daten kontinuierlich trainieren. Für Anwendungen der nächsten Generation bietet HTAP die Möglichkeit, auf schnelle Informationsaufnahme und -verarbeitung sowie kontinuierliches Lernen zu reagieren und davon zu profitieren, um eine bessere Entscheidungsfindung in Echtzeit zu ermöglichen und eine Reihe von Geschäftsanwendungen zu unterstützen.

Als ein Beispiel für eine verbesserte Betrugsprävention verwenden Banken derzeit Machine Learning für Daten in einer Analysedatenbank, um ein Modell zu entwickeln, das darauf hinweist, dass eine Kreditkartenanwendung wahrscheinlich betrügerisch ist. Dieses System kann die Bank jedoch nicht vor neuen Betrugstaktiken warnen, da sie in Echtzeit passieren. Mit dem Continuous Learning Framework kann das Machine-Learning-Modell auf Grundlage immer neuer Daten aufkommende Trends identifizieren, die in Echtzeit auf eine neue Anstrengung für ein betrügerisches Darlehen hinweisen.

Sie haben außerdem GridGain Cloud präsentiert. Was beinhaltet das Angebot?

Kleinfeld: GridGain Cloud ist der einzige In-Memory Cache as a Service, der es Benutzern ermöglicht, einen verteilten In-Memory-Cache einfach bereitzustellen und über ANSI-99 SQL, Key-Value oder REST APIs darauf zuzugreifen. GridGain Cloud kann in wenigen Minuten bereitgestellt werden und bietet eine massiv skalierbare In-Memory-Computerleistung in der Cloud.

GridGain Cloud befindet sich derzeit in der Beta-Phase und bietet In-Memory Daten-Caching-Funktionen, die die GridGain Web Console für interaktives SQL, REST APIs, JDBC, ODBC und GridGain oder Apache Ignite Thin Clients unterstützen. Es ermöglicht jedem Entwickler oder Analysten mit SQL-Kenntnissen, ein Cluster mit wenigen Mausklicks zu starten, Daten zu laden und den Cluster von einer zentralen Konsole aus zu überwachen und zu verwalten. Eine kostenlose Testversion der GridGain Cloud Beta ist online verfügbar.

Was sind Ihre Ziele für den EMEA-Markt in diesem und im nächsten Jahr?

Kleinfeld: In EMEA wollen wir unseren Umsatz sowohl 2018 als auch 2019 gegenüber dem Vorjahr verdoppeln. Wir streben für 2019 eine Verdoppelung der Zahl der Neukunden gegenüber dem Vorjahr an, was sich in unseren signifikanten Zuwächsen in den Bereichen Vertrieb und Marketing in EMEA in diesem und im nächsten Jahr zeigt.

GridGain veranstaltete im Juni 2018 in London den In-Memory Computing Summit Europe. Was waren die Höhepunkte des Gipfels?

Kleinfeld: Das Ziel jedes In-Memory Computing Summit ist es, praktische Informationen bereitzustellen, die den Teilnehmern helfen, In-Memory Computing zu nutzen, um die digitale Transformation ihrer Unternehmen zu beschleunigen und Omnichannel-Kundenerfahrungsinitiativen zu beschleunigen. Die Referenten des europäischen Gipfels erläuterten die wichtigsten Fortschritte bei der In-Memory-Computing-Technologie sowie Leistungsvorteile der Technologie und gaben Ratschläge zu einer Vielzahl von In-Memory-Computing-Themen. Dazu zählten Use Cases, Tipps für den Einsatz, wie man Herausforderungen meistert und neue Soft- und Hardwarelösungen, die Anwendern zur Verfügung stehen.

„Wir streben für 2019 eine Verdoppelung der Zahl der Neukunden gegenüber dem Vorjahr an, was sich in unseren signifikanten Zuwächsen in den Bereichen Vertrieb und Marketing in EMEA in diesem und im nächsten Jahr zeigt.“

Abe Kleinfeld, GridGain Systems

Über 30 Branchenführer hielten sechs Keynote-Vorträge und 35 Breakout-Sessions. Einer meiner Lieblings-Keynotes war In-Memory Computing: Accelerating the Data Behind Digital Business and the Customer Experience von Matt Aslett von 451 Research, der sich auf die Verwendung von In-Memory-Computing-Technologien zur Schaffung hybrider operativer und analytischer Verarbeitungssysteme (HOAP) zur Bewältigung der digitalen Transformation konzentrierte.

Auf dem Markt für In-Memory-Computing gibt es inzwischen zahlreiche etablierte und neue Akteure. Wie kann sich GridGain vom Wettbewerb abheben?

Kleinfeld: Auf der Softwareseite der Branche bietet GridGain weiterhin mehr Funktionen auf einer einzigen Plattform als jedes andere Unternehmen. Unsere Lösung bietet eine integrierte Plattform mit einer einheitlichen API. Diese wird kombiniert mit einem In-Memory-Datenraster, das ANSI-99 SQL, Key-Value-APIs und ACID-Transaktionen unterstützt und sich nahtlos in alle RDBMS-, NoSQL- und Hadoop-Datenbanken sowie die meisten Analytics-, Daten- und Streaming-Technologien integriert.

Wir bieten außerdem das Continuous Learning Framework mit Machine und Deep Learning, persistente Speicherfähigkeiten, was Datensätze ermöglicht, die größer als der verfügbare Speicher sind, und die Möglichkeit, die Verarbeitung sofort nach einem Neustart zu beginnen, ohne dass zuvor alle Daten in den Speicher geladen werden müssen. Schließlich stellt Gridgain fortschrittliche Unternehmensbereitstellung und Hochverfügbarkeitsfunktionen wie Multi-Data-Center-Replikation, Sicherheitsprüfung und eine Management- sowie Monitoring-Konsole zur Verfügung.

GridGain ist als Open-Source-Lösung auf Basis von Apache Ignite ein kostengünstiger Weg zur Umsetzung einer In-Memory-Computing-Strategie. Unsere Lösung hat sich in Produktionsumgebungen für Unternehmen auf der ganzen Welt bewährt, darunter ING, Sberbank, Microsoft, Huawei, RingCentral, Finastra, Advent, Workday und eTherapeutics.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Kontinuierlich lernende Systeme mit In-Memory Computing.

Erfordern In-Memory Datenbanken NVDIMM oder NVMe?

Diese Start-ups zeigen die Datenverarbeitung der Zukunft.

GridGain Cloud ist der einzige In-Memory Cache as a Service

GridGain ist Hauptantreiber hinter der Open Source In-Memory-Plattform Ignite. Im Interview verrät GridGain CEO Abe Kleinfeld, was das Apache-Projekt auszeichnet.

Nächste Schritte

Erfahren Sie mehr über Big Data

Eine Einführung in Quantum Computing Storage und Memory

Tools für das IT- und Datenmanagement aus dem Silicon Valley

Mit Lake Formation einen Data Lake auf AWS einrichten

Microsoft Ignite: Ohne Passwort anmelden und sichere Daten