Geodaten und Echtzeit-Streams mit Kinetica verarbeiten
Kinetica kombiniert GPU-, CPU- und In-Memory-Verarbeitung in einer Architektur. Damit lassen sich Streaming- und Geo-Daten parallel verarbeiten und analysieren.
Die Gründer Amit Vij und Nima Negahban verfolgen seit der Gründung von Kinetica (früher GPUdb) 2009 das Ziel, eine High Performance Analytics Datenbank zu entwickeln, die Prozesse per Massively Parallel Processing (MPP) verarbeiten kann.
Dieses Ziel hat man nach eigenen Angaben erreicht. Die Kinetica-Datenbankarchitektur greift auf eine GPU- und CPU-Arbeitsteilung zurück, damit Anwender zum Beispiel räumliche und Streaming-Daten aus dem Internet untersuchen und visualisieren können. Das Herzstück der Architektur ist eine In-Memory-Datenbank, die für OLAP-Workloads optimiert ist (siehe Abbildung 2).
Zehn Jahre nach Gründung von Kinetica beschäftigt das Unternehmen weltweit mehr als 140 Mitarbeiter. Zu den Kunden gehören zum Beispiel der japanische Telekommunikations- und Medienkonzern SoftBank, das US-Pharmaunternehmen GlaxoSmithKline und das indonesische Telekommunikationsunternehmen Telkomsel.
SoftBank und Telkomsel wollen mit der Kinetica-Plattform unter anderem den Ausbau von 5G begleiten. Schwerpunkt ist eine beschleunigte Geodatenanalyse, um die künftige 5G-Netzabdeckung und die Verarbeitung von Mobilfunksignalen zu optimieren.
Gut die Hälfte des Umsatzes generiert der Anbieter laut Daniel Raskin, Chief Marketing Office (CMO) bei Kinetica, heute bereits außerhalb des US-Heimatmarktes. Allerdings schreibt Kinetica keine schwarzen Zahlen, sondern investiert sein Geld in die Entwicklung der Technologie. „Der Fokus liegt auf Wachstum“, sagt Raskin.
Beschleunigung durch Active Analytics Platform
Der Lösungsumfang wird im Einklang mit dieser Strategie ständig erweitert. Jüngstes Beispiel ist die Active Analytics Platform, die Kinetica im März 2019 vorgestellt hat. Die Analytics-Plattform erlaubt eine kombinierte Verarbeitung historischer Daten und Echtzeit-Streaming-Daten, bietet Geolokalisierungsfunktionen und integriert Machine-Learning-Algorithmen (siehe Abbildung 1).
Die Datenbankarchitektur kombiniert, wie oben angedeutet, eine verteilte In-Memory-Datenbank mit GPU-Beschleunigung für kontinuierliche Analysen und die Verarbeitung von Standortinformationen. Kinetica ist auf OLAP-Workloads optimiert. Die Verteilung der Workloads zwischen CPUs und GPUs erfolgt automatisch (siehe Abbildung 2).
Kinetica verwendet als Abfragesprache SQL-92 und unterstützt eine Vielzahl von Funktionen, darunter Textsuche, Zeitreihenanalysen, Standortinformationen und grafische Analyse. „Active Analytics ist mit der realen Welt verbunden, um die Analyse zu beschleunigen und es Unternehmen zu ermöglichen, neue Möglichkeiten zu entdecken“, wirbt Raskin für das Produkt.
Die Technologie kann auf der gesamten Breite des Datenspeichers eines Unternehmens ausgeführt werden, indem die Daten je nach Anforderung im Arbeitsspeicher, auf SSDs, Festplatten, AWS S3 oder ähnlichen Cloud-Speicherdiensten intelligent verwaltet werden.
„Unsere verteilte Architektur nutzt die gesamte Hardwarebreite. Unsere Partner sind unter anderem Dell EMC, Nvidia, IBM, Microsoft Azure und AWS“, sagt Irina Farooq, Chief Product Officer (CPO) bei Kinetica. „Die Fähigkeit, alle Speicherebenen abzudecken und zu verwalten, unterscheidet uns von Unternehmen wie OmniSci, Brytlyt, SQream DB und BlazingDB.“
Kinetica geht über Datenbankmarkt hinaus
Dank seiner verteilten parallelen Architektur kann Kinetica Datensätze kontinuierlich (mit Kafka) mit hoher Geschwindigkeit aufnehmen und gleichzeitig komplexe Analysen für Streaming und historische Daten durchführen. Außerdem lassen sich vorgefertigte TensorFlow-Templates erstellen oder importieren.
Kinetica verfügt zusätzlich über eine GPU-beschleunigte Geodaten-Funktionsbibliothek für On-Demand-Filterung, Aggregation, Zeitreihenanalysen, räumliche Verknüpfungen und Geodatenanalysen. Die Plattform kann Geometrien, Wärmekarten und Konturen über eine serverseitige Render-Technologie anzeigen.
Mit den aufgezählten Funktionen geht Kinetica über den reinen Datenbankmarkt hinaus und konkurriert mit einer viel breiteren Palette von Lösungen, von maßgeschneiderten SMACK-Lösungen (Spark, Mesos, Aka, Cassandra und Kafka) bis hin zu konventionellen Datenbank-Plattformen.
Kinetica bietet Unternehmen ein Jahresabonnement an, das die Menge der verarbeiteten Daten abrechnet. Je nach Anforderung können Kunden zwischen zwei Support-Modellen auswählen. Für weitere Informationen zu Preisen und Abonnements sollten sich Interessenten mit Kinetica in Kontakt setzen. Eine kostenlose 30-Tage-Testversion ist über die Website von Kinetica verfügbar.
Kinetica stellte seine Produkte im Rahmen der IT Press Tour vor, die mehrmals im Jahr Besuche bei Start-ups und IT-Unternehmen organisiert.