macrovector - Fotolia

Crate.io bringt mit CrateDB die SQL- und NoSQL-Welt zusammen

Crate.io fokussiert sich mit seiner Datenbank auf das industrielle Internet der Dinge. Im Interview erläutern die beiden Gründer der Firma, warum sie diesen Weg gehen.

Unternehmensanwender und Datenbankspezialisten haben die letzten Jahrzehnte ihr Wissen um die Datenbanksprache SQL kontinuierlich erweitert. Mit dem Internet der Dinge und den ständig wachsenden Datenmengen gerät SQL aber zunehmend an seine Grenzen. Eine Antwort auf dieses Dilemma ist NoSQL. Allerdings müssen Anwender und Spezialisten auch im NoSQL-Bereich erst Erfahrungen sammeln und Know-how aufbauen.

Eine Alternative ist CrateDB, eine SQL-Datenbank mit einem NoSQL-Fundament, die von Crate.io für die Verarbeitung von Maschinendaten entwickelt wurde. Im Interview erläutern die beiden Firmengründer Christian Lutz (CEO) und Jodok Batlogg (CTO), wie ihr Ansatz die Vorteile von SQL und NoSQL kombiniert, welche Einsatzszenarien damit möglich sind, und welches Wachstumspotential CrateDB hat.

Einige NoSQL-Datenbanken und Streaming Engines sind speziell für den IoT-Einsatz entwickelt worden. Warum sollten sich Unternehmen dann überhaupt für ein verteiltes SQL-Datenbanksystem wie CrateDB entscheiden?

Jodok Batlogg: Vor allem weil CrateDB die Einfachheit der SQL-Welt mit den Vorteilen von NoSQL einzigartig kombiniert und speziell für Industrial IoT (IIoT) Use Cases die richtigen Features für die Verarbeitung von Time Series hat. NoSQL-Systeme bieten zwar oft ausreichende Performance, basieren aber meist auf proprietären Sprachen und erlauben keine nahtlose Integration von relationalen Daten mit einer unlimitierten Zahl von Events. Streaming Engines sind gute Freunde von CrateDB, denn oft steht am Ende einer Streaming Pipeline von Kafka oder Flink eine CrateDB, wo jene Daten persistiert werden, die Apps benötigen. Auf der anderen Seite können reine SQL-Lösungen zwar auf das vorhandenen SQL-Know-how und Standards zurückgreifen, haben aber einfach nicht die Skalierung für den Einsatz im IIoT. CrateDB schlägt genau diese Brücke, indem sie unlimitierte Skalierbarkeit und Flexibilität ohne Lock-ins bereitstellt und Wirtschaftlichkeit mit komfortabler Nutzung verbindet.

Jodak Batlogg, Crate.io

„In 3.2 haben wir uns vor allem mit dem Support für die Änderung der Anzahl von Shards in existierenden Tabellen, der Verbesserung der Kompatibilität oder neuen Window-Funktionen beschäftigt, die immer wichtiger werden.“

Jodok Batlogg, Crate.io

Können Sie uns die Architektur von CrateDB erläutern?

Batlogg: Die CrateDB ist eine spaltenbasierte, dokumentenorientierte Datenbank auf Basis einer Cloud-nativen Shared-nothing-Architektur, kombiniert mit einer distribuierten SQL Query Engine. Das hoch skalierbare NoSQL-Fundament erlaubt einfaches, elastisches Wachstum, um auch Millionen von Datensätzen pro Sekunde zu verarbeiten oder Hunderte Terabytes zu speichern. Distributed Processing, Datenpartitionierung und spaltenförmige In-Memory-Indizes ermöglichen Zeitreihenabfragen in Millisekunden, selbst wenn viele Clients Daten parallel abfragen und schreiben. CrateDB verwendet NoSQL-Speicher- und Indizierungstechnologien unter einer SQL-Engine und unterstützt damit auch Volltextsuche, Geodaten, IP-Adressen und benutzerdefinierte Funktionen für erweiterte, datenbankinterne Analytics. Mit diesem Konzept ist CrateDB derzeit für IoT- Anwendungen einzigartig.

Crate.io hat Anfang Februar die Verfügbarkeit von CrateDB 3.2 bekanntgegeben. Können Sie uns die Neuerungen der Version aufzeigen?

Batlogg: Wir arbeiten kontinuierlich an der Optimierung der technischen Funktionalität der Database Engine, um die Leistungsfähigkeit zu steigern, den Komfort zu erhöhen, die Nutzung und Verwaltung zu vereinfachen sowie die erforderliche Sicherheit zu garantieren. Die Vorstellung der Version 3.0 Ende des vergangenen Jahres war ein Meilenstein dieser Entwicklung. In 3.2 haben wir uns vor allem mit dem Support für die Änderung der Anzahl von Shards in existierenden Tabellen, der Verbesserung der Kompatibilität oder neuen Window-Funktionen beschäftigt, die immer wichtiger werden. Parallel dazu haben wir aber intensiv an der Bereitstellung auf führenden Cloud-Plattformen gearbeitet sowie eine durchgängige Lösung für die diskrete Fertigung vorgestellt. CrateDB ist auch als gemanagter Service auf Azure erhältlich. Bald wird außerdem AWS verfügbar sein.

Der Machine Data Platform Stack von Crate.io.
Abbildung 1: Der Machine Data Platform Stack von Crate.io.

Ihr Angebot CrateDB Cloud bietet gemanagte CrateDB Cluster auf Kubernetes an. Was zeichnet die Cloud-Lösung aus?

Batlogg: Einfache Nutzung und automatische Skalierung. Der Anwender konzentriert sich auf seine Applikation und CrateDB stellt genau die richtige Menge an Datenbank-Power zur Verfügung und kümmert sich zum Beispiel um Backups und Skalierung. Die Nutzung einer vollständig gemanagten Infrastruktur in der Cloud hat sowohl funktionale als auch wirtschaftliche Vorteile. Anwender der CrateDB müssen in der Regel komplexe Business-Aufgaben erfüllen. Das Aufsetzen und das Management von Datenbanken gehört meist nicht zu deren Kernkompetenz. Crate.io geht deshalb konsequent den Weg über die Bereitstellung und den 24/7-Betrieb als DBaaS auf führenden Cloud-Diensten. Auf Microsoft Azure hat Crate.io inzwischen den Co-Selling-Status erreicht. IIoT-Systeme können auf dieser Basis mit einer unlimitierten Skalierbarkeit Plug and Play integriert werden. Damit bietet es ein bis zu zehnmal besseres Preis-Leistungs-Verhältnis als mit herkömmlichen Lösungen, meist eine Kombination mehrerer Datenbanken, erzielbar ist.

Welche Einsatzszenarien sind mit Ihrer Technologie heute möglich?

Christian Lutz: CrateDB hat den großen Vorteil, hybrid einsatzfähig zu sein, das heißt On-Premises, in der Cloud und auch im Edge-Betrieb. Speziell als Backend-Datenbank für IoT- und IIoT-Projekte ist CrateDB ideal geeignet, da dort oft sowohl relationale Daten als auch Milliarden von Sensordaten kombiniert gespeichert werden müssen. CrateDB kommt in unterschiedlichen Szenarien zum Einsatz, überall dort, wo eine Vielzahl von Sensoren Daten im Millisekundentakt produzieren, die analysiert, gespeichert, angereichert, bereitgestellt und dann mit interaktiven Adhoc-Queries in Echtzeit abgefragt werden müssen. Solche Time Series Use Cases fallen in vielen Branchen an – von der Produktion, der Energieerzeugung und -verteilung über das Messen und Testen von Produkten oder der Belastung von Bauwerken bis hin zu Connected-Car- oder Smart-City-Anwendungen. Prinzipiell gibt es hier keine branchenspezifischen Festlegungen. Zu den Kunden von Crate.io zählen globale Anbieter von Security-Lösungen ebenso wie mittelständische Produktionsunternehmen. Ein Schwerpunkt der Aktivitäten von Crate.io liegt allerdings in der Unterstützung von Fertigungsprozessen, dem sogenannten Industrial IoT.

Christian Lutz, Crate.io

„Aufbauend auf unseren Erfahrungen hat sich Crate.io innerhalb kürzester Zeit im Datenmanagementsegment zu einem international führenden Anbieter entwickelt.“

Christian Lutz, Crate.io

Sie haben vor gut einem Jahr gesagt: 2018 steht im Zeichen eines starken Wachstums. Können Sie uns anhand konkreter Zahlen zeigen, wie sich Crate.io in den vergangenen zwölf Monaten entwickelt hat und wie sich der Fokus auf IoT für Sie rentiert?

Lutz: Crate.io ist 2018 mit 100 Prozent gegenüber 2017 gewachsen und wird dies in 2019 noch stark beschleunigen. Der Fokus auf IoT ist inhaltlich richtig und wird vom Interesse der Kunden belohnt, die derzeit von anfänglichen IoT-Testprojekten in die echte Produktion gehen und plötzlich hohe Anforderung an die Skalierung spüren. Crate.io ist mit dem Anspruch angetreten, eine Datenmanagementlösung der neuen Generation zu entwickeln und international zu vermarkten. Aufbauend auf unseren Erfahrungen hat sich Crate.io innerhalb kürzester Zeit im Datenmanagementsegment zu einem international führenden Anbieter entwickelt. Diese Anstrengungen werden inzwischen auch honoriert. Beispiele hierfür sind der erfolgreiche Abschluss einer neuen Finanzierungsrunde in 2018, die Kooperation mit Microsoft als Co-Selling-Partner oder die Nennung in der Forbes Liste der 25 wichtigsten Start-up-Unternehmen für 2019.

Welche Ziele setzt sich Crate.io für 2019?

Lutz: Wir treiben unser Business gezielt voran und wollen in 2019 mit dem Faktor 3 wachsen. Technische Schwerpunkte sind die kontinuierliche Entwicklung neuer relevanter Features für Industrial IoT, die Erweiterung des Cloud-Angebotes, neue Integrationen für Partner, wie zum Beispiel für die Visualisierung oder Machine Learning und künstliche Intelligenz oder auch der Ausbau des Edge-Moduls. Crate.io sieht sich als idealer Lösungspartner für Cloud-basierte IIoT-Anwendungen zur Bewältigung der in diesem Bereich entstehenden Big-Data-Anforderungen. Diesen Weg wollen wir konsequent weitergehen. Mit dem Launch der Crate IoT Data Platform for Consumer Packaged Goods haben wir erfolgreich einen ersten Schritt in Richtung branchenspezifischer Lösungen unternommen und haben hier bereits über 100 Produktionslinien in den USA und Europa angeschlossen.

Nächste Schritte

Crate.io entwickelt mit CrateDB eine SQL-Datenbank für das Internet der Dinge.

Warum Senseforce für seine IIoT-Lösung auf CrateDB setzt.

Was NoSQL-Datenbanken im Big-Data-Zeitalter leisten.

Erfahren Sie mehr über Big Data