Bacho Foto - stock.adobe.com
IoT-Datenanalyse: Performance und Integration entscheidend
Damit die Use Cases des Internet der Dinge funktionieren, müssen Daten möglichst in Echtzeit ausgewertet und in Handlungsanweisungen übersetzt werden.
Wenn vom Internet der Dinge (IoT) und Data Analytics die Rede ist, geht es längst nicht mehr um das Zusammentragen von einigen Daten für den wöchentlichen Management-Report. Vielmehr sind die Datenmengen riesig, zumeist unstrukturiert, stammen oft aus zahlreichen Quellen, und sollen echtzeitnah ausgewertet werden.
Deren Analyseergebnisse zielen auf direktes Handeln, sei es die Aussteuerung einer Produktionsanlage, die Planung des perfekten Wartungszeitfensters (Predictive Maintenance) auf der Basis von Condition Monitoring oder die logistische Optimierung einer LKW-Flotte mittels Tracking.
IoT-Daten erfassen: von Datenformaten und Skalierbarkeit
Daten an einem IoT-Endgerät zu erfassen, ist zumeist technisch unkompliziert umsetzbar. Viele Geräte oder Maschinen besitzen bereits Sensoren oder lassen sich leicht nachrüsten. Zudem bieten viele Hersteller heute ganze IoT-Edge-Computing-Lösungen: Sensoren können leicht durch kompakte Mini-Computer ergänzt werden, um so direkt vor Ort erste Verarbeitungsschritte zu erledigen, wie etwa Voraggregation der Daten, und um als Gateway zu fungieren. Hinzu kommen passende Software-Stacks, wie etwa Device-Management-Lösungen.
Die Übertragung der Daten stellt die erste Herausforderung dar. Auch wenn die einzelnen Sensordatensätze meist eher klein sind, wachsen insgesamt doch beachtliche Datenmengen heran, wenn viele IoT-Geräte in kurzen Abständen ihre Messdaten melden. Es werden entsprechend zuverlässige Übertragungswege benötigt, dorthin, wo ein Datenbanksystem die Daten aufnimmt und Analysesoftware sie aufbereitet.
Häufig sind die – teilweise sehr zahlreichen – IoT-Endgeräte geografisch weit verteilt und/oder manchmal an schwer zugänglichen und deshalb infrastrukturell wenig erschlossenen Orten, was eine Remote-Steuerung via IoT zwar besonders attraktiv, die Datenübertragung aber kompliziert macht. Während sich eine IoT-Lösung entwickelt und genutzt wird, kommen neue Endgeräte, Betriebssystem-Updates der Devices sowie weitere Quellen und Datenformate hinzu. Für die Analytics-Infrastruktur bedeutet dies, dass sie entsprechend flexibel erweiterbar und skalierbar sein muss. Doch wie lässt sich das praktisch umsetzen?
IoT-Daten analysieren: von Performance und Integration
Große Datenmengen zu speichern, stellt heute kein Problem mehr dar. Beliebig große Datenbanksysteme können bei steigendem Bedarf zum Beispiel auf Public-Cloud-Ressourcen zugreifen und das theoretisch ohne Begrenzung. Viel wichtiger als das Speichern der Daten an sich ist es jedoch, mit hoher Performance auf die Daten zugreifen und die für IoT-Szenarien wichtigen Auswertungen zeitnah erstellen zu können. Die etablierten, festplattenbasierten Datenbanken erweisen sich – vor allem im Big-Data-Umfeld – zunehmend als Flaschenhals. Datenbanksysteme, die den Hauptspeicher als beschleunigenden Cache benutzen, zeigen eine deutlich höhere Zugriffs-Performance.
Solche In-Memory-Datenbanken (IMDB) sind ebenfalls seit mehreren Jahren auf dem Markt und entsprechend ausgereift. Ihre wachsende Bedeutung verdanken sie neben den Big-Data-Analytics-Anforderungen vor allem den deutlich gesunkenen RAM-Preisen. Die zusätzliche Ausstattung mit Arbeitsspeicher fällt inzwischen im Gesamtbudget kaum mehr ins Gewicht als andere Infrastrukturbestandteile. Und noch eine IMDB-typische Funktionsweise trägt zur hohen Performance bei: die massiv-parallele Datenverarbeitung. Um den RAM mehrerer Server gleichzeitig nutzen zu können, werden Abfragen automatisch auf alle Knoten eines Clusters verteilt. Es entsteht eine Shared-Nothing-Architektur, bei der vergleichsweise günstige Standard-Rechner zu einem hochperformanten Cluster zusammenwachsen.
Das Herzstück jeder IoT-Anwendung ist jedoch das Datenanalysesystem. Schon die Wahl des passenden Tools dürfte für viele Unternehmen eine Herausforderung sein. Zum einen hängt die gewünschte Funktionalität stark von der Art der IoT-Anwendung ab: Sollen zum Beispiel lediglich einfache Zustandsmeldungen ausgewertet werden (Device funktioniert noch oder nicht?), oder geht es um verschiedene Daten (von Temperatur und Abnutzungsgrad eines Werkzeugs bis hin zu Wetterprognosen und Marktpreisen), die für die Steuerung einer Produktionsanlage samt der dazugehörigen Logistik genutzt werden? Zum anderen ist die Auswahl riesig. Sowohl Datenbankhersteller als auch die Anbieter von IoT-Edge-Lösungen und zahlreiche Software-as-a-Service-Dienstleister stellen entsprechende Tools bereit.
„Ratsam für Unternehmen ist es, gewisse Grundfunktionalitäten vorab zu prüfen: Die Analyselösung sollte zahlreiche Formate für den Datenimport unterstützen, also neben Standardschnittstellen auch offene API-Schnittstellen zur Verfügung stellen.“
Mathias Golombek, Exasol AG
Ratsam für Unternehmen ist es, gewisse Grundfunktionalitäten vorab zu prüfen: Die Analyselösung sollte zahlreiche Formate für den Datenimport unterstützen, also neben Standardschnittstellen auch offene API-Schnittstellen zur Verfügung stellen. Denn gerade IoT-Devices verschiedener Hersteller arbeiten oft mit unterschiedlichen Formaten.
Wichtig dabei ist, dass Auswertungsergebnisse in Form von Handlungsanweisungen an die Geräte zurückgegeben werden können. Denn das Ziel ist es schließlich, den Produktionsprozess entsprechend den sich ändernden Bedingungen anzupassen. Darüber hinaus sind offene oder anpassbare Interfaces zu anderen Teilen der Infrastruktur notwendig, zum Beispiel zur Edge-Lösung, zum Cloud-Anbieter oder zu weiteren Datenquellen. Inzwischen bietet der Markt ganze Ökosysteme an IoT-unterstützenden Tools, auch weil viele Public-Cloud-Dienstleister hier derzeit massiv investieren.
Nicht zuletzt spielt die Integration in die eigene Infrastruktur eine wichtige Rolle. IoT-Projekte werden zumeist als einzelne (Test-) Anwendung gestartet. Datenbank und Analyse-Tool sollten deshalb zunächst als Erweiterung integrierbar und dabei flexibel genug sein, wenn die IoT-Strategie später weiterentwickelt wird.
Über den Autor:
Mathias Golombek ist Vorstandsmitglied und CTO der Exasol AG. Er verantwortet alle technischen Bereiche des Unternehmens, von der Entwicklung über den Betrieb und Support bis hin zum fachlichen Consulting. Golombek hat an der Universität Würzburg Informatik mit den Schwerpunkten Datenbanken und verteilte Systeme studiert.