Smart Data
Smart Data sind digitale Informationen, die so aufbereitet sind, dass unmittelbar verwertbares Wissen daraus abgeleitet werden kann. Dazu werden diese Daten direkt an einem Sammelpunkt (bei der Datenquelle) bearbeitet, bevor sie an eine nachgelagerte Analyseplattform zur weiteren Datenkonsolidierung und -analyse weitergeleitet werden.
Der Begriff Smart Data wird häufig mit dem Internet der Dinge (Internet of Things, IoT) und den Daten, die Sensoren in Geräten produzieren, assoziiert. Das Label smart bezieht sich direkt auf den Dateneingabepunkt. Dieser soll intelligent genug sein, um sofort Entscheidungen über eingehende Daten zu treffen, ohne auf die Rechenleistung von einem zentralisierten System zugreifen zu müssen.
In der Vergangenheit wurden die meisten Analysen per Batch-Verarbeitung ausgeführt. Die Daten wurden nach einem bestimmten Zeitplan erfasst, in den gewünschten Zustand transformiert, in eine Datenbank gestellt und stündlich, über Nacht oder wöchentlich verarbeitet. Der große Nachteil dieses Ansatzes ist, dass die Daten schon alt sind, wenn sie analysiert werden.
Im Gegensatz dazu überwacht Smart Data Analytics (auch Streaming Analytics genannt) die Daten direkt an der Quelle, erfasst wichtige Ereignisse, die Ausnahmen darstellen, bewertet sie, trifft eine Entscheidung und teilt die Ausgabe mit anderen - und das innerhalb eines bestimmten Zeitfensters von Sekunden oder Sekundenbruchteilen. Dass die Daten direkt an der Quelle bearbeitet werden können, hat im IoT-Umfeld eine enorme Bedeutung.
So kann es ein selbstfahrendes Auto zum Beispiel nicht erst Daten in die Cloud senden und abwarten bis das Ergebnis der Auswertung zurückkommt. Wenn ein autonomes Fahrzeug auf ein Hindernis trifft, hat es nicht die Zeit, alle Daten an einen Cloud-Server zu schicken und auf den Befehl für eine Ausweichhandlung zu warten. Die Auswertung muss deshalb vor Ort und sofort erfolgen.
Dazu müssen die Daten, die über Sensoren erfasst werden, intelligent sein, damit diese sofort von den Prozessoren des Automobils analysiert werden können. Die Ergebnisse müssen unmittelbar an die Akteure beziehungsweise Bedienungselemente gesendet werden, die die Bremsen und das Lenkrad des Fahrzeugs steuern. Wenn die Daten nicht in einer Form vorliegen, die sofort analysiert werden kann, sobald die Prozessoren sie erhalten, können die Folgen tödlich sein.
Data Scientists, Business Analysten, IT-Manager, Marketing-Profis und Hersteller experimentieren darüber hinaus mit dem Einsatz von Edge Computing und intelligenten Datengeräten mit dem Ziel, mehr Umsatz zu erzielen, Entscheidungsprozesse zu verbessern und Probleme zu erkennen, bevor Geräte ausfallen.