macrovector - Fotolia

Sieben Kernfragen an die Entwickler von IoT-Speicher

Sieben Schlüsselbereiche spielen bei IoT-Daten eine Rolle: Die Datenarten und wie sie erhoben, verwaltet, gesichert, verarbeitet, analysiert und gespeichert werden.

IT-Verantwortliche und ihre Teams müssen auch IoT-Daten genau verstehen. Es reicht nicht, zu wissen, welcher Sensor oder welche Maschine ein Datum erzeugt. Die Verwaltung und Sicherung, das Sammeln, Aggregieren und Analysieren und schließlich die Speicherung sind genau so wichtig.

Von den Geräten, die das Internet der Dinge ausmachen, wird erwartet, dass sie in den nächsten Jahren immer größere Datenmengen erzeugen. IT-Teams müssen festlegen, wo diese Daten verarbeitet und gespeichert werden sollen, wobei sie sich auf Edge-Systeme, zentrale Rechenzentren, Cloud-Plattformen oder eine beliebige Kombination dieser drei Systeme verlassen müssen.

Bei der Planung von IoT-Speichersystemen sollten sich IT-Manager auf sieben Schlüsselbereiche konzentrieren, die mit den Daten zusammenhängen: Welche Arten von Daten gibt es und wie werden sie erhoben, verwaltet, gesichert, verarbeitet, analysiert und gespeichert?

Welche Datenarten gibt es?

Um die Speicherinfrastruktur zu entwerfen, muss die IT-Abteilung verstehen, welche Arten von Daten das Unternehmen sammeln wird. So können die Daten beispielsweise Videodateien von Überwachungskameras, Streaming-Daten von Maschinensensoren oder Umgebungsdaten von Feldgeräten umfassen. Ein IT-Team kann mit verschiedenen Arten von IoT-Daten und -Systemen zu kämpfen haben, für die sich jeweils unterschiedliche Anforderungen an die Speichersysteme ergeben.

Darüber hinaus können IoT-Daten strukturiert, semistrukturiert oder unstrukturiert sein und in unterschiedlichsten geografischen Regionen erzeugt werden. Dabei werden oft auch unterschiedliche Technologien für die Datenerfassung verwendet. Während die meisten IoT-Geräte unidirektional sind – Daten fließen typischerweise nur vom Gerät zur Sammelstelle – gibt es auch bidirektionale Geräte, zum Beispiel für intelligente Steuerungen auf den Geräten.

Ein Beispiel für Edge-Computing
Abbildung 1: Beispiel eines IoT-Systems

Wie viele Daten werden erhoben?

Die Projektion von Datenvolumina ist eine komplexe Aufgabe. Vieles hängt davon ab, wie umfassend ein Unternehmen die Einführung von IoT-Technologien plant und wie die Technologien zu den langfristigen Zielen des Unternehmens passen.

Möglichst präzise Kenntnisse über die Menge der zu erhebenden beziehungsweise der entstehenden Daten sind genauso wichtig wie das Wissen über die Datenarten. Unabhängig davon, ob es sich bei den IoT-Geräten um Consumer-Geräte oder industrielle Anlagen handelt, werden sie große Datensätze erzeugen. Diese Volumina werden kontinuierlich zunehmen. Die IT-Abteilung muss nicht nur ein klares Gespür dafür entwickeln, welche Datenvolumina kurz- und langfristig für die erfassten Datenarten anfallen können, sondern die Mengen auch genau berechnen, um die IT-Lösungen für die IoT-Aufgaben richtig zu dimensionieren.

Gleichzeitig müssen die Planer die zu erwartende Explosion von IoT-Geräten in Haushalten und Unternehmen sowie die Auswirkungen auf die Datenmenge, die in den Unternehmen sammeln, im Auge behalten. Laut einem aktuellen Bericht der Bericht des Marktforschungsunternehmens IDC werden IoT-Geräte bis 2025 weltweit etwa 40 Zettabyte an Echtzeitdaten erzeugen. Das entspricht etwa 40 Milliarden Terabyte.

Wo werden Daten erhoben und gespeichert?

IT-Teams können IoT-Speicherinfrastrukturen nicht planen, wenn sie nicht wissen, wo die Daten gesammelt und gespeichert werden. Die Faktoren hängen zum Teil von der Art und Menge der Daten sowie den IoT-Geräten selbst ab.

Die Projektion von Datenmengen ist jedoch eine schwierige Aufgabe. Vieles hängt davon ab, wie umfassend ein Unternehmen die Einführung von IoT-Technologien plant und wie diese Technologien zu den langfristigen Zielen passen.

Einige Geräte verfügen über die Kapazität, ihre eigenen Daten zu sammeln, während andere die Daten als Streaming-Data sofort an Edge-Gateways, zentralisierte Rechenzentren, Public-Cloud-Plattformen oder eine beliebige Kombination dieser drei Plattformen übertragen werden. Darüber hinaus werden die an der Edge erzeugten und gesammelten Daten wahrscheinlich auf zentralisierte Plattformen zur dauerhaften Speicherung gesendet.

IT-Teams müssen verstehen, wie die Daten von den IoT-Geräten zu den Sammelstellen und dann zu zentralen Speichersystemen gelangen. So können beispielsweise Daten von den Geräten zuerst an eine Appliance für eine hyper-konvergente Infrastruktur (HCI) an der Edge gestreamt und anschließend an einen Cloud-basierten Objektspeicher übertragen werden. In diesem Fall muss die IT-Abteilung sicherstellen, dass die HCI-Appliance über die ausreichende Speicherkapazität verfügt, um den lokalen Betrieb zu unterstützen, und dass die Cloud-Speicherplattform eine Service-Level-Vereinbarung (SLA) bereitstellt, die den erwarteten Kapazitäts- und Leistungsanforderungen entspricht.

Wo werden die Daten verarbeitet und analysiert?

Um die Datenbewegungen vollständig zu verstehen, muss das IT-Team wissen, wo die Daten verarbeitet und analysiert werden. Diese Operationen können sich über mehrere Knoten in der IoT-Infrastruktur erstrecken. Einige IoT-Geräte können die Daten bis zu einem gewissen Grad verarbeiten, und müssen dann an ein weiteres System übertragen werden. Andere Geräte streamen die Rohdaten an ein Edge-System, wo sie bereinigt, transformiert und zur Analyse an ein Rechenzentrum gesendet werden.

Manchmal müssen sowohl die Verarbeitung als auch die Analytik in unmittelbarer Nähe der IoT-Geräte erfolgen, um Latenzprobleme zu vermeiden. Für die Echtzeitanalyse von Daten ist das besonders wichtig. Die Rohdaten können danach in einer Cloud archiviert oder an das Rechenzentrum gesendet werden. Die Datenverarbeitung und -analyse selbst kann an jeder Stelle der IoT-Infrastruktur erfolgen.

Ein Beispiel für Edge-Computing
Abbildung 2: Ein Beispiel für Edge-Computing

Dazu muss beurteilt werden, wo all die Vorgänge stattfinden. Nur so lässt sich sicherzustellen, dass in jeder Phase ausreichende Speicherressourcen zur Verfügung stehen. Dabei ist zu berücksichtigen, welche Vorgänge vollständig im Speicher durchgeführt werden. Je nach den Umständen ist jede Kombination möglich, und die IT-Abteilung muss möglicherweise mehrere Szenarien unterstützen.

Welche Daten werden aufbewahrt?

Die IT-Abteilung muss auch Daten identifizieren, die aufbewahrt werden müssen. Dabei spielt aus dem Aspekt der Datensparsamkeit heraus eine Rolle, die Dauer der Aufbewahrung beziehungsweise ein Verfallsdatum festzulegen, wie lange und welche Daten verworfen werden können. Die IoT-Speicherarchitektur muss möglicherweise Rohdaten, gestaffelte Daten, transformierte Daten, aggregierte Daten und analysierte Daten aufnehmen, und jede Art von Daten hat unterschiedliche Speicheranforderungen.

Die Rohdaten müssen möglicherweise auf unbestimmte Zeit archiviert oder nur so lange gespeichert werden, dass sie die Transformationen und Analysen durchführen können, die zur Generierung von Warnmeldungen, Key Performance Indicators oder vollständigen Berichten erforderlich sind. Die meisten Datenarten werden ihre eigenen Aufbewahrungskriterien haben, wobei auch hier jedes Szenario denkbar ist.

Wie werden die Daten verwaltet und gespeichert?

Die Tools und Technologien zur Datenverwaltung können sich auch auf die Einrichtung des Speichers auswirken. Relationale Datenbanken, NoSQL-Datenspeicher und Object-Storage-Plattformen haben unterschiedliche Speicheranforderungen. Faktoren wie Skalierbarkeit, Redundanz, Hochverfügbarkeit und Disaster-Recovery wirken sich ebenfalls auf die Verwaltung und Speicherung von Daten aus. Es könnten aber auch noch weit größere Herausforderungen auf die IT-Teams zukommen, die eine bestehende Infrastruktur für das IoT nachzurüsten, vor noch stehen.

Weitere wichtige Faktoren sind die Art und Menge der Daten, ob die Daten in Echtzeit verarbeitet werden müssen und die Art der durchzuführenden Analysen. I/O-Muster können erheblich variieren, ebenso wie Durchsatz- und Latenzanforderungen, die durch das Ausmaß der Verteilung von Operationen erschwert werden. Die IT-Teams werden wahrscheinlich unterschiedliche Ansätze verfolgen müssen, um alle IoT-Speicher- und andere Anforderungen erfüllen zu können. Das kann das Daten-Management gegenüber bisherigen IT- und Storage-Infrastrukturen beeinflussen und wiederum die Speicherplanung erheblich erschweren.

Welche Sicherheits- und Datenschutzanforderungen gelten für IoT-Datenspeicherung?

Mit zunehmender Anzahl der IoT-Geräte steigen nicht nur die Datenmengen und Übertragungswege, sondern es erwächst ein Albtraum für die Datenschutzbeauftragten und für die Verantwortlichen für die Data Governance. Auf die übergeordneten Datenmodelle traditioneller Rechenzentren können sie sich nicht weiter verlassen. Die verteilte Natur der IoT-Architektur öffnet Angriffsflächen in alle Richtungen. Unternehmen können die volle Kontrolle über die Geräte und Sammelprozesse haben, wie zum Beispiel im Bereich von Industrial-IoT und Industrie 4.0. Eine volle Kontrolle ist jedoch nicht immer möglich, insbesondere wenn ein Unternehmen das volle Potenzial von IoT ausschöpfen möchte.

Leider ist die Sicherheit in vielen IoT-Diskussionen gegenüber anderen Überlegungen in den Hintergrund getreten, da es noch keine klaren Sicherheitsstandards gibt. Die IT-Abteilung muss größtenteils selbst herausfinden, wie sie IoT-Systeme implementiert, die sensible Daten schützt und gleichzeitig die geltenden Vorschriften und Standards einhält.

Einige Compliance-Vorschriften verlangen, dass bestimmte Arten von Daten über einen längeren Zeitraum aufbewahrt werden, während andere die Verantwortung für den Schutz aller persönlich identifizierbaren Informationen, unabhängig von den Kosten, direkt auf das Unternehmen übertragen. Data Governance ist ein unternehmensweites Anliegen, wobei die Speicherung einer der wichtigsten Faktoren in der Gleichung ist.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Warum IoT-Storage objektbasiert sein sollte

Flash-Storage für IoT- und AI-Daten im Gesundheitswesen

IoT und Schatten IT: Warum Kontrolle wichtig ist

Erfahren Sie mehr über Software-defined Storage