Getty Images
Welche Rolle Storage beim Horten von Daten spielt
Das Potenzial von Datenauswertungen motiviert Firmen, Daten massenweise zu speichern. Dies kann Nachteile haben, und es gibt bessere Verwaltungsmethoden, als alles zu speichern.
Im Jahr 2023 wird das Datenaufkommen 100 Zettabyte überschreiten, und ein Ende dieser Wachstumskurve ist nicht in Sicht. Unternehmen stehen vor der Aufgabe, die Kosten für Speicherung und Verwaltung mit dem Risiko eines möglichen Datenverlusts in Einklang zu bringen.
Unternehmen könnten jedoch versucht sein, mehr Daten zu speichern, als sie benötigen. Die Speicherpreise sind gefallen, und neuere Technologien wie künstliche Intelligenz versprechen bessere und schnellere Dateneinblicke. Viele Firmen versprechen sich umfassendere Erkenntnisse aus der Analyse der Daten, die dann wiederum zu besseren Entscheidungsfindungen, optimierten Geschäftsprozessen oder engeren Kundenbindungen führen kann. Aus diesem Grund fällt es Unternehmen schwer, sich von Daten zu trennen, da ja potenziell alle Informationen noch versteckte Werte bergen können. So kommt es zum Datenhorten.
Dennoch kann die Aufbewahrung jedes einzelnen Bits und Bytes Verbindlichkeiten mit sich bringen, die den potenziellen Wert überwiegen. Es wird oft eine enorme Menge an Daten gespeichert, weil Geschäftsverantwortliche davon ausgehen, dass eines Tages ein Wert aus ihnen gezogen werden kann.
Unternehmen sollten beim Einsatz entsprechender Lösungen vorsichtig sein, sodass weitreichende Maßnahmen zur Datenspeicherung nicht kostspielig werden. Je mehr Daten eine Firma generiert und speichert, desto größer ist das Risiko von Datenverlust, Datenlecks und Datenschutzverletzungen. Bei der Entscheidung darüber, was ein Unternehmen vorhalten sollte und was nicht, sind Abteilungen auch außerhalb der IT-Abteilung gefragt.
Nützliche Daten und deren Verwaltung
Administratoren sollten sich nicht darauf konzentrieren, zu viel oder zu wenig, sondern das zu speichern, was wertvoll und wirklich nützlich ist. Das Problem für Unternehmen besteht darin, den Wert der Daten zu bestimmen und insbesondere ihren zukünftigen Wert. Oft lässt sich schwer entscheiden, was wertvoll werden könnte und horten dann einfach alles, um im Bedarfsfall auf der sicheren Seite sein zu können.
IT-Verantwortliche können bei der Bestimmung des Wertes in mehreren Schritten vorgehen. Zunächst müssen sie die Daten und ihre Verwendung unter dem Gesichtspunkt der Compliance und Governance betrachten. Dann sollten sie den Wert der Daten aus der Geschäftsperspektive betrachten. Danach können die Unternehmen die Kosten der Datenspeicherung abwägen und entscheiden, ob sie die Daten behalten wollen. Der Ansatz sollte hier sein, intelligent zu speichern und nicht willkürlich oder aufgrund einer persönlichen Meinung.
Die Anbieter von Speicherlösungen haben Techniken entwickelt, um genau das zu erreichen. Dazu gehören Datenkompression und Deduplizierung; Techniken, die darauf abzielen, die aktuelle Speicherhardware effizienter zu nutzen. Bei der Datenkomprimierung wird die Struktur der Daten verändert, um den Speicherbedarf zu verringern. Bei der Datendeduplizierung werden redundante Kopien von Daten entfernt. Diese Techniken zur Datenreduzierung gibt es schon seit einiger Zeit, aber sie werden immer weiter verfeinert, um effizienter und granularer zu funktionieren.
Vast Data zum Beispiel hat in den letzten Jahren eine auf Ähnlichkeit basierende Datenreduzierung zu Vast CLI hinzugefügt, um ähnliche Datenblöcke zu reduzieren.
Die größere Frage für Unternehmen ist immer noch, was genau sie speichern und warum. Dies wird erschwert, da sich die Frage stellt, wie Anwender etwas verwalten sollen, was sie im Zweifel nicht verstehen oder messen können. Da die Datenmenge weiter zunimmt, wird sich der Fokus verstärkt auf die Verwaltung und Klassifizierung von Datenspeichern richten müssen.
Hier kommen Unternehmen wie Hammerspace oder Produkte wie Spectra Vail von Spectra Logic ins Spiel. Beide Produkte zielen darauf ab, in verteilten Umgebungen gespeicherte Daten zu vereinheitlichen.
Künstliche Intelligenz, die Cloud und andere Themen
Hammerspace und Spectra Logic bieten ähnliche Funktionen. Hammerspace bietet mit seinem Global Data Environment eine Abstraktionsebene für die Produkte verschiedener Speicheranbieter. Spectra Vail stellt Software zur Verfügung, mit der ein einziger globaler Namensraum für lokale und Cloud-basierte Speicherangebote erstellt werden kann.
Anbieter von Datenspeichermanagement wie Hammerspace und Komprise offerieren Unternehmen einen besseren Überblick über die von ihnen gespeicherten Daten. Sie helfen Unternehmen jedoch nicht dabei, Entscheidungen darüber zu treffen, wie sie ein mögliches Horten von Daten verhindern können.
Da die Preise für Speicherplatz in den letzten zehn Jahren gesunken sind, möchten Unternehmen möglicherweise so viele Daten wie möglich aufbewahren, weil sie einen gewissen Wert für die Zukunft sehen. Etwa 80 Prozent der heute gespeicherten Daten sind dabei unstrukturiert: Texte, E-Mails, Videos oder Bilder. Das ist die Art von Daten, von denen angenommen werden kann, dass sie für maschinelles Lernen und KI-Zwecke nützlich sind.
Selbst wenn dies der Fall ist, müssen Unternehmen eine Roadmap haben, sich darüber bewusst sein, was gespeichert wird, und Richtlinien erstellen, um nur wertvolle oder notwendige Daten zu speichern oder Daten, die den Erwartungen der Roadmap entsprechen.
Das Horten von Daten könnte aber künftig weiterhin schlimmer werden. Derzeit sichern Unternehmen nur etwa ein Viertel der Daten, die sie generieren (Quelle: Spectra Logic). Mit den Fortschritten der künstlichen Intelligenz und der damit einhergehenden Erleichterung von Datenmanagement- und Data-Governance-Problemen werden Unternehmen jedoch mehr Daten als bisher aufbewahren.
Der Wert der KI wird in der Analyse und der Erstellung von Metadatenkonstrukten über den Daten liegen, so dass diese wertvoll werden. Unternehmen werden im ersten Schritt sogar vom Datenhorten profitieren, da es schwierig ist, diese Informationen neu zu generieren. Langfristig kann aber diese übermäßige Datenaufbewahrung zu Problemen führen, beispielsweise zu hohen Kosten für Infrastrukturen, Services und Managementaufwand.
Wann sollten Sie Daten löschen?
Wenn Unternehmen mehr Daten speichern wollen, brauchen sie auch Richtlinien für die Verwaltung und Löschung dieser Daten, wenn sie nicht mehr nützlich sind, erst Recht, wenn diese Informationen gesetzlichen Vorgaben wie der DSGVOunterliegen.
Speicheradministratoren sollten bei der Ausarbeitung dieser Richtlinien eine Rolle spielen. Während sie sich in erster Linie darum kümmern, dass die Daten dem Unternehmen zur Verfügung stehen, interagieren die Speicheradministratoren mit den Daten. Das bedeutet, dass sie eine gewisse Verantwortung für ein Datenleck tragen könnten. Es ist ratsam, sich über die Mindestanforderungen für die Beurteilung der Haftung der zu verwalteten Daten im Klaren zu sein und auf dieser Grundlage Sicherheitsstandards festzulegen.
Das Erarbeiten und Umsetzen dieser Richtlinien können langwierig und diffizil sein. Grundsätzlich gilt, eine Balance zwischen Wert der Daten, Kosten für die Aufbewahrung und Aufwand für die Einhaltung von Richtlinien zu finden. Hier benötigen Unternehmen Data Governance, um entscheiden zu können, welche Daten im Speicher bleiben.