freshidea - stock.adobe.com

Retention Policies und Datenhygiene: Storage optimal nutzen

Planung von Datenspeichern und Aufbewahrungsrichtlinien sind Kerngedanken der Datenhygiene – und wichtig für die effiziente und schonende Auslastung von Speicherressourcen.

Die Welt erzeugt Daten in einem atemberaubenden Tempo. Laut ManageEngine sind mindestens 30 Prozent der unstrukturierten Daten eines Unternehmens so genannte ROT-Daten („Redundant, Obsolete, Trivial“ beziehungsweise redundant, veraltet oder unbedeutend), wobei einige Schätzungen den Wert noch viel höher ansetzen.

Die zunehmende Verbreitung von 5G- und IoT-Geräten verstärkt diesen Trend. Mit der riesigen Menge an Informationen geht eine enorme Menge an „Datenmüll“ einher. Der Datenmüll belastet die Speicher- und Netzwerksysteme mehr denn je. Datenmüll tritt in einer Vielzahl von Formen auf, zum Beispiel in Form von doppelten E-Mails, veralteten Dokumenten, aufgeblähten Webinhalten, unnötiger Kommunikation und schlechter Datenverwaltung.

All diese Daten erfordern mehr Speicherkapazität, erhöhen die Komplexität der Datenverwaltung und führen zu höheren Kosten. Richtig schlimm kann es werden, wenn Unternehmen auf die Kommunikation mit Collaboration-Lösungen umstellen und gleichzeitig neben lokalen Ressourcen auch noch Cloud-Speicher nutzen.

Von Ahnungslosigkeit getrieben und unter Ignoranz der Vorgaben legen die Mitarbeiter Dateien dann im Gruppen-Chat ab, mailen dieselben Dateien dann aber auch an externe Mitarbeiter, die aus nicht nachvollziehbaren Gründen keinen Zugang zur internen IT haben, und packen die Dateien sicherheitshalber noch auf den Cloud-Speicherplatz (weil jemand sagte, dass dort das zentrale Data Repository sei).

Hier hat eine Datei in einem Zuge vier Instanzen erhalten, die unter Umständen unabhängig voneinander verändert werden können (Mail-Ausgang, Rücksendung von Externen, Version im Chat-Verlauf und die Version auf dem Cloud-Laufwerk). Doch welche Datei war nun die mit dem letzten gültigen Stand? Die gute Idee, alle über die Collaboration-Lösung an ein und derselben Datei arbeiten zu lassen, ist passé. 

Die Aufbewahrung von ROT-Daten kann auch Sicherheits-, Compliance- und rechtliche Risiken erhöhen und die Produktivität und effektive Entscheidungsfindung beeinträchtigen. Je mehr Daten zu verwalten und zu sortieren sind, desto größer sind die Herausforderungen für alle Beteiligten.

Mehr denn je müssen Unternehmen ihre ROT-Daten in den Griff bekommen, aber das ist keine kleine Aufgabe. Alle wichtigen Interessengruppen müssen sich beteiligen. Unternehmen müssen einen Weg finden, ROT-Daten zu eliminieren und die Verschwendung von Datenspeichern zu minimieren, was ein Umdenken im gesamten Unternehmen erfordert. IT-Teams, die bereit sind, sich mit ROT-Daten zu befassen, sollten bei der Planung von Strategien zur Verringerung der Datenverschwendung die folgenden Richtlinien berücksichtigen.

1. Zeit und Ressourcen bereitstellen

Die Beseitigung von ROT-Daten erfordert entsprechend Zeit und Ressourcen. Der Aufwand ist notwendig, um sicherzustellen, dass ein guter Prozentsatz des Datenmülls beseitigt wird, ohne jene Daten zu löschen, die das Unternehmen weiterhin benötigt. IT-Teams, die den Prozess überstürzt und nach einfachen Schemata angehen, entfernen möglicherweise die falschen Daten. Das kann das Risiko von Compliance- oder Rechtsverstößen mit sich bringen. Falls es durch Aktionismus nicht gelingt, den Großteil der ROT-Daten zu entfernen, werden sowohl Zeit als auch Ressourcen vergeudet.

Ein Unternehmen muss bereit sein, das nötige Personal einzusetzen, um diesen Prozess effektiv zu gestalten. Sie müssen auch in Tools investieren, die die Datenverwaltung rationalisieren und vereinfachen. So profitieren IT-Teams häufig von Tools, die ihnen helfen, ihre Daten zu erkennen und zu katalogisieren sowie zu bestimmen, wie Mitarbeiter auf Daten zugreifen und sie nutzen. Mit den richtigen Tools können IT-Teams viele ihrer Datenverwaltungsvorgänge automatisieren, um das Erkennen und Löschen von ROT-Daten zu erleichtern. Die Automatisierung kann auch verhindern, dass ROT-Daten in die Speichersysteme zurücksickern.

2. Vorhandene Daten inventarisieren und katalogisieren

Um mit der Verwaltung von ROT-Daten zu beginnen, sollte eine Bestandsaufnahme der vorhandenen Daten durchgeführt werden. Damit lässt sich feststellen, wie viele Daten in einem Unternehmen vorhanden sind, wo sie sich befinden, wem sie gehören, wer darauf zugreifen kann und wie lange sie bereits vorhanden sind. Auch andere wichtige Faktoren in Bezug auf die Daten, zum Beispiel ob sie für die Einhaltung von Vorschriften oder für geschäftliche Zwecke benötigt werden, sowie alle Aufbewahrungsrichtlinien, die für die Entscheidung über die Aufbewahrung der Daten relevant sein können, sind zu ermitteln. Daten in Cloud- und Edge-Umgebungen sollten bei der Bestandsaufnahme ebenso berücksichtigt werden wie Daten auf Servern, Desktops und lokalen Speichersystemen wie NAS oder SAN.

Dazu sollte ein Katalog angelegt werden, der die Ergebnisse der Bestandsaufnahme erfasst. Eine Taxonomie hilft, die Daten in dem Katalog zu definieren, zu kennzeichnen und zu gruppieren. Daraus lässt sich schon ableiten, welche Daten ROT sind und welche Daten notwendig, noch relevant, veraltet, an anderer Stelle dupliziert, aus rechtlichen oder Compliance-Gründen erforderlich oder in anderer Weise für Ihr Unternehmen wertvoll sind. Es sollte nicht grundsätzlich davon ausgegangen werden, dass ein altes Dokument per se ROT ist.

3. Vorhandene ROT-Daten löschen

Nach der Identifizierung veralteter Daten, kann der Löschvorgang beginnen. Zunächst können doppelte Dateien gelöscht werden, die einen großen Teil der ROT-Daten ausmachen dürften. Dafür ist ein Tool zur Datendeduplizierung hilfreich. Es sollte jedoch den Anforderungen des Unternehmens genügen. Obwohl viele Speichersysteme inzwischen Deduplizierungsfunktionen enthalten, reichen diese für größere Unternehmen, deren Daten über mehrere Speicherplattformen verteilt sind, meist nicht aus.

Doppelte Daten sind allerdings nur eine Art von Datenmüll und Speicherverschwendung. In weiteren Schritten müssen alle ROT-Daten, die sich auf verschiedenen Speichersystemen angesammelt haben, beseitigt werden. Dies erfordert wiederum einen sorgfältig durchdachten, systematischen Ansatz, der sicherstellt, dass nur die ROT-Daten gelöscht werden, ohne gute Daten zu gefährden und ohne gegen rechtliche Verpflichtungen oder Vorschriften zu verstoßen.

Falls es Zweifel gibt, ob bestimmte Daten gelöscht werden sollen, sollten sie auf eine billigere Speicherplattform kopiert und dann von den primären Speichersystemen gelöscht werden. Gegebenenfalls versieht man diese Daten mit einem Verfallsdatum. Wurden sie dann nach einer bestimmten Zeit nicht benutzt und fallen sie nicht unter gesetzliche Aufbewahrungsrichtlinien, könnten sie ebenfalls gelöscht werden.

4. Richtlinien zur Datenaufbewahrung festlegen und implementieren

Ein Grund für die Anhäufung von ROT-Daten ist die Tatsache, dass Unternehmen ihre Dateien noch lange aufbewahren, nachdem sie sie nicht mehr benötigen. Unternehmen sollten umfassende Richtlinien zur Datenaufbewahrung einführen, die festlegen, welche Daten aufbewahrt werden, wie lange sie aufbewahrt werden und wann sie gelöscht werden.

In einer Aufbewahrungsrichtlinie kann auch festgelegt werden, wie die Daten zu organisieren sind, damit das Unternehmen sie später durchsuchen und darauf zugreifen kann. Ziel der Richtlinie ist es, sicherzustellen, dass die Daten nur so lange aufbewahrt werden, wie sie benötigt werden, also acht Wochen, acht Monate oder acht Jahre.

Eine umfassende Aufbewahrungsrichtlinie (Retention Policy) kann Unternehmen dabei helfen, die Einhaltung von Vorschriften zu automatisieren, rechtliche und behördliche Risiken zu verringern und die Speicherkosten zu senken. Darüber hinaus kann sie die Relevanz der Daten für fortschrittliche Analysen und effiziente Entscheidungsfindung erhöhen.

Um effektiv zu sein, muss die Aufbewahrungsrichtlinie jedoch sowohl die geschäftlichen Anforderungen als auch rechtliche und Compliance-Fragen berücksichtigen. Darüber hinaus sollte sie die Bedürfnisse der verschiedenen Datentypen berücksichtigen, da einige Typen wertvoller sind als andere.

5. Nur eine einzige Quelle für Daten schaffen: Zentrales Repository

Eine der am häufigsten empfohlenen Strategien für den Umgang mit ROT-Daten – und die Verwaltung von Daten im Allgemeinen – ist die Konsolidierung von Daten in einem zentralen Repository. Dies scheint natürlich im Widerspruch zu Trends wie Hybrid Cloud und Edge Computing zu stehen. Ein zentrales Repository kann allerdings dazu beitragen, die Datenredundanz zu verringern, die Datenverwaltung zu vereinfachen und die Sicherheit der Daten zu erhöhen. Außerdem müssen die Nutzer weniger Daten auf ihren eigenen Systemen speichern.

Die Verlagerung aller Daten in ein zentrales Repository ist nicht für jedes Unternehmen geeignet. Wichtiger ist es, eine einzige Quelle (Single Source of Truth) für jede Datenkategorie zu schaffen. Gibt es für eine Datei nur eine einzige Quelle, so beseitigt dies Unsicherheiten bei der Versionierung, erleichtert die Standardisierung von Abläufen und verbessert die Datenqualität. Für die Benutzer wird es einfacher, mit den Daten zu arbeiten – sie wissen, wo sie die korrekte Version finden, und alle stützen sich auf dieselben Inhalte.

Wichtige Schritte zur Reduzierung von Datenmüll
Abbildung 1: Wichtige Schritte zur Reduzierung von Datenmüll

6. Pläne für den Umgang mit Datenmüll implementieren

Als nächstes wird ein guter Plan zum fortlaufenden Umgang mit ROT-Daten definiert. Ein solcher Plan gehört zu den Richtlinien für die Datenaufbewahrung und -deduplizierung sowie zu den allgemeinen Strategien für die Datenverwaltung und das Datenmanagement. Der ROT-Plan sollte festlegen, welche Daten aufbewahrt werden sollen, mit dem Ziel, den Umfang der Datenspeicherung zu reduzieren.

Der Plan sollte auch Maßnahmen enthalten, mit denen die Chance zur Erstellung unnötiger Daten verringert wird. Das kann beispielsweise zur Verhinderung von Web-Bloat oder Datenhortung beitragen. Eine gute Idee ist es, den Daten(-bereichen) Personen zuzuordnen, die für die Inhalte verantwortlich sind. Das könnte die Wirksamkeit der Datenreduzierung verbessern und das Potenzial für neue ROT-Daten zu verringern.

Außerdem sollten aktuelle Daten-Workflows analysiert werden, um herauszufinden, wann, wo und wie Mitarbeiter ROT-Daten erzeugen. Dadurch lassen sich die Maßnahmen zur Vermeidung von Datenmüll zielgerichteter festlegen. Die Pläne zur Reduzierung des Datenmülls sollten auch Schritte für eine (angemessene) Dokumentation umfassen, in der die Mechanismen und Prozesse für den Umgang mit ROT-Daten sorgfältig beschrieben werden.

7. Personal ausbilden und schulen

Wenn es darum geht, Datenmüll zu bekämpfen, ist ein Unternehmen in hohem Maße auf die Mitarbeiter angewiesen, die täglich mit den Daten arbeiten. Sie sind nämlich maßgeblich an der Eindämmung der Menge an ROT-Daten beteiligt, die das Unternehmen erzeugt und speichert. Aus diesem Grund sollten sie in die Planung einbezogen werden, wo immer dies möglich und sinnvoll ist, und sie sollten umfassend über alle Änderungen der Richtlinien und Strategien zur Reduzierung der Datenverschwendung informiert werden, die sich auf ihre Arbeit mit den Daten auswirken könnten.

Eine wichtige Aufgabe ist die Aufklärung des Personals über die Problematik der ROT-Daten und die Schulung in den Schritten zu weniger Datenmüll. Der Schwerpunkt sollte auf bewährten Verfahren zur Datenreduzierung liegen.

Alle Änderungen hinsichtlich der Datenspeicherung und der Zugriffsprozesse, wie die Verlagerung von Daten in ein zentrales Repository, müssen den Mitarbeitern sorgfältig und ausführlich mitgeteilt werden, damit niemand unvorbereitet mit den neuen Prozessen konfrontiert wird. (Das heißt, es sind mehr als eine Mail zur Änderung und eine kurze Click-Show im nächsten Team-Meeting erforderlich.) Schlecht laufen die Maßnahmen, wenn Mitarbeiter – auch Lieferanten – ihre Arbeit nicht mehr erledigen können. In einigen Fällen benötigen die Mitarbeiter eine spezielle Schulung in einem bestimmten Bereich, zum Beispiel wenn sie den Entwicklern erklären müssen, wie sie den Web-Bloat reduzieren können. Jeder, der mit Daten arbeitet, sollte jedoch darin geschult werden, wie man Datenmüll vermeiden kann.

Erfahren Sie mehr über Backup-Lösungen und Tools