stokkete - stock.adobe.com
So setzen Sie Data Protection für unstrukturierte Daten um
Unstrukturierte Daten erfordern eine genau so sorgfältige Sicherung wie strukturierte Daten, allerdings verschlingen sie unter Umständen erheblich mehr Speicherplatz.
Ironischerweise erfordert der Schutz unstrukturierter Daten solide Strukturen. Anders als strukturierte Daten, die spezifische Formate haben und in Reihen und Spalten geordnet werden, haben unstrukturierte Daten kein spezifisches Format. Beide erfordern zwar unterschiedliche Formatierung, brauchen aber dieselben Backup-Technologien und -Prozesse.
Allerdings gibt es Faktoren, die Backup-Admins bei der Handhabung unstrukturierter Daten berücksichtigen müssen. Die unstrukturierten Files können jede Größe haben. Oft umfassen sie Millionen und Milliarden Bytes. Der zuverlässige Schutz dieser Daten gelingt nur, wenn Organisationen tiefgehendes Wissen über die darin enthaltenen Informationen und einen Plan für ihren Abruf und Sicherung haben.
Backup strukturierter und unstrukturierter Daten
Strukturierte Daten werden meist in Managementsystemen für Datenbanken und relationale Datenbanken gehalten. Ihre organisierte Struktur macht die Abfrage spezifischer Daten einfach genau wie ihre Reorganisation zum Zweck weiterer Wertschöpfung.
Unstrukturierte Daten, die heute bei weitem die größte und weiterhin eine steil anwachsende Datenmenge ausmachen, können vielfältige Informationstypen enthalten: Word-, Excel- oder Power-Point-Dokumente, E-Mails, Fotos, Videos, Audiodateien, Social Media, Log-Dateien, Sensordaten oder IoT-Daten.
Sie werden meist als Objekte gespeichert, die Daten jedes Formats enthalten können. Das Storage-System umgibt dabei die Daten mit einer Art Umschlag. Er enthält die Metadaten, die über die Platzierung auf dem Storage-System entscheiden und für das Wiederauffinden der Datei nötig sind. Storage- und Backup-Admins können diese Metadaten verwenden, um einen File zu identifizieren. Sie bekommen dabei aber keine Informationen über die inneren Bestandteile der Datei und darüber, wo sich bestimmte Anteile befinden.
Semistrukturierte Daten vereinigen die Vorteile beider Datentypen. Das Hinzufügen strukturierter Datenelemente zu an sich unstrukturierten Daten wird derzeit immer beliebter, da es dabei hilft, die Daten zu finden und ihren Wert zu erhöhen.
Data Protection für unstrukturierte Daten erfordert Sicherungen, die im Prinzip denen strukturierter Daten gleichen. Allerdings kann die oft sehr große Datenmenge den Prozess und die Storage-Anforderungen beeinflussen. So können mehr oder größere Storage-Arrays am Standort nötig sein oder es wird häufiger Cloud Storage genutzt. Abhängig vom Bedarf, die Daten wieder aufzufinden und der Notwendigkeit, unstrukturierte Daten aktiv zu benutzen, etwa sofort, innerhalb einer Woche, innerhalb von 30 oder 90 Tagen, werden die Daten auf unterschiedlichen Storage-Medien gesichert.
Management unstrukturierter Daten
Jeder Anwender, der die passenden Rechte hat, kann auf unstrukturierte Daten-Files zugreifen und sie lesen. Zusätzliche Rechte und Autorisierungen können für ihre Modifikation nötig sein. Eine Herausforderung im Umgang mit unstrukturierten Daten ist es zu identifizieren, was die Datei enthält und wann die Organisation sie vielleicht braucht.
Für das Management strukturierter und unstrukturierter Daten ist ein umfassendes Datenmanagementprogramm erforderlich. Strukturierten Daten lassen sich wegen ihres gut organisierten Formats relativ einfach managen. Den geschäftlichen Wert unstrukturierter Daten zu finden, erfordert mehr Aufwand. Data Mining ist ein administrativer Prozess, mit dem sich große unstrukturierte Files untersuchen lassen, um nützliche Inhalte zu finden.
Es gibt auch spezialisierte Softwareprogramme, um unstrukturierte Daten-Files zu verarbeiten und in einer nützlichen Form zu organisieren. Damit lassen sich ihre Daten so manipulieren, dass sich ein geschäftlicher Nutzen ergibt, so lange sich die Prozesse im Rahmen der datenschutzrechtlichen Normen bewegen. Hierauf sollte strikt geachtet werden, da Überschreitungen der rechtlichen Grenzen erhebliche Strafzahlungen und Reputationsverluste zur Folge haben können.
Unstrukturierte Daten sollten regelmäßig gesichert werden, um Vorläuferversionen zu schützen, so dass sie später als Referenz verwendet werden können. Das beeinflusst natürlich den On- oder Offsite-Storage-Bedarf der Organisation.
Schutzverfahren für unstrukturierte Daten
Verschlüsselung und andere Techniken können die Sicherheit strukturierter Daten erhöhen. Sie schützen kritische Daten wie persönliche Gesundheitsinformationen oder personenbezogene Daten. Unstrukturierte Daten können ebenfalls solche Informationen enthalten. Deshalb ist es essenziell, sie genauso gut zu schützen.
Allerdings kann es schwieriger sein, die besonders schützenswerten Daten in unstrukturierten Daten zu finden. Das unspezifische Format macht es schwer, kritische Inhalte im Auge zu behalten. Es ist aber extrem wichtig für eine Organisation, zu wissen, welche Inhalte sich wo in den vorhandenen unstrukturierten Daten befinden. Nur dann lassen sich die betreffenden Daten, wenn nötig, sicher lokalisieren.
Genaue Kenntnisse zum Inhalt unstrukturierter Daten sind aus rechtlichen und Compliance-Gründen erforderlich. Regelwerke zum Schutz personenbezogener Daten wie die DSGVO (Europäische Datenschutzrichtlinie) verlangen, dass Organisationen personenbezogene Daten auf Primär-Storage speichern. Organisationen müssen fähig sein, personenbezogene und andere wichtige Daten zu identifizieren und nachzuweisen, wie sie genutzt und wo sie gespeichert werden. Das betrifft auch Backup-Aktivitäten, ob nun lokal oder im Hintergrund.
In Anbetracht der explosiv wachsenden Mengen unstrukturierter Daten und ihrer zahlreichen Anwendungen erweisen sich bislang bewährte Datenmanagementtechniken zunehmend als unzureichend. Doch mittlerweile gibt es sowohl von Storage-Herstellern entwickelte als auch Open-Source-Tools für das Management. Sie sollten ein integrierter Teil des Datenmanagements und des Daten-Backup-Programms sein. Cloud Service Provider haben manchmal ebenfalls Tools zum Management unstrukturierter Daten in ihrem Portfolio.