Definition

Datenarchivierung (Archivierung)

Was ist Datenarchivierung?

Bei der Datenarchivierung werden Daten, die nicht mehr aktiv genutzt werden, zur langfristigen Aufbewahrung auf ein separates Speichergerät verschoben. Archivdaten bestehen aus älteren Daten, die für das Unternehmen weiterhin wichtig sind oder aus Gründen der späteren Bezugnahme oder der Einhaltung von Vorschriften aufbewahrt werden müssen. Datenarchive sind indiziert und verfügen über Suchfunktionen, so dass Dateien gefunden und abgerufen werden können.

Archivierte Daten werden auf einer kostengünstigeren Speicherebene (Storage Tier) gespeichert, was den Verbrauch von Primärspeicher und die damit verbundenen Kosten reduziert. Ein wichtiger Aspekt der Datenarchivierungsstrategie eines Unternehmens ist die Bestandsaufnahme der Daten und die Ermittlung der Daten, die für eine Archivierung in Frage kommen.

Einige Archivsysteme behandeln Archivdaten als schreibgeschützt, um sie vor Änderungen zu schützen, während andere Datenarchivierungsprodukte sowohl Schreib- als auch Lesezugriffe ermöglichen. Die WORM-Technologie (Write Once Read Many) beispielsweise verwendet Medien, die nicht wiederbeschreibbar sind.

Die Datenarchivierung eignet sich am besten für Daten, die aufgrund betrieblicher oder gesetzlicher Vorschriften aufbewahrt werden müssen, wie zum Beispiel Dokumentdateien, E-Mail-Nachrichten und möglicherweise alte Datenbankeinträge.

Vorteile der Datenarchivierung

Der größte Vorteil der Datenarchivierung besteht darin, dass sie die Kosten für die Primärspeicherung reduziert. Primärspeicher ist in der Regel teuer, da ein Speicher-Array ein ausreichendes Maß an IOPS erzeugen muss, um die betrieblichen Anforderungen an die Lese-/Schreibaktivitäten der Benutzer zu erfüllen. Im Gegensatz dazu sind die Kosten für Archivspeicher geringer, da sie in der Regel auf einem Speichermedium mit geringer Leistung und hoher Kapazität basieren. Datenarchive können auf kostengünstigen Festplattenlaufwerken (HDDs), Bändern oder optischen Speicherngespeichert werden, die im Allgemeinen langsamer sind als Hochleistungsfestplatten oder Flash-Laufwerke.

Die Archivspeicherung verringert auch das Datenvolumen, das gesichert werden muss. Das Entfernen von Daten, auf die nur selten zugegriffen wird, aus dem Backup-Datensatz verbessert die Backup- und Wiederherstellungsleistung. In der Regel führen Unternehmen eine Datendeduplizierung für Daten durch, die auf eine niedrigere Speicherebene verschoben werden, wodurch sich der Gesamtspeicherbedarf verringert und die Kosten für Sekundärspeicher sinken.

Datenarchivierung vs. Backup

Datenarchive sind nicht zu verwechseln mit Datensicherungen, bei denen es sich um Kopien von Daten handelt. Obwohl beide als Sekundärspeicher gelten und ein leistungsschwächeres Speichermedium mit höherer Kapazität als Primärspeicher verwenden, dienen sie unterschiedlichen Zwecken. Archive dienen der Datenaufbewahrung, während Backups für den Datenschutz und das Disaster Recovery verwendet werden.

Datenarchive können als Datenspeicher für Daten betrachtet werden, auf die nur selten zugegriffen wird, die aber dennoch leicht verfügbar sind. Backups hingegen sind Teil eines Datenwiederherstellungsmechanismus, mit dem Daten wiederhergestellt werden können, wenn sie beschädigt oder zerstört wurden. Backup-Daten bestehen oft aus wichtigen Informationen, die bei Verlust oder Löschung schnell wiederhergestellt werden müssen.

Online- vs. Offline-Datenspeicherung

Datenarchive gibt es in verschiedenen Formen. Einige Systeme nutzen die Online-Datenspeicherung, bei der die Archivdaten auf Plattensystemen abgelegt werden, wo sie leicht zugänglich sind. Archive können dateibasiert oder objektspeicherbasiert sein.

Andere Archivierungssysteme verwenden eine Offline-Datenspeicherung, bei der die Archivdaten mit Hilfe von Datenarchivierungssoftware auf Bänder oder andere Wechselmedien geschrieben werden, anstatt sie online zu halten. Da Bänder entnommen werden können, verbrauchen bandbasierte Archive weit weniger Strom als Plattensysteme. Dies führt zu geringeren Kosten für die Archivierung.

Cloud-Speicher ist ein weiteres mögliches Archivierungsziel. Amazon Glacier zum Beispiel ist für die Datenarchivierung konzipiert. Diese Methode ist kostengünstig, erfordert aber eine laufende Investition. Außerdem können die Kosten im Laufe der Zeit steigen, wenn mehr Daten im Cloud Storage gespeichert werden. Cloud-Anbieter speichern archivierte Daten normalerweise auf Bändern oder Festplatten.

Datenarchivierung und Datenlebenszyklusmanagement

Der Archivierungsprozess wird fast immer mit Hilfe von Archivierungssoftware automatisiert. Die Funktionen dieser Software variieren von Anbieter zu Anbieter, aber die meisten Archivierungssoftware verschiebt alternde Daten automatisch in die Archive gemäß einer vom Speicheradministrator festgelegten Datenarchivierungsrichtlinie. Diese Richtlinie kann auch spezifische Aufbewahrungsanforderungen für die einzelnen Datentypen enthalten.

Manche Archivierungssoftware löscht Daten automatisch aus den Archiven, sobald sie die in der Datenaufbewahrungsrichtlinie des Unternehmens vorgeschriebene Lebensdauer überschritten haben. Viele Sicherungssoftware- und Datenverwaltungsplattformen haben ihren Produkten Archivierungsfunktionen hinzugefügt. Dies kann eine kostengünstige und effiziente Methode zur Archivierung von Daten sein. Allerdings bieten diese Produkte möglicherweise nicht alle Funktionen, die in einer speziellen Archivierungssoftware enthalten sind.

Archivierung zur Einhaltung gesetzlicher Vorschriften

Einige Unternehmen sind verpflichtet, Daten über einen bestimmten Zeitraum aufzubewahren, um gesetzliche Vorschriften einzuhalten. Unabhängig davon, ob es sich um branchenspezifische Vorschriften oder staatliche Gesetze handelt, ist die Einhaltung von Compliance-Richtlinien ein weit verbreitetes Unternehmensanliegen. Verstöße gegen die Vorschriften können zu Schadensersatzzahlungen, Bußgeldern und ungültigen Verträgen führen.

Die Datenarchivierung hilft Unternehmen bei der Einhaltung von Vorschriften, indem sie Daten langfristig speichert und für den Fall einer Prüfung konsolidiert und damit leicht zugänglich macht. Die Vorschriften, die vorgeben, wie lange Daten aufbewahrt werden müssen, wo sie gespeichert werden dürfen und wer Zugang zu ihnen hat, variieren je nach Branche und der Art der Daten, die die Unternehmen in dieser Branche erzeugen.

Einige Beispiele für Vorschriften, die Unternehmen einhalten müssen, sind der Sarbanes-Oxley Act, der Health Insurance Portability and Accountability Act und die Europäische DSGVO.

Diese Definition wurde zuletzt im Dezember 2023 aktualisiert

Erfahren Sie mehr über Backup-Lösungen und Tools