So unterscheiden sich Archiv und Backup voneinander
Archivierung und Backup sind wichtige Schlüsselelemente der Data-Protection-Strategie. Sie können sich gegenseitig ersetzen, erfüllen aber spezifische, unterschiedliche Aufgaben.
Backups werden primär für die Wiederherstellung betrieblicher Abläufe benutzt, um zum Beispiel schnell eine überschriebene Datei oder eine korrumpierte Datenbank wiederherzustellen. Auf der anderen Seite speichern Archive in der Regel die Version einer Datei ab, die sich nicht weiter ändert oder nicht weiter ändern sollte.
Ein Backup ist nicht der gleiche Prozess wie der einer Archivierung. Beide können einander ergänzen, aber bei der Analyse von Archiv versus Backup kommt es darauf an, ihre Unterschiede festzuhalten, um später Probleme beim Recovery zu vermeiden.
Was ist ein Backup?
Ein Backup von Daten besteht aus einer Kopie an einem anderen Ort, um für ein Disaster Recovery im Fall von Datenverlust, Beschädigung, Fehlern oder Korrumpierung bereitzustehen. Ein Unternehmen benutzt ein Backup, um nach einem Störfall Daten wieder in einen früher kopierten Zustand herzustellen. Allgemeine Vorfälle, die ein Recovery aus einem Backup nötig machen, beruhen auf menschlichen Fehlern, Naturkatastrophen und Cyberangriffen.
Eines der Ziele von Backup ist ein schnelles Recovery. Für die meisten geschäftskritischen Daten sollte das Backup von einem Gerät aus gestartet werden, das das Unternehmen für ein schnelles Restore einsetzen kann, wie zum Beispiel eine Disk-basierte Appliance. Für eine Datenwiederherstellung, die über eine längere Recovery Time Objective verfügt, kann ein Unternehmen eher billigere Tapes oder Cloud-basierte Backups benutzen.
Abhängig von der Art des Unternehmens und der Daten können Backups täglich, stündlich oder sogar häufiger durchgeführt werden.
Was ist ein Archiv?
Archivierung ist der Prozess, bei dem Daten für eine langfristige Aufbewahrung an einen anderen Standort verschoben werden. Anders als bei einem Backup sind archivierte Daten keine Kopie, sondern vor allem nicht mehr aktive Daten, die ein Unternehmen aufbewahren muss. Zu den Gründen für Archivierung gehören gesetzliche Vorschriften und Compliance-Regeln. Je nach Unternehmen und Art der ursprünglichen Daten wird ein Archiv bestimmte Daten für mehrere Jahre aufbewahren. Archivierung kann einem Unternehmen auch Geld sparen, wenn die Daten von teureren primären Speichergeräten auf externe billige Systeme verschoben werden.
Geschwindigkeit ist im Gegensatz zu Backups bei Archiven weniger wichtig: Selbst wenn es sich um eine gesetzliche Anfrage handelt, hat man in der Regel ein paar Tage Zeit für eine Antwort. Such- und Indexfunktionen sind in Archiven besonders gefragt. Zusätzlich spielen die Skalierung der Datenintegrität und Data Retention über eine lange Zeitperiode, vielleicht sogar über Jahrzehnte hinweg eine wichtige Rolle.
Ein Archiv ist heute nicht länger auf traditionelle Dateien und Bilder begrenzt, sondern die meisten Datenbankanwendungen besitzen besondere Archivfunktionen, anhand derer die primäre Datenbank schlank und schnell bleibt, während das Archiv für Research- und Compliance-Aufgaben bereitsteht.
Anwendungen für E-Mail-Archivierung sind oft der Treiber für die Einrichtung eines separaten Archivprozesses. Man muss sich aber bewusst sein, dass man vor dem Gesetz verantwortlich ist, wenn man mehr als nur E-Mails abspeichert.
Während der Einsatz von Tape lange eines der bevorzugten Medien für Daten-Backup war, hat es in der letzten Zeit mehr Gewicht bei Archivierung gewonnen. Mit ihrer langen Lebenszeit, ihren hohen Kapazität und ihren niedrigen Speicherkosten können Tapes Daten sicher und mit minimalem Verwaltungsaufwand für viele Jahre aufbewahren.
Tapes werden von Natur aus offline abgelegt und sind damit sicher vor Cyberangriffen. Obwohl es länger als bei Festplatten dauert, Daten wieder von den Tapes herunterzuholen, müssen typische Archivanfragen nicht unmittelbar ausgeführt werden.
Tatsächlich kommt es sogar vor, dass ein Unternehmen niemals den Zugang zu seinen Daten im Archiv und zu ihrer Wiederherstellung braucht. Außerdem besitzen die jüngsten LTO-Tapes Indexierungfeatures und eine Fähigkeit namens „Write-once read-many“ (WORM), die dafür sorgt, dass archivierte Daten nicht überschrieben werden können.
Gerade als Festplatten eine populäre Ergänzung für den Backup-Prozess wurden, weil es Bedenken wegen der langen Wiederherstellungszeiten bei Tape gab, zeigte sich, dass Bandarchivierung Schwachstellen hatte. Es gibt in diesem Zusammenhang ein einfaches technisches Problem: Da Daten auf einem alten LTO-5-Tape wahrscheinlich nicht mehr kompatibel mit den jüngsten Tape-Drives sind, muss man dafür sorgen, dass man auch weiterhin die Daten in seinem Archiv lesen kann.
Festplatten sind eine langfristige Speicheroption, aber sie sind im Vergleich teuer. Unternehmen werden deshalb wahrscheinlich archivierte Daten für fünf bis zehn Jahre auf Disk speichern, aber nach dieser Zeit werden Tapes die bessere Wahl sein. Die Cloud ist ein weiteres potentielles Medium für archivierte Daten.
Größere Cloud-Provider einschließlich Amazon, Microsoft und Google bieten billigere Alternativen für diesen Datentyp an. Obwohl die Cloud zunächst billiger erscheint, kann sie teurer als interne Festplatten oder als Tapes werden – je nach Menge der Daten und Zeitdauer der Datenvorhaltung und/oder des Datentransfers in beide Richtungen.
Archiv versus Backup: Braucht man beides?
Wenn man überlegt, Archiv und Backup in einer einzigen Plattform zu verbinden, wird die Entscheidung von der spezifischen Plattform, den Anforderungen des Unternehmens an die Aufbewahrung und den jeweiligen Zielen des Archivierungs- gegenüber dem Backup-Prozesses abhängen.
Während Festplatten für eine solche Kombination geeigneter als Tapes erscheinen, besteht aufgrund von Erfahrungen wohl der beste Weg darin, ein spezifisches System für Archivierung einzurichten. Archive besitzen unterschiedliche Anforderungen an Aufbewahrung, Recovery und Suchfunktionen als Backups.
Das Backup von Daten ist im Allgemeinen gedacht für kurzfristigen Speicher und Recovery, während Archive für langfristigen Speicher und regulatorisch festgelegte Aufbewahrung sorgen sollen. Backups und Archive werden manchmal miteinander verwechselt, aber sie unterscheiden sich prinzipiell und sie bieten unterschiedliche Vorteile.
Seit Kurzem gibt es einen Trend hin zu einer Konvergenz von Backup und Archiv, weil Hersteller und Anwender die beiden Prozesse als komplementär betrachten. Und zwar in dem Sinne, dass der gleiche IT-Administrator sowohl Backups als auch die archivierten Daten managen könnte.
Manche Unternehmen verwenden bereits Backup-Software für einen Teil ihrer Archivierung oder für den gesamten Archivprozess, da Backup-Hersteller ihren Produkten Archivfeatures hinzugefügt haben. Verschiedene Architekturen für Archivierung und Backup aufrechtzuerhalten, kann teuer und zeitraubend werden, besonders für ein kleines Unternehmen, das nicht über viele Ressourcen verfügt.
Noch immer ist es besser, verschiedene Prozesse für den optimalen Datenschutz zu nutzen. Archivprodukte bieten mehr Funktionen und bessere Features für Archivdaten an – zum Beispiel Suche für Metadaten und E-Discovery –, als Backup-Software im allgemeinen zur Verfügung stellen kann. Und Backup-Medien besitzen Features, die besonders die kritischen Daten eines Unternehmens schützen.