kubais - stock.adobe.com
So wählen Sie zwischen Cloud- und Bandspeicher als Archiv
Bänder bieten Vorteile wie Air Gaps, die Archive vor Bedrohungen schützen können. Aber welche Möglichkeiten bietet die Cloud für die traditionellen Anwendungsfälle von Bändern?
Das Band spielt in Unternehmen nach wie vor eine Rolle, und zwar nicht nur, weil es eine bewährte Technologie für Backup und Archivierung ist. Das Band hat Eigenschaften, die es von anderen Medien abheben. Das gilt auch dann noch, obwohl immer mehr Unternehmen ihre Daten in die Cloud verlagern.
Magnetbänder gibt es bereits seit den 1950er Jahren, doch sie sind immer noch eine Schlüsselkomponente für die Datensicherung und -wiederherstellung sowie die Archivierung. Dies sind Anwendungen, bei denen der Offline-Speicher eher ein Vorteil als ein Nachteil ist.
Das Band eignet sich hervorragend für die Offsite-Sicherung, da das Medium selbst leicht und beim Transport robuster ist als eine Festplatte. Die Funktionsweise von Bändern, bei der die Daten vom Schreib-/Lesemechanismus getrennt sind, schafft ein natürliches Air Gap.
Dieses Air Gap ist ein Grund dafür, dass Bänder bei Speicher- und Disaster-Recovery-Anwendern weiterhin beliebt sind. Ein vollständig getrennter Datenspeicher ist widerstandsfähig gegen Probleme, die durch Codefehler oder andere Probleme mit Produktionsanwendungen verursacht werden.
Zunehmend greifen Unternehmen auch deshalb auf Bänder zurück, weil sie einen relativ hohen Schutz gegen Ransomware bieten.
Online- oder Nearline-Systeme sind für die gleiche Malware anfällig, die auch die Kernsysteme der Produktion angreift. Wenn der Bandspeicher gut verwaltet wird, sollte sie eine Kreuzinfektion durch Ransomware-Nutzdaten verhindern.
Kostenvorteil
Auch die Kosten sind ein Vorteil für Bandspeicher. Die Preise für Festplatten und Solid-State-Speicher sinken weiter, und die Kapazitäten haben inzwischen 16 TB pro Platte erreicht. Bei der Bandspeicherung gibt es jedoch keine theoretische Grenze, solange der Benutzer über ein robustes System für die Verwaltung und Lagerung der Kassetten verfügt. Die meisten Unternehmen verwenden heute LTO-basierte Bänder.
Und obwohl die Anschaffung von Bandsystemen nach wie vor relativ teuer ist - ein Problem vor allem für kleinere Unternehmen - sind die zusätzlichen Kosten für die Erweiterung der Kapazität weitaus geringer als bei einem festplattenbasierten Array. Ein LTO-8-Band der neuesten Generation speichert 12 TB, was mit Komprimierung auf 30 TB ansteigt. Derzeit belaufen sich diese Kosten auf etwa 0,4 Cents pro Gigabyte.
Die Medienkosten sind gering, sobald das Unternehmen die Hardware für das Bandlaufwerk gekauft hat. Die Betriebskosten sind ein weiterer Faktor, der für das Band spricht. Disk- und Flash-basierte Systeme benötigen Strom und Kühlung. Bänder halten in einer klimatisierten und feuchten Umgebung länger, können aber auch in einem Büro gelagert werden.
Aufgrund dieser niedrigen Kosten für die Lebensdauer eignen sich Bänder für die langfristige Datenspeicherung und -archivierung in einer Reihe von Branchen, darunter Finanzdienstleistungen, Öl und Gas, Forschung und Medien. Dennoch setzen immer mehr Branchen auch auf die Cloud für die Archivierung.
Nachteile von Bändern
Bänder haben jedoch auch Nachteile, die CIOs dazu veranlassen, sich nach Alternativen umzusehen. Wie IDC-Forschungsdirektor Phil Goodwin betont, ist die Bandsicherung ein weitgehend manueller Prozess. „Das Be- und Entladen hängt von manuellen Eingriffen ab, und Bänder können verloren gehen, kaputt gehen oder sich abnutzen“, gibt er zu bedenken. Zwar haben die Anbieter automatisierte Bandbibliotheken entwickelt, doch diese sind teuer und zudem ebenso mechanisch.
Die Automatisierung verwandelt das Band in ein Nearline-Speichersystem. Dies eignet sich für Anwendungen, bei denen Unternehmen Daten über lange Zeiträume aufbewahren und nur gelegentlich darauf zugreifen müssen, oder bei denen große Mengen zusammenhängender Informationen gespeichert werden müssen, wie zum Beispiel Videodateien in der Rundfunkbranche oder wissenschaftliche Forschungsdaten. Die Daten des Large Hadron Collider des CERN werden beispielsweise auf Band gespeichert. Aber auch Bandbibliotheksysteme müssen manuell verwaltet werden.
Außerdem sind Bänder langsam. Die Lesegeschwindigkeit auf LTO-8-Bändern liegt bei respektablen 360 MB/s für unkomprimierte Daten. Das ist vergleichbar mit einer Festplatte mit 7.200 Umdrehungen pro Minute, aber weit langsamer als Flash-basierte Speicher. Diese Geschwindigkeiten enthalten jedoch nicht die Zeitverluste, die durch das Wechseln oder Laden der Kassetten selbst entstehen.
Obwohl LTO-8-Bänder für einmaliges Schreiben und mehrfaches Lesen (WORM) für die Archivierung konfiguriert werden können, was für die Einhaltung von Vorschriften und den Datenschutz von entscheidender Bedeutung ist, könnten Unternehmen feststellen, dass Bänder für Backup und Recovery zu langsam sind.
Bandgestützte Systeme haben trotz aller Vorteile Schwierigkeiten, die immer strengeren Zielvorgaben für die Wiederherstellungszeit (Recovery Time Objective, RTO) zu erfüllen. Systeme wie Bandbibliotheken ermöglichen zwar eine effektive Wiederherstellungszeit für archivierte Daten, aber die Wiederherstellung eines ganzen Unternehmenssystems von Band bedeutet wahrscheinlich, dass das Unternehmen zu lange offline ist.
„Anwendungsfälle für Bänder, wie Disaster Recovery mit Wiederherstellung von bandbasierten Backups, bieten einfach nicht das Leistungsniveau, das viele Unternehmen im Jahr 2019 benötigen“, warnt Barnaby Mote, CEO bei 4sl. „Was vor zehn Jahren gut genug war, ist heute einfach nicht mehr akzeptabel, wenn die Wiederherstellung von festplattenbasierten Daten – sei es vor Ort oder in der Cloud – ohne weiteres möglich ist.“
Um die Lücke zu schließen, müssen Unternehmen gestaffelte (tiered) Systeme verwenden - Kombinationen aus Flash, Online- und Nearline-Platten sowie Bändern – oder ganz andere Ansätze für das Disaster Recovery in Betracht ziehen. Dazu gehören die Spiegelung von Daten oder die synchrone Replikation zwischen primären und sekundären Speichersystemen und immer häufiger auch die Sicherung und Wiederherstellung in der Cloud.
Ist die Cloud der goldene Mittelweg?
Cloud-basierter Speicher scheint auf den ersten Blick die offensichtliche Alternative zu Bändern zu sein. Und in gewisser Weise ist sie das auch.
Goodwin von IDC weist darauf hin, dass die wichtigsten Anbieter von Backup- und Recovery-Tools sowie Archivierungsanbieter, darunter Unternehmen wie Acronis und Commvault, inzwischen entweder ein Cloud-basiertes Angebot haben oder die Nutzung der Cloud als Ziel vorsehen. Ziel ist es, die Offsite-Sicherung in der Cloud für den Benutzer transparent zu machen.
Die großen Cloud-basierten Speicheranbieter haben auch ihre eigenen Archivierungsdienste und bieten diese zunehmend als Alternative zu Bändern an. Allerdings nutzen die CSPs in den meisten Fällen ebenso Bandtechnologie im Hintergrund, was zu längeren Latenzzeiten auch in der Cloud führen kann.
Amazon Web Services hat Glacier, und Microsoft bietet Azure Archive an. Google Cloud bietet Nearline- und Coldline-Speicher zu Preisen ab 1US-Cent/GB pro Monat für Nearline und 0,4 US-Cent/GB pro Monat für Coldline Deep Archive. IBM bietet sein Cloud Object Storage Archive an, das mit 0,2US-Cent/GB zu den günstigsten in der Branche gehört.
Aber nicht alle Backup-Produkte lassen sich direkt in den Cloud-Speicher integrieren, und nicht alle funktionieren auf dieselbe Weise, was zu Problemen bei der Anwendungskompatibilität und beim Betrieb führen kann. Datenmanager müssen sicherstellen, dass ihre Geschäftsanwendungen, Backup-Produkte oder -dienste und Cloud-Anbieter kompatibel sind und die richtigen Service-Level-Garantien bieten.
Cloud-Dienste haben aber auch andere Nachteile. Der erste sind, überraschenderweise, die Kosten.
Obwohl die Kosten pro Gigabyte niedrig sind, fallen für Cloud-basierten Speicher monatliche oder jährliche Gebühren an. Diese können sich schnell summieren. Hinzu kommen zusätzliche Bandbreiten-Gebühren für den Zugriff auf die Daten oder deren Wiederherstellung.
Obwohl es schwer ist, eine allgemeine Aussage über alle Unternehmen zu treffen, rechnet das Speicherberatungsunternehmen ProStorage vor, dass Cloud-Speicher im Allgemeinen für Unternehmen rentabel ist, die langfristig bis zu 50 TB speichern. Darüber hinaus begünstigen Größenvorteile die Bandspeicherung. Dies liegt an den Vorlaufkosten für Bandspeicherhardware und den laufenden Kosten für große Datenmengen in der Cloud.
Ein weiterer Faktor, bei dem es nicht nur um Kosten, sondern auch um praktische Aspekte geht, ist die Zeit, die für die Übertragung großer Datenmengen in die Cloud benötigt wird.
Die Geschwindigkeit des Daten-Uploads über das öffentliche Netz bleibt ein Hindernis. Kleinere oder neuere Unternehmen oder Unternehmen, die bereits Cloud-basierte Anwendungen nutzen, werden es einfacher finden, Backups oder Archive in die Cloud zu verschieben. Für Unternehmen mit großen Datenmengen vor Ort ist die schrittweise Einführung von Cloud-Speicher oder der Betrieb neben Nearline-Festplatten und -Bändern praktischer. In manchen Fällen muss die Entscheidung nicht unbedingt ein „entweder-oder“ bedeuten, sondern eine komplementäre Kombination aus Cloud- und Bandarchiven.
Storage Tiers in der Cloud-Ära
Storge Tiering kann in vier Kategorien unterteilt werden:
Tier 1: Flash- oder Solid-State-Speicher, der für die geschäftskritischsten Anwendungen verwendet wird.
Tier 2 und Tier 3: Die nächsten beiden Tiers beziehen sich im Allgemeinen auf schnelle und langsame Festplatten. Bevor Flash aufkam, boten schnell drehende Festplatten die schnellsten Zugriffszeiten und waren die bevorzugte Option für kritische Anwendungsfälle. Diese beiden festplattenbasierten Tiers sind online, was bedeutet, dass auf die Daten ohne nennenswerte Verzögerung zugegriffen werden kann.
Tier 4: Die unterste Ebene bezieht sich in der Regel auf ein Medium wie zum Beispiel ein Band, obwohl es auch andere gibt. Da Bänder Daten auf einem linearen Magnetstreifen speichern, gibt es eine inhärente Verzögerung beim Speichern und Abrufen von Informationen.
Führende Cloud-Anbieter bieten alle diese Optionen an, machen jedoch keine Angaben darüber, welche Hardware der kostengünstigsten und langsamsten Ebene zugrunde liegt.