Datenreplikation: Asynchron oder synchron?
Damit die Daten auf Quell- und Zielsystemen identisch sind, muss die richtige Replikationssoftware implementiert sein.
Das Bereitstellen von kritischen Daten auf Reservesystemen durch Datenreplikation ist heute überall anzutreffen. Replikationstechniken sorgen für Datenschutz und Hochverfügbarkeit beim Austausch von Informationen mit Cloud-Services ebenso wie bei der Spiegelung von Images einer virtuellen Maschine. Vor allem in einer zunehmenden virtualisierten IT-Umgebung sind Replikationswerkzeuge etablierte Verfahren für die agile Datenübertragung und den Schutz der Daten. Einziger Wermutstropfen: Die Wahl der besten Replikationstechnik kann schwierig sein.
Replikationsangebote sind in der Regel in Kategorien eingeteilt, die unterschiedliche Vorteile und Nutzen je nach Anwendungsfall und abhängig von der IT-Umgebung bieten. Ein wichtiges Unterscheidungskriterium betrifft die synchrone oder asynchrone Datenreplikation. Was sind die Vor- und Nachteile dieser beiden Verfahren?
Die asynchrone Datenspiegelung ist weit verbreitet und findet sich am häufigsten bei Array-, Netzwerk- und Host-basierten Replikations-Tools. Das Verfahren ist eng am Quellsystem orientiert, puffert die gerade geschriebenen Daten oder bereitet den folgenden Transfer zeitgesteuert auf das Zielsystem vor. Nachteil: Eine Echtzeitdatenübertragung ist nicht gegeben, da die Daten immer mit Verzögerung am Zielmedium ankommen. Abhängig von der Netzwerklatenz und der zur Verfügung stehenden Bandbreite eignet sich der asynchrone Übertragungsmodus besonders für weit auseinanderliegende Quell- und Zielsysteme. In der Regel sind dies mehr als 300 km, die zwischen den Standorten liegen. Das bedeutet auch, dass das sekundäre Storage-System im Falle eines Systemausfalls am Primärstandort nicht zu 100 Prozent die aktuellen Daten aufweisen könnte. Fiel das Array während des Replikationsvorgangs aus, so ist die Wahrscheinlichkeit hoch, dass es zu Datenverlust kommt. meist sollte dieser aber kaum ins Gewicht fallen, da die Replikationsintervalle oft kurz sind, beziehungsweise die Replikation erfolgt, wenn Daten verändert wurden.
Nicht alle asynchronen Replikationsimplementierungen sind gleich. Ein Unterscheidungsmerkmal ist der Umgang bei Netzausfällen, vor allem wenn es um Recovery-Vorgänge geht. Ein weiteres Thema ist das Replizieren zur Beibehaltung der Systemkonsistenz. Das erfordert die Herstellung crash-konsistenter und lauffähiger Datenduplikate, auch mit den Applikationen und unter dem Betriebssystem des Zielsystems. Zum Beispiel enthalten die Replikationslösungen "Global Mirror" (Tivoli) für die IBM System Storage DS8000 und der "Universal Replicator " von Hitachi Data Systems Vorkehrungen, die die Reihenfolge der Schreibvorgänge auf dem Quellsystem festhält.
Anwender, die effizient replizieren wollen, können zudem Datendeuplizierungstechnologien am Zweitstandort einsetzen. Mit Deduplizierung und Komprimierung können Redundanzen vermieden und der Speicherplatz optimiert genutzt werden.
Synchrone Replikation für den Highend-Bereich
Bei einer Host-basierten Replikationssoftware ist die synchrone Datenspiegelung seltener anzutreffen. Generell ist die synchrone Replikation das Markenzeichen von Highend-Block-basierten Speicher-Arrays und den meisten Netzwerk-basierten Replikationsprodukten. Dazu zählen beispielsweise die IBM System Storage SAN Volume Controller (SVC) oder die 3PAR Remote Copy-Software von HPE. Bei der synchronen Spiegelung müssen die Schreibvorgänge auf dem Quell- und dem Zielsystem abgeschlossen sein, bevor ein neuer Schreibvorgang auf dem Ausgangsrechner beginnt. Der Vorteil dabei ist, dass die beiden Datenblöcke jederzeit vollständig synchronisiert sind. Ein zuverlässiges Netzwerk und niedrige Latenzzeiten sind die Voraussetzung. Die Übertragungsreichweite ist begrenzt und liegt zwischen 50 Kilometer und 300 Kilometer, abhängig von den Gerätespezifikationen der Array-Anbieter.
Das wichtigste Einsatzfeld liegt im Bereich der Highend-Transaktions-Anwendungen, die ein sofortiges Failover verlangen, wenn beispielsweise das Primärsystem ausfällt. Weniger Bedeutung hat die synchrone Spiegelung im Bereich des Network-Attached Storage (NAS), es sei denn das NAS dient auch als Block-basierter Speicher für High-End-Transaktions-Anwendungen. Eine reine NAS-Umgebung, wie die von BlueArc unterstützte Hitachi NAS Platform, führt in der Regel keine synchronen Replikationen aus.
Eine Ausnahme ist die Archivierungslösung NetApp Filer. Das Storage-System unterstützt NAS und Block-basierte Protokolle, insbesondere Fibre Channel (FC) und enthält Funktionen für die synchrone Replikation. Damit können NetApp-Arrays mit den High-End-Block-basierten Storage-Systemen von EMC, Hitachi Data Systems und IBM konkurrieren.
Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!