Definition

Replikation

Unter Datenreplikation oder auch Replikation versteht man das Kopieren von Daten von einem Ort zum anderen. Diese Technologie hilft einer Organisation, im Falle einer Katastrophe über aktuelle Kopien ihrer Daten zu verfügen.

Die Replikation kann über ein SAN, ein lokales Netzwerk (LAN) oder ein WAN sowie in der Cloud erfolgen. Zu Zwecken des Disaster Recoverys (DR) erfolgt die Replikation in der Regel zwischen einem primären Speicherort und einem sekundären Offsite-Speicherort.

Ansätze für die Datenreplikation

Es gibt vier Orte, an denen die Replikation stattfinden kann: im Host, im Hypervisor, im Speicher-Array oder im Netzwerk. Die Array-basierte Replikation war früher die vorherrschende Methode, aber die anderen haben an Popularität gewonnen.

Bei der Host-basierten Replikation werden Daten mithilfe von Software auf Anwendungsservern von einem Standort zum anderen kopiert. Sie ist in der Regel dateibasiert und asynchron. Die Host-basierte Replikationssoftware umfasst Funktionen wie Deduplizierung, Komprimierung, Verschlüsselung und Drosselung.

Die Hypervisor-basierte Replikation ist eine Art der Host-basierten Replikation, bei der ganze virtuelle Maschinen von einem Host-Server oder Host-Cluster zu einem anderen repliziert werden. Da die Hypervisor-Replikation speziell für VMs entwickelt wurde, ist ein Failover auf das Replikat leicht möglich, wenn die primäre Kopie der VM verloren geht. Und sie kann auf Servern ausgeführt werden, die Replikation nicht von Haus aus unterstützen. Jede Host-basierte Replikation verbraucht CPU-Ressourcen, was die Serverleistung beeinträchtigen kann.

Die Array-basierte Replikation ermöglicht kompatiblen Speicher-Arrays die Verwendung integrierter Software zum automatischen Kopieren von Daten zwischen Arrays. Die Array-basierte Replikation ist stabiler und erfordert bei der Bereitstellung nur wenig abteilungsübergreifende Koordination. Sie ist jedoch auf homogene Speicherumgebungen beschränkt, da sie ähnliche Quell- und Ziel-Arrays erfordert.

Die netzwerkbasierte Replikation erfordert einen zusätzlichen Switch oder eine Appliance zwischen Speicher-Arrays und Servern. Die netzwerkbasierte Replikation findet in der Regel in heterogenen Speicherumgebungen statt - sie funktioniert mit jedem Array und unterstützt jede Host-Plattform. Im Vergleich zu Array- und Host-basierten Angeboten gibt es weniger netzwerkbasierte Replikationsprodukte auf dem Markt.

Synchrone vs. asynchrone Datenreplikation

Die Datenreplikation kann synchron oder asynchron sein, je nachdem, wann sie stattfindet.

Die synchrone Replikation findet in Echtzeit statt und wird bevorzugt für Anwendungen eingesetzt, die eine kurze Wiederherstellungszeit benötigen und bei denen keine Daten verloren gehen dürfen. Sie wird vor allem bei High-End-Transaktionsanwendungen eingesetzt, die im Falle eines Ausfalls ein sofortiges Failover erfordern. Dieser Replikationsansatz ist teurer und verursacht Latenzzeiten, die die primäre Anwendung verlangsamen.

Die synchrone Replikation wird von Array-basierten und den meisten netzwerkbasierten Replikationsprodukten unterstützt, aber nur selten von Host-basierten Produkten.

Asynchrone Replikation ist zeitverzögert. Sie ist für die Arbeit über Entfernungen hinweg konzipiert und erfordert weniger Bandbreite.

Diese Replikation ist für Unternehmen gedacht, die längere Wiederherstellungszeiträume verkraften können. Da die Kopierzeit verzögert ist, sind die beiden Datenkopien nicht immer identisch. Asynchrone Replikation wird von Array-, Netzwerk- und Host-basierten Replikationsprodukten unterstützt.

Datenreplikation mit anderen Technologien

Die Datenreplikation ist eine Schlüsseltechnologie für das Disaster Recovery. Sie wird häufig mit der Snapshot-Technologie kombiniert, die es den Benutzern ermöglicht, Daten regelmäßig zu replizieren und gleichzeitig für die Wiederherstellung zu einem bestimmten Zeitpunkt zurückgehen zu können. Auch die Deduplizierung, mit der redundante Daten eliminiert werden, wird häufig mit der Replikation für DR und Backup kombiniert. Deduplizierung unterstützt die Replikation, da weniger Daten über das Netzwerk übertragen werden müssen.

Ein Unternehmen sollte seine Replikation testen, um sicherzustellen, dass genügend Bandbreite vorhanden ist und die richtigen Daten kopiert werden. Administratoren müssen auch sicherstellen, dass die verfügbare Infrastruktur Daten schnell genug replizieren kann, um mit dem Datenwachstum und der Datenänderungsrate Schritt zu halten.

Ein Backup-Administrator muss das Volumen der zu replizierenden Daten berücksichtigen, insbesondere wenn das Unternehmen die Replikation in ein entferntes Rechenzentrum durchführt. Die Synchronisierung großer Datenmengen über eine langsame Verbindung ist möglicherweise nicht praktikabel. Seeding - das Kopieren von Daten auf Wechselmedien und dann auf das Zielgerät - ist möglicherweise die bessere Option.

Weitere Verfahrensarten sind die remote Replikation, bei der Daten an einen weit entfernten Standort repliziert werden (asynchron) und die Datenbankreplikation bei der die strukturierten Daten entweder mit einer anderen Datenbank zusammengelegt oder in eine andere Version eingespeist werden.

Diese Definition wurde zuletzt im Mai 2022 aktualisiert

Erfahren Sie mehr über Backup-Lösungen und Tools