Definition

Redundanz (redundant)

Datenredundanz bezeichnet die Praxis, Daten an zwei oder mehr Stellen in einer Datenbank oder einem Datenspeichersystem oder in mehreren geografisch entfernten Systemen zu speichern. Die Datenredundanz stellt sicher, dass ein Unternehmen seinen Betrieb oder seine Dienstleistungen fortsetzen kann, falls etwas mit den Daten passiert, zum Beispiel im Falle einer Datenbeschädigung oder eines Datenverlusts. Das Konzept gilt für Bereiche wie Datenbanken, Memory und Dateispeichersysteme.

Datenredundanz kann in einer Organisation absichtlich oder versehentlich auftreten. Bei absichtlicher Redundanz werden dieselben Daten an verschiedenen Orten aufbewahrt, wobei das Unternehmen bewusst darauf achtet, sie zu schützen und ihre Konsistenz zu gewährleisten. Diese Daten werden häufig für Backups oder Disaster Recovery verwendet.

Wenn sie versehentlich durchgeführt werden, können doppelte Daten zu Dateninkonsistenzen führen. Auch wenn die Datenredundanz dazu beitragen kann, das Risiko eines Datenverlusts zu minimieren, können Redundanzprobleme größere Datensätze betreffen. Daten, die an mehreren Orten gespeichert sind, nehmen beispielsweise wertvollen Speicherplatz in Anspruch und erschweren es dem Unternehmen, zu erkennen, auf welche Daten es zugreifen oder diese aktualisieren sollte.

Das Wort redundant kann auch als unabhängiger technischer Begriff für Folgendes verwendet werden:

  • Computer- oder Netzwerksystemkomponenten, die als Backup für primäre Ressourcen installiert werden, falls diese ausfallen.
  • Redundante Informationen, die nicht benötigt werden oder doppelt vorhanden sind.
  • Redundante Bits oder zusätzliche binäre Ziffern, die bei einer Datenübertragung erzeugt und verschoben werden, um sicherzustellen, dass während der Datenübertragung keine Bits verloren gehen.
  • Redundante Daten, die ein Speicher-Array im Falle eines Festplattenausfalls vor Datenverlust schützen.

Wie funktioniert die Datenredundanz?

Daten müssen an zwei oder mehr Stellen gespeichert werden, damit sie als redundant gelten. Wenn die primären Daten beschädigt werden oder die Festplatte, auf der sich die Daten befinden, ausfällt, bietet der zusätzliche Datensatz eine Ausfallsicherung, auf die das Unternehmen ausweichen kann.

Bei den redundanten Daten kann es sich entweder um eine vollständige Kopie der Originaldaten oder um ausgewählte Daten handeln. Die Aufbewahrung ausgewählter Daten ermöglicht es einem Unternehmen, verlorene oder beschädigte Daten zu rekonstruieren. Festplatten mit Datenkopien werden in einem Array gespeichert, so dass im Falle eines Schadens an den Originaldaten das Array mit geringer oder gar keiner Ausfallzeit einspringen kann. Darüber hinaus können Redundanzmaßnahmen durch Backups oder RAID-Systeme erreicht werden.

Vor- und Nachteile der Datenredundanz

 Die Datenredundanz hat je nach Umsetzung Vorteile oder Risiken. Zu den möglichen Vorteilen gehören folgende:

  • Sie trägt zum Schutz der Daten bei. Wenn auf Daten nicht zugegriffen werden kann, können redundante Daten dazu beitragen, fehlende Daten zu ersetzen oder wiederherzustellen.
  • Das Hosting mehrerer Speicherorte für dieselben Daten bedeutet, dass ein Datenverwaltungssystem etwaige Unterschiede auswerten kann, wodurch die Genauigkeit der Daten gewährleistet wird.
  • Schneller Zugriff. In einer Organisation, die sich über verschiedene physische Bereiche erstreckt, kann der Zugriff auf bestimmte Datenstandorte einfacher sein als auf andere. Eine Person innerhalb einer Organisation kann auf Daten aus redundanten Quellen zugreifen, um schneller auf dieselben Daten zugreifen zu können.

Zu den möglichen Nachteilen gehören jedoch die folgenden:

  • Vergrößerung der Datenbank. Es wird mehr Speicherplatz für eine redundante Kopie einer großen Datenmenge benötigt. Eine größere Datenbank kann auch zu längeren Ladezeiten führen oder Verwirrung stiften, wenn die Mitarbeiter nicht wissen, wo bestimmte Daten gespeichert sind.
  • Ein höherer Speicherbedarf bedeutet auch höhere Kosten, abgesehen von den zusätzlichen Gemeinkosten oder Ressourcen, die für die Pflege und Aktualisierung der redundanten Daten benötigt werden.
  • Die Speicherung von Daten an mehreren Orten kann zu Diskrepanzen führen, zum Beispiel zu fehlenden Datensätzen oder falschen Werten, wenn die Daten nicht ständig aktualisiert werden.
  • Die Speicherung mehrerer Kopien derselben Daten erhöht das Risiko einer Datenbeschädigung. Beschädigte Daten können durch Fehler beim Schreiben, Lesen, Speichern oder Verarbeiten von Daten entstehen.

Redundanz im Datenspeicher

Wenn es um die Nutzung von Speicher geht, kann Redundanz ein Schutz sein oder die Form von unerwünschtem Overhead annehmen. Datenvolumen enthalten oft redundante Speicherblöcke. Ein Deduplizierungsprozess kann diese redundanten Blöcke entfernen, um den Speicherverbrauch innerhalb der Daten zu reduzieren oder das Volumen der zu sichernden Daten zu minimieren.

Viele Unternehmen erstellen absichtlich redundante Kopien von Daten, um das Risiko eines Datenverlustes zu minimieren. Diese Redundanz kann in Form von gespiegelten virtuellen Maschinen (VMs), Speicher-Volumes oder einer externen, synchronisierten Datenkopie vorliegen.

Datenredundanz und Backup im Vergleich

Datenredundanz und Backups sollen beide Datenverluste verhindern, aber die Technologien unterscheiden sich leicht. Die Datenredundanz erfolgt häufig in Form einer synchronisierten Kopie der Unternehmensdaten. Ein Unternehmen kann zum Beispiel eine redundante VM oder ein redundantes Speicher-Volume erstellen.

Datenredundanz kann dazu beitragen, Serviceausfälle zu verhindern. Wenn zum Beispiel eine VM ausfällt, kann eine Replik-VM schnell online gebracht werden, um die Serviceunterbrechung zu minimieren.

Backups hingegen sind Kopien von Daten und anderen Ressourcen. Backups dienen speziell der Erstellung von Datenkopien für den Fall, dass ein Unternehmen einen Datenverlust erleidet, zum Beispiel durch fehlerhafte Software, Datenbeschädigung, Hardwarefehler, böswillige Hackerangriffe, Benutzerfehler oder andere unvorhergesehene Ereignisse. Während es bei der Redundanz darum geht, die Kontinuität der Dienste eines Unternehmens zu gewährleisten, geht es bei der Datensicherung eher darum, ein System in einen früheren Zustand zurückzubringen.

Es gibt jedoch Überschneidungen zwischen Redundanz und Backups. Backups und einige Datenredundanzprodukte bieten Point-in-Time-Wiederherstellungsfunktionen, aber Redundanzprodukte haben im Allgemeinen weniger Optionen für die Wiederherstellungspunkte. Backups sind auch eine gute Wahl für eine granulare Wiederherstellung, die es einem Unternehmen ermöglicht, mit einem einzigen Backup-Vorgang sowohl Dateien als auch Images wiederherzustellen. Im Gegensatz dazu sind redundante Systeme besser für Situationen geeignet, in denen das Unternehmen kritische Systeme online halten muss und keine lange Wiederherstellungszeit tolerieren kann.

Redundanz durch RAID

RAID ist eine der gängigsten Formen der Datenredundanz. RAID-Arrays sind so konzipiert, dass sie eine bessere Leistung und Zuverlässigkeit bieten, als dies mit einer einzelnen Festplatte möglich ist.

RAID bezieht sich auf verschiedene Speicherarchitekturen, die als RAID-Level bezeichnet werden. Nicht alle RAID-Level bieten Datenredundanz, die meisten jedoch schon. RAID 1 zum Beispiel spiegelt Festplatten, so dass eine exakte Kopie der Festplatte verwendet werden kann, wenn die primäre Kopie ausfällt.

Abbildung 1 zeigt Redundanz, die mit RAID 1 durch Spiegelung erreicht wird.
Abbildung 1 zeigt Redundanz, die mit RAID 1 durch Spiegelung erreicht wird.

RAID 5 bietet Redundanz durch die Verwendung von Parität. Die Daten werden über alle Festplatten im Array verteilt, so dass weniger Daten auf mehrere Festplatten verteilt werden. Jede Festplatte enthält außerdem Paritätsinformationen, die das Array im Falle eines Festplattenausfalls funktionsfähig halten können. Wenn eine ausgefallene Platte ersetzt wird, werden die Paritätsinformationen verwendet, um den Inhalt der ausgefallenen Platte auf der neuen Platte zu rekonstruieren.

Abbildung 2 zeigt, wie Parität in RAID 5 für Redundanz sorgt.
Abbildung 2 zeigt, wie Parität in RAID 5 für Redundanz sorgt.

Es gibt viele andere RAID-Level, die Daten durch Redundanz schützen. Parität und Spiegelung sind zwei der gängigsten Beispiele.

Alternativen zur Datenredundanz

Wenn sich ein Unternehmen nicht ausschließlich auf die Datenredundanz verlassen möchte, gibt es andere Alternativen für den Schutz oder die Wiederherstellung von Daten. So gibt es beispielsweise Backups, Continuous Data Protection(CDP), Snapshots und Image-basierte Backups.

  • Backups bringen ein System in einen früheren Zustand zurück. Ziel ist es, im Bedarfsfall eine schnelle und zuverlässige Datenwiederherstellung zu gewährleisten.
  • CDP schützt Daten auf einer nahezu kontinuierlichen Basis. Bei CDP-Produkten werden die Daten zunächst blockweise auf ein plattenbasiertes Backup repliziert. Die Software überwacht dann die Daten auf Änderungen an den gespeicherten Blöcken oder auf die Erstellung neuer Blöcke. Wenn ein Block erstellt oder geändert wird, wird er gesichert. Ein Index verfolgt die Versionsinformationen und die Datendeduplizierung stellt sicher, dass nur eindeutige Blöcke auf dem Sicherungsmedium gespeichert werden.
  • Snapshots erstellen niemals eine Kopie der Daten. Stattdessen erstellen sie ein Teilabbild einer VM, Datei oder Anwendung zu einem bestimmten Zeitpunkt. Snapshots ermöglichen es einem Unternehmen, Daten auf einen früheren Zeitpunkt zurückzusetzen, wenn etwas schiefläuft.
  • Image-basierte Backups sind ähnlich wie Snapshots, erfassen aber ein Image einer VM als Ganzes. Wenn ein Wiederherstellungsvorgang erforderlich ist, wird normalerweise eine Kopie der VM in einer Sandbox-Umgebung gemountet, damit die Daten extrahiert werden können.
Diese Definition wurde zuletzt im Februar 2022 aktualisiert

Erfahren Sie mehr über Software-defined Storage