Sergey Nivens - Fotolia

Inline- und Post-Process-Deduplizierung im Vergleich

Eignet sich Inline- oder Post-Processing-Deduplizierung besser als Datenschutzplattform? Es gibt mehrere Produkte auf dem Markt, die diese Möglichkeiten bieten. Wir vergleichen.

Ein Großteil der frühen Diskussionen zu Daten-Deduplizierung konzentrierte sich bereits auf die Inline-Deduplizierung vs. Post-Processing-Deduplizierung. Die Inline-Deduplizierung reduziert redundante Daten, bevor oder während sie an das Storage-System gesendet werden; bei Post-Process-Dedup werden die Daten zuerst gesichert und dann reduziert.

Deduplizierung ist eine effektive Möglichkeit, Speicherplatz zu sparen, indem redundante Daten eliminiert werden. Während die Deduplizierung typischerweise entweder als Postprozess oder Inline kategorisiert wird, gibt es auch hybride Ansätze.

Vor- und Nachteile

Sowohl Inline- als auch Postprozess-Dedupe Methoden haben ihre Vor- und Nachteile.

Die Post-Process-Deduplizierung sichert Daten schneller und reduziert das Sicherungsfenster, benötigt aber mehr Speicherplatz, da die Daten zur Beschleunigung des Prozesses zwischengespeichert werden.

Für die Inline-Deduplizierung wird kein temporärer Speicherplatz benötigt. Die Inline-Deduplizierung ist eine beliebte Option für die Datensicherung auf Flash-Arrays, da sie die Menge der auf Laufwerke geschriebenen Daten reduziert und den Verschleiß der Laufwerke reduziert.

Inline- und Post-Process-Deduplizierung im visuellen Vergleich.
Abbildung 1: Inline- und Post-Process-Deduplizierung im visuellen Vergleich.

Die Inline-Deduplizierung kann jedoch während des Datensicherungsprozesses zu einem Performance-Problem führen, da diese Datenreduktion zwischen Servern und Backup-Systemen stattfindet.

Gängige Deduplizierungs-Produkte

Zu den Inline-Deduplizierungsprodukten gehören Dell EMCs Data Domain und Avamar, IBM Spectrum Virtualize, Veritas NetBackup, NEC HYDRAstor und Quantum DXi. Post-Process-Produkte kommen beispielsweise von ExaGrid. FalconStor und Hitachi Vantara bieten ihren Kunden die Wahl zwischen Postprozess oder Inline-Dedup.

FalconStor hat auch eine Methode namens Concurrent Processing, da es, während es Daten zuerst in einen Disk Staging Bereich verschiebt, nicht auf das Ende der Backups wartet, bevor es dedupliziert.

Deduplizierung in Verbindung mit anderen Technologien

Sowohl Inline-Deduplizierungs- als auch Post-Process-Methoden haben ihre Vorzüge, aber Experten sagen, dass keines von beiden universell besser für die Datensicherung ist – es hängt alles davon ab, welche Art von Backup-Umgebung zum Einsatz kommt. Sie können auch andere Techniken und Technologien für einen optimalen Datenschutz einsetzen.

Deduplizierung wird oft mit Replizierung für Disaster Recovery kombiniert. Während die Deduplizierung die Menge an doppelten Daten reduziert und den Bandbreitenbedarf für das Kopieren von Daten außerhalb des Standorts senkt, kopiert die Replizierung Daten von einem Standort zum anderen und liefert im Katastrophenfall aktuelle Informationen. Dell EMC, Quantum, IBM, FalconStor und Hitachi gehören zu den Anbietern, die ihre Replikationsfähigkeiten verbessert haben, wodurch sich die Anzahl der entfernten Standorte, die auf das Rechenzentrum zugreifen können, oft erhöht hat.

Darüber hinaus können Erasure Coding, Komprimierung und Deduplizierung bei der Datensicherung und der Erhaltung der Speicherkapazität zusammenwirken, weisen aber deutliche Unterschiede auf. Erasure Coding ermöglicht es, Daten, die beschädigt werden, durch Informationen über diese Daten, die an anderer Stelle gespeichert sind, zu rekonstruieren. Die Komprimierung reduziert die Anzahl der Bits, die zur Darstellung von Daten benötigt werden.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Dedup und Komprimierung: Welchen Einfluss haben sie auf die Performance

Gute Kombi: Inline-Deduplizierung und hyperkonvergente IT

Wann Daten-Deduplizierung nicht notwendig ist

Erfahren Sie mehr über Storage Management