copyright Christos Georghiou www
Warum Deduplizierungsraten eine Rolle fürs Backup spielen
Die Deduplizierungsrate war ein wichtiger Faktor im Wettbewerbsgerangel der Anbieter. Warum und wie sich die Gewichtung verändert hat, erklären wir in diesem Tipp.
Vor längerer Zeit gab es eine Art Wettbewerbsgerangel am Markt für Deduplizierung. Die Anbieter konkurrierten heftig, um eine möglichst hohe Deduplizierungsrate zu erreichen. So wie ein Anbieter für ein Verhältnis von 20:1 werben würde, würde ein anderer eine Pressemitteilung herausgeben, in der er angibt, dass er ein Verhältnis von 50:1 erreicht hat.
Diese Zahlen sind heute kaum noch zu berücksichtigen. Für alle praktischen Zwecke sind die vom Hersteller beworbenen Deduplizierungsraten aus zwei Hauptgründen bedeutungslos geworden:
- Wenn ein Anbieter angibt, dass er ein Deduplizierungsverhältnis von 50:1 erreichen kann, zeigt diese Zahl eine Bestfallsituation an. In der realen Welt sind die Deduplizierungsraten oft viel niedriger als das, was Anbieter als möglich propagieren. Denken Sie daran, dass die Deduplizierung durch das Entfernen redundanter Daten funktioniert. Wenn keine redundanten Daten vorhanden sind, ist eine Deduplizierung unmöglich. Einige Arten von Daten sind bereits komprimiert und enthalten daher nur sehr wenig Redundanz. Dies gilt insbesondere für Mediendateien wie MPEG-Videos oder JPEG-Bilder.
- Mit steigendem Verhältnis führt der Prozess der Datendeduplizierung zu sinkenden Renditen. Wenn Sie beispielsweise ein TByte an Daten deduplizieren, eliminiert ein 2:1-Deduplizierungsverhältnis (das sehr niedrig ist) die Hälfte der Daten (512 GB). Bis Sie ein Verhältnis von 20:1 erreichen, sind 95 Prozent der Daten eliminiert und das gesamte TByte an Daten somit auf nur 51,2 GByte reduziert worden. Wenn Sie das Deduplizierungsverhältnis auf 25:1 erhöhen, gibt es nicht viel mehr Daten, die eliminiert werden können, da der Großteil der Redundanz entfernt wurde. Der Wechsel von einem Verhältnis von 20:1 zu 25:1 reduziert die Daten nur um weitere ein Prozent und das Datenvolumen um ca. 10 GByte, was im Vergleich zu den ursprünglichen ein TByte an Daten unbedeutend ist. Die Datenreduktionen werden mit zunehmender Größe der Deduplizierungsraten immer unbedeutender.