Getty Images
Wie Datenreduktion SSDs effizient und preiswerter macht
Datenreduzierungstechniken waren bei SSDs schwer zu realisieren, aber die Hersteller machen Fortschritte. Je effektiver die Datenreduzierung ist, desto günstiger werden die SSDs.
Während die Datenreduzierung im Speicherbereich früher vor allem für Backups in Festplattensystemen genutzt wurde, setzen Hersteller diese Technologien jetzt auch in ihren Flash-basierten Systemen ein.
Die bessere Leistung von SSDs im Vergleich zu HDDs hat es möglich gemacht, Datenreduzierungstechniken auch in primären Speichersystemen einzusetzen, die geschäftskritische Anwendungen unterstützen. Die Anbieter haben auch ihre Datenreduzierungstechniken verbessert, um die Effizienz zu steigern und die Auswirkungen auf die Leistung zu minimieren.
Trotz dieser Vorteile können die Technologien zur Datenreduzierung bei SSDs in Bezug auf die Effektivität und den daraus resultierenden Leistungsabfall von einem Produkt zum anderen erheblich variieren. Bevor sie sich für ein Speicherprodukt entscheiden, sollten die Entscheidungsträger die Datenreduzierungsfähigkeiten eines Systems, ihre potenziellen Auswirkungen auf die Anwendungsleistung und die Einsparungen bei den Speicherkosten eines Unternehmens genau kennen.
Was Datenreduzierung umfasst: Damals und heute
Datenreduzierung ist ein weit gefasster Begriff und kann eine Vielzahl von Funktionen umfassen, aber im Allgemeinen konzentriert er sich auf zwei primäre Technologien: Komprimierung und Deduplizierung. Bei der Komprimierung werden redundante Daten auf Bit-Ebene entfernt, bei der Deduplizierung auf Block-Ebene.
Viele Jahre lang war die Datenreduzierung im Allgemeinen auf sekundäre Speicher beschränkt, die Backups und Archive unterstützen, wobei der Schwerpunkt auf der effektiven Ressourcennutzung und nicht auf der Anwendungsleistung lag.
IT-Teams zögerten bei der Implementierung von Komprimierung oder Deduplizierung auf ihren primären Speichersystemen wegen der möglichen Auswirkungen auf die Anwendungsleistung. Für viele Unternehmen galt dies auch dann noch, als sie für ihren Primärspeicher auf All-Flash-Arrays umstellten.
Probleme bei der SSD-Datenreduzierung
Datenreduzierungsvorgänge können sowohl Memory- als auch CPU-Ressourcen beanspruchen, I/O-Overhead hinzufügen, die Latenz erhöhen und die Gesamtleistung verringern. Selbst wenn Unternehmen die Datenreduzierung einsetzen wollten, führten sie möglicherweise Arbeitslasten aus, die nicht von diesen Technologien profitieren konnten, und jeder Versuch, sie zu nutzen, führte zu unnötigem Overhead. So konnte es beispielsweise sein, dass die Daten nur eine geringe Redundanz aufwiesen, so dass der Versuch, die Daten zu deduplizieren, wenig Nutzen brachte.
Einige Speichersysteme verfolgten bei der Datenreduzierung einen Alles-oder-Nichts-Ansatz, obwohl die ständige Aktivierung mehr schaden als nutzen konnte. Der Alles-oder-Nichts-Ansatz stellte Unternehmen vor Herausforderungen, die regionale Datenvorschriften einhalten mussten, die unter Umständen die Speicherung der Daten in ihrem ursprünglichen Format vorschreiben.
IT-Teams erkannten die Grenzen ihrer Produkte möglicherweise erst, als sie bereits mit der Produktion beschäftigt waren. Sie könnten zum Beispiel zu spät feststellen, dass ihre Speichersysteme keine verlustfreie Komprimierung unterstützen, die sich entwickelnden Skalierungsanforderungen nicht erfüllen oder die Datenreduzierung nicht global auf ein ganzes Array anwenden können.
Fortschrittliche SSD-Datenreduzierung und wie sie Unternehmen hilft
Mit der zunehmenden Verbreitung von All-Flash-Arrays im Rechenzentrum haben Datenreduzierungstechniken einen bedeutenden Einzug in Speicherumgebungen gehalten, in denen die Kosten pro Gigabyte nach wie vor an erster Stelle stehen, gefolgt von der Nachfrage an Leistung. Die Fortschritte bei SSDs haben jedoch zu einer neuen Generation von Geräten geführt, die außergewöhnliche IOPS und Latenzzeiten im Mikrosekundenbereich sowie eine Leistung bieten, die den Overhead bei der Datenreduzierung besser bewältigen kann.
Es sind nicht nur die Speichergeräte selbst, die optimiert wurden. SSDs, die PCIe 4.0 entsprechen, sind inzwischen weit verbreitet und bieten schnellere Datenübertragungsraten als noch vor einigen Jahren möglich waren. Darüber hinaus sind PCIe-5.0-Laufwerke auf dem Markt, und die PCIe-6.0-Spezifikation wurde 2022 veröffentlicht. Jede neue PCIe-Generation verdoppelt die Datenrate gegenüber der vorherigen Generation.
NVMe und NVMe-oF haben dazu beigetragen, hochleistungsfähige Speichersysteme bereitzustellen. Die NVM-Express-Organisation hat kürzlich die Revision 2.0c der NVMe-Basisspezifikation veröffentlicht, die eine effizientere Schnittstelle für niedrigere Latenzzeiten und einen höheren Durchsatz bietet. Zusammen mit PCIe trägt NVMe dazu bei, das volle Potenzial der SSD-Leistung zu maximieren, was zu Speichersystemen führt, die die Datenreduzierung besser unterstützen können.
Auch die Technologien zur Datenreduzierung selbst haben sich weiterentwickelt. Sie minimieren die Auswirkungen auf die Leistung und bieten eine effektivere Datenreduzierung. All-Flash-Arrays unterstützen in der Regel verlustfreie Komprimierung, Inline-Datenreduzierung und globale Datenreduzierung im gesamten Array oder Namespace. Die Anbieter haben die Datenreduzierung anpassungsfähiger gemacht und ihre Algorithmen verbessert, um eine intelligentere Reduzierung und bessere Leistung zu erzielen.
Datenreduktionsfunktionen in All-Flash-Arrays können die effektive Kapazität ihrer Speichersysteme erhöhen, Energie sparen und den Speicherplatzbedarf reduzieren. Die Datenreduzierung verringert die Anzahl der Programm-Löschzyklen (Program Erase Cycles, P/E-Zyklen), verlängert die Lebensdauer des Laufwerks und reduziert die Datenübertragungslast. Zusammen tragen diese Faktoren dazu bei, die Gesamtspeicherkosten zu senken und SSDs für mehr Arbeitslastenerschwinglich zu machen.
Obwohl SSD-Datenreduzierungsvorgänge immer noch die Leistung beeinträchtigen können, sind ihre Auswirkungen in der Regel minimal im Vergleich zu den von Unternehmenslaufwerken gebotenen Leistungsgewinnen. Für viele Arbeitslasten könnten die Einsparungen bei der Kapazität die Leistungseinbußen aufwiegen.
Beispiele von SSD-Anbietern und Produkten mit Datenreduzierung
SSD-Datenreduzierung ist ein gängiges Merkmal vieler Unternehmensprodukte, aber die Anbieter verfolgen unterschiedliche Ansätze.
Dell Unity. Die All-Flash-Speichersysteme bieten erweiterte Datenreduzierungsfunktionen, die sowohl Komprimierung als auch Deduplizierung umfassen. Wenn Daten zum ersten Mal in das System gelangen, segmentiert Unity sie in 8-KB-Blöcke und leitet sie dann an den Deduplizierungsalgorithmus weiter, der die Blöcke auf bekannte Muster analysiert. Wenn Unity Muster findet, werden die Blöcke dedupliziert und auf die Festplatte geschrieben. Wenn keine Muster gefunden werden, leitet Unity die Daten an den erweiterten Deduplizierungsalgorithmus weiter, der jeden Block mit einem Fingerabdruck versieht, um doppelte Daten schnell zu identifizieren. Anschließend leitet Unity die Daten an den Komprimierungsalgorithmus weiter, der die Komprimierung nur dort anwendet, wo Einsparungen möglich sind. Die Datenreduzierung von Unity erfolgt Inline zwischen dem System-Cache und den Speichergeräten.
HPE 3PAR-Systeme verfügen über adaptive Datenreduzierungsfunktionen, die Inline-Deduplizierung und -Komprimierung bieten. 3PAR umfasst auch Thin Provisioning, Thin Conversion, Thin Persistence und Thin Copy Reclamation unter dem Dach der Datenreduktion. HPE hat den verlustfreien Komprimierungsalgorithmus speziell für den Betrieb mit einer Flash-nativen Blockgröße entwickelt. Er speichert Schreibvorgänge im Cache, bevor er sie an den Hostbestätigt, und führt die Komprimierung nach der Bestätigung durch. Die 3PAR-Systeme scannen die Daten, um unverständliche Datenströme zu identifizieren. Wenn sie entdeckt werden, speichert HPE sie in ihren nativen Formaten, anstatt CPU-Zyklen mit dem Versuch zu verschwenden, sie zu komprimieren.
Pure Storage FlashArray umfasst mehrere Technologien zur Datenreduzierung, um Platz in seinen All-Flash-Arrays zu sparen. Das System identifiziert und entfernt sich wiederholende binäre Muster und bietet eine Inline-Deduplizierung, die einen variablen Blockgrößenbereich von 4 KB bis 32 KB unterstützt. So wird sichergestellt, dass nur eindeutige Datenblöcke auf dem Speicher abgelegt werden. Das Produkt wendet die Deduplizierung auf das gesamte Array und nicht nur auf ein einzelnes Laufwerk an. FlashArray bietet eine Inline-Komprimierung mit variabler Adressierung und einem Schreiblayout, das nur das Anhängen von Daten zulässt, um Platzverschwendung zu vermeiden. Es führt einen Post-Process-Komprimierungsalgorithmus aus, um noch mehr Speicherplatz zu gewinnen.
Vast Data-Speichersysteme verwenden eine adaptive Chunking-Technik, die Daten in Blöcke von 16 KB bis 64 KB unterteilt. Die Datenreduzierung erfolgt innerhalb eines einzigen Bereichs über den gesamten vom Cluster erstellten Namensraum, wobei die Metadaten der Datenreduzierung in einem Schreibpuffer des Storage Class Memory gespeichert werden. Der Deduplizierungsvorgang identifiziert zunächst identische Datenblöcke und führt dann eine Reihe von Hash-Funktionen aus, die nach Ähnlichkeiten suchen. Wenn diese gefunden werden, komprimiert Vast die Blöcke gemeinsam mit einem gemeinsamen Komprimierungswörterbuch. Vast bietet eine datenbezogene Komprimierung, die automatisch und in Echtzeit durchgeführt wird. Die Systeme von Vast verwenden auch Delta-Kodierung, um die Anzahl der gespeicherten Bytes noch weiter zu reduzieren.