All-Flash Array (AFA)
Was ist ein All-Flash-Array?
Ein All-Flash Array (AFA), auch bekannt als Solid-State-Storage-Disk-System oder Solid-State-Array, ist ein externes Speicher-Array, das ausschließlich Flash-Medien für die dauerhafte Speicherung unterstützt. In einem AFA wird Flash-Speicher anstelle der rotierenden Festplatten verwendet, die traditionell in vernetzten Speichersystemen eingesetzt werden.
Storage-Anbieter verkaufen in der Regel All-Flash Arrays und Hybrid Arrays. Die letztere Konfiguration kombiniert eine Mischung aus SSDs und HDDs im selben Gehäuse. Mit einem hybriden Speicher-Array kann ein Anbieter ein vorhandenes Plattensystem nachrüsten, indem er einen Teil der Festplatten durch Flash ersetzt.
All-Flash-Array-Design: Nachrüsten oder Spezialanfertigung
Andere Anbieter verkaufen speziell angefertigte Systeme, die von Grund auf nur für die Unterstützung von Flash ausgelegt sind. Ein All-Flash-Modell enthält auch eine Reihe von softwaredefinierten Speicherfunktionen zur Verwaltung der Daten.
Ein entscheidendes Merkmal eines AFA ist die Einbeziehung nativer Software-Services, die es den Benutzern ermöglichen, Datenmanagement und Datensicherung direkt auf der Array-Hardware durchzuführen. Dies unterscheidet sich von serverseitigem Flash-Speicher, der auf einem normalen x86-Server installiert ist. Das Einfügen von Flash-Speicher in einen Server ist viel billiger als der Kauf eines All-Flash Arrays, aber es erfordert auch den Kauf und die Installation von Verwaltungssoftware von Drittanbietern, um die benötigten Datendienste bereitzustellen.
Führende All-Flash-Anbieter haben Algorithmen für Array-basierte Dienste zur Datenverwaltung geschrieben, darunter Klonen, Datenkomprimierung und Deduplizierung (entweder als Inline- oder Post-Process-Operation), Snapshots, Replikation und Thin Provisioning.
Wie sein festplattenbasiertes Gegenstück bietet ein All-Flash Array gemeinsamen Speicher in einer SAN- oder NAS-Umgebung.
Wie sich ein All-Flash Array von Festplattensystemen unterscheidet
Flash-Speicher, der keine beweglichen Teile hat, ist eine Art von nichtflüchtigem Memory (NVM), der in Speichereinheiten, die Blöcke genannt werden, gelöscht und neu programmiert werden kann. Es handelt sich um eine Variante des EPROM (Erasable Programmable Read-Only Memory), der seinen Namen daher hat, dass die Speicherblöcke mit einer einzigen Aktion gelöscht werden können (Flash). Ein Flash-Array kann Daten viel schneller zu und von SSDs übertragen als elektromechanische Festplattenlaufwerke.
Der Vorteil eines All-Flash Arrays gegenüber einem plattenbasierten Speicher liegt in der vollen Bandbreitenleistung und der geringeren Latenzzeit, wenn Geschäftsanwendungen eine Abfrage zum Lesen der Daten durchführen. Der Flash-Speicher in einem AFA wird in der Regel in Form von SSDs geliefert, die vom Design her einem integrierten Schaltkreisähneln.
Flash ist teurer als Festplatten, aber die Entwicklung von MLC-Flash (Multi-Level Cell), TLC-Flash (Triple-Level Cell), NAND-Flash und 3D-NAND-Flash hat die Betriebskosten gesenkt. Diese Technologien ermöglichen eine höhere Flash-Dichte, ohne dass die Kosten für die Verkleinerung der NAND-Zellen anfallen.
MLC-Flash ist langsamer und weniger haltbar als SLC-Flash (Single-Level Cell), aber die Unternehmen haben Software entwickelt, die das Wear Leveling verbessert, so dass MLC für Unternehmensanwendungen akzeptabel ist. SLC-Flash ist nach wie vor die erste Wahl für Anwendungen mit den höchsten I/O-Anforderungen und wird auch häufig von Anbietern von Public Clouds verwendet. TLC-Flash senkt die Kosten jedoch stärker als MLC, bringt aber auch Kompromisse bei der Leistung und Haltbarkeit mit sich, die durch Software gemildert werden können.
All-Flash Array vs. Hybrid Array
Bei All-Flash Arrays handelt es sich um Speicher-Arrays, die ausschließlich Flash-Festplatten enthalten, während Hybrid Arrays eine Mischung aus SSDs und herkömmlichen HDDs enthalten. Die HDDs werden im Allgemeinen als Kapazitätsschicht bezeichnet, während die SSDs oft als Leistungsschicht bezeichnet werden.
Hybrid Arrays werden in der Regel auf zwei Arten verwendet. Die erste Möglichkeit besteht darin, dass ein Speicheradministrator einfach eine virtuelle Festplatte auf dem Performance-Pool oder dem Kapazitätspool erstellt. Dadurch erhält der Administrator die Flexibilität, den Speichertyp und die effektive Kapazität zu wählen, die für die Arbeitslast am besten geeignet sind. Dies kann besonders in Hybrid-Cloud-Umgebungen nützlich sein, da hybride Clouds oft eine Mischung von Arbeitslasten mit unterschiedlichen Speicheranforderungen hosten.
Die andere Option besteht darin, die Leistungsschicht als Cache zu verwenden. Heiße Daten – das heißt Daten, die vor kurzem erstellt wurden oder auf die kürzlich zugegriffen wurde – werden automatisch auf die Leistungsebene verschoben, sodass jeder, der auf diese Daten zugreift, eine Leistung auf SSD-Niveau erhält. Wenn sich die Daten abkühlen, das heißt wenn weniger häufig auf sie zugegriffen wird, werden sie automatisch in die Kapazitätsschicht verschoben, um in der Leistungsschicht Platz für neue Daten zu schaffen. Der Vorteil dieses Ansatzes besteht darin, dass er Unternehmen die Möglichkeit bietet, eine Speicherleistung zu erreichen, die in etwa mit der eines All-Flash Arrays vergleichbar ist, jedoch zu deutlich geringeren Kosten. Außerdem können Unternehmen mit hybriden Arrays eine höhere Gesamtspeicherkapazität erreichen, als dies mit einem All-Flash Array möglich wäre.
Überlegungen zum Kauf eines All-Flash Arrays
Bei der Entscheidung für ein AFA geht es um mehr als den einfachen Vergleich von Herstellerprodukten. Zu den Faktoren, die vor dem Kauf eines AFA berücksichtigt werden müssen, gehören die folgenden:
- Anwendungsleistung. Ein All-Flash Array, das für eine bestimmte Gruppe von Anwendungen massive Leistungssteigerungen bringt, bietet möglicherweise für andere Arbeitslasten nicht die gleichen Vorteile. Beispielsweise ist die Ausführung virtualisierter Anwendungen in Flash mit Inline-Datendeduplizierung und -Komprimierung in der Regel kostengünstiger als Flash, das Streaming-Medien unterstützt, bei denen einzelne Dateien nicht so leicht komprimiert werden können.
- Leseleistung. Ein reines SSD-System weist geringere Schwankungen bei den maximalen, minimalen und durchschnittlichen Latenzen auf als ein HDD-Array. Daher ist Flash für die meisten leseintensiven Anwendungen gut geeignet.
- Schreibleistung. Schreibintensive Arbeitslasten erfordern einen speziellen Algorithmus, um alle Schreibvorgänge auf demselben Block der SSD zu sammeln, wodurch sichergestellt wird, dass die Software immer mehrere Änderungen in denselben Block schreibt.
- Ausdauer. Die Garbage Collection kann bei SSDs ein ähnliches Problem darstellen. Eine Flash-Zelle kann nur eine begrenzte Anzahl von Schreibvorgängen verkraften, so dass die Abnutzung ausgeglichen werden kann, um die Flash-Ausdauer zu erhöhen. Die meisten Anbieter konzipieren ihre All-Flash-Systeme so, dass die Auswirkungen von Garbage Collection und Wear Leveling minimiert werden, obwohl Benutzer mit schreibintensiven Arbeitslasten das Array eines Anbieters unabhängig testen sollten, um die beste Konfiguration zu ermitteln.
- Kosten. Trotz des höheren Anschaffungspreises für das System können die Speicherkosten beim Kauf eines AFA mit der Zeit sinken. Dies hängt mit der höheren CPU-Auslastung eines All-Flash Arrays zusammen, was bedeutet, dass ein Unternehmen weniger Anwendungsserver kaufen muss.
- Auswirkungen auf das Rechenzentrum. Die physische Größe eines AFA ist kleiner als die eines Disk-Arrays, wodurch die Anzahl der Racks sinkt. Weniger Racks in einem System reduzieren auch die Wärmeentwicklung und den Kühlungsbedarf im Rechenzentrum.
All-Flash Array: Ein sich entwickelnder Markt
Flash wurde zunächst als eine Handvoll SSDs in ansonsten reinen HDD-Systemen eingeführt, um eine kleine Flash-Ebene zur Beschleunigung einiger kritischer Anwendungen zu schaffen. Damit war das hybride Flash-Array geboren.
Die nächste Evolutionsphase kam mit dem Aufkommen von Software, die es ermöglichte, dass ein SSD als Frontend-Cache für den Festplattenspeicher diente, um den Vorteil der schnelleren Leistung auf alle auf dem Array laufenden Anwendungen auszuweiten.
Der heute nicht mehr existierende Anbieter Fusion-io war ein früher Pionier des schnellen Flash. Fusion-io wurde 2005 gegründet und verkaufte PCIe-Karten (Peripheral Component Interface Express), die mit Flash-Chips bestückt waren. Durch das Einsetzen der PCIe-Flash-Karten in Serversteckplätze konnte ein Rechenzentrum die Leistung herkömmlicher Server-Hardware steigern. Im Jahr 2014 wurde Fusion-io von SanDisk übernommen, das wiederum 2016 von Western Digital aufgekauft wurde.
Ein weiterer Vorreiter war Violin, dessen Systeme, die mit kundenspezifischem Silizium entwickelt wurden, schnell Kunden gewannen und 2013 an die Börse gebracht wurden. Im Jahr 2017 wurde Violin von All-Flash-Wettbewerbern überholt, deren Arrays ausgereiftere Softwaredatendienste integrierten. Nach dem Insolvenzantrag wurde der Anbieter 2018 von privaten Investoren als Violin Systems neu gegründet, wobei der Schwerpunkt auf dem Verkauf von All-Flash-Speichern an Managed Service Provider lag. Die Holdinggesellschaft StorCentric übernahm Violin im Jahr 2020.
Anbieter von All-Flash Arrays wie Pure Storage und XtremIO – jetzt Teil von Dell – gehörten zu den ersten Anbietern, die Inline-Komprimierung und Datendeduplizierung einführten, was bei den meisten anderen Anbietern inzwischen zum Standard gehört. Die Deduplizierung hat dazu beigetragen, dass AFAs preislich mit Speichern, die auf billigeren rotierenden Medien basieren, gleichziehen können.
All-Flash-Array-Anbieter und -Produkte
Zu den führenden All-Flash-Array-Produkten gehören die folgenden (Stand Juli 2023):
- DDN IntelliFlash N-Series
- Dell Isilon NAS
- Dell PowerStore
- Dell PowerVault
- Fujitsu Eternus AF
- HPE Alletra
- HPE Nimble Storage AF Serie
- HPE XP8
- Hitachi Vantara Virtual Storage Platform
- Huawei OceanStor Dorado
- IBM FlashSystem
- Infinidat InfiniBox SSA
- Lenovo ThinkSystem DE Reihe
- NetApp All Flash FAS
- NetApp AFF A-Serien
- NetApp SAN-Arrays der ASA-Serie
- Pure Storage FlashArray
- Pure FlashBlade
- Qumulo C-Serie NAS-Arrays
Nachfolgend sind Anbieter aufgeführt, die das Produktportfolio geändert oder sich aus dem All-Flash-Geschäft zurückgezogen haben:
- Kaminario, das 2020 in Silk umbenannt wird, hat sich von AFA-Produkten auf Basis von Standardprodukten verabschiedet und konzentriert sich auf seinen Hardware-Stack für skalierbare Blockspeicher in der Cloud.
- Nimbus Data verließ den Markt für All-Flash Arrays, um sich auf seine ExaFlash-Laufwerksfamilie zu konzentrieren, zu der auch eine 100-TB-SSD für Hosting-Anbieter gehört.
- Tegile Systems wurde 2017 von Western Digital übernommen. Tegile-Arrays wurden anschließend Teil des IntelliFlash-Systems von Western Digital, das jetzt zu DataDirect Networks gehört.
- Violin Systems, jetzt im Besitz von StorCentric, war einer der ersten AFA-Anbieter, geriet aber schnell ins Hintertreffen, da es sich schwer tat, Flash-optimiertes Softwaremanagement zu liefern.
Auswirkungen auf die Nutzung von Hybrid-Arrays
Sinkende Flash-Preise, Datenwachstum und integrierte Datendienste haben die Attraktivität von All-Flash Arrays für viele Unternehmen erhöht. Dies hat in der Branche zu Spekulationen geführt, dass All-Flash-Speicher hybride Arrays verdrängen könnten. Dennoch gibt es gute Gründe für Anwender, eine hybride Speicherinfrastruktur in Betracht zu ziehen.
HDDs bieten eine vorhersehbare Leistung zu relativ niedrigen Kosten pro Gigabyte. Die Kehrseite der Medaille ist, dass Festplatten mehr Strom verbrauchen und langsamer sind als Flash, was zu hohen Kosten pro IOPS führt. All-Flash Arrays haben niedrigere Kosten pro IOPS, sind schneller und verbrauchen weniger Strom, haben aber einen höheren Anschaffungspreis und höhere Kosten pro Gigabyte.
Mit einem Hybrid-Flash-Array können Unternehmen ein Gleichgewicht zwischen Kosten und Leistung herstellen. Da ein Hybrid-Array Festplattenlaufwerke mit hoher Kapazität unterstützt, kann es einen größeren Gesamtspeicher als ein AFA bieten, obwohl neuere SSDs mit mehreren Petabyte Speicherkapazität auf den Markt kommen.
All-Flash-NVMe und NVMe over Fabrics
All-Flash Arrays, die auf NVMe-Flash-Technologien basieren, stellen die nächste Phase der Marktreife dar. Die NVMe-Host-Controller-Schnittstelle beschleunigt die Datenübertragung, indem sie es einer Anwendung ermöglicht, direkt mit dem Backend-Speicher zu kommunizieren.
Der NVMe-oF-Transportmechanismus ermöglicht eine Langstreckenverbindung zwischen Host-Geräten und NVMe-Speichergeräten.
NVMe ist als schnellere Alternative zum SCSI-Standard gedacht, der Daten zwischen einem Host und einem Zielgerät überträgt. NVMe bietet die Möglichkeit, Pools von gemeinsam genutztem Hochleistungsspeicher über ein Netzwerk zu erstellen.
Die Entwicklung des NVMe-Standards steht unter der Schirmherrschaft der NVM Express Inc., einer gemeinnützigen Organisation, der mehr als 100 Technologieunternehmen angehören.
Der NVMe-Standard wird weithin als möglicher Nachfolger der Protokolle Serial-Attached SCSI (SAS) und Serial Advanced Technology Attachment (SATA) angesehen. Zu den NVMe-Formfaktoren gehören Add-in-Karten, U.2-2,5-Zoll- und M.2-SSD-Geräte.
NVMe over Fabrics (NVMe-oF) ist eine Reihe von Protokollspezifikationen, die es Hosts ermöglichen, sich direkt mit dem Speicher zu verbinden und zu kommunizieren. Die daraus resultierende Datenübertragung wird durch NVMe-Nachrichtenbefehle über Ethernet, Fibre Channel oder InfiniBand durchgeführt.
Derzeit entwickeln Speicherhersteller Flash-Speichersysteme, die auf NVMe-oF basieren. Diese Systeme integrieren kundenspezifische NVMe-Flash-Module als Fabric anstelle einer Reihe von NVMe-SSDs.
Zu den verfügbaren NVMe-basierten Produkten gehören die folgenden (Stand Juli 2023):
- HPE Alletra 9000 4-way NVMe Storage Base
- Pure Storage FlashArray//X
- StorOne S1 Enterprise Storage Platform mit NVMe-oF über TCP
- Supermicro SuperStorage-Systeme
- Tintri's NVMe Flash N-Serie
Eine Handvoll Start-ups hat mit dem Verkauf von NVMe-oF-Speichersystemen Fuß gefasst, darunter Kioxia, Lightbits Labs und Vast Data.
All-Flash-Speicher-Arrays in hyperkonvergenten Infrastrukturen
Hyperkonvergente Infrastruktursysteme (HCI) vereinen Rechen-, Netzwerk-, Speicher- und Virtualisierungsressourcen in einer integrierten Anwendung. Die meisten Hyperkonvergenzprodukte sind so konzipiert, dass sie Festplatten als Frontend-Speicher verwenden und sich auf eine moderate Flash-Cache-Ebene stützen, um Anwendungen zu beschleunigen oder als Cold Storage zu nutzen.
Die höheren Kosten von Flash erzwingen einen Preisaufschlag für ein All-Flash-HCI-System, weshalb sie weniger verbreitet sind als festplattenbasierte HCI-Plattformen.
Dennoch sind All-Flash-HCI-Knoten von verschiedenen Anbietern eine Option Stand Juli 2023):
- Cisco HyperFlex HX220
- Dell VxRail
- HPE SimpliVity 380
- Hitachi Vantara Unified Compute Platform HC
- IBM Hyperconverged Systems by Nutanix, auf dem der Nutanix Acropolis Hypervisor läuft
- IBM Storage Fusion HCI-System
- Nutanix NX-9000
- StarWind HCI Appliance
Einige Storage-Array-Anbieter hatten es schwer, auf dem HCI-Markt Fuß zu fassen. NetApp kündigte an, dass es sein NetApp HCI-Produkt, das SolidFire-Arrays als All-Flash-Speicher verwendete, auslaufen lassen wird.
Eine der wichtigsten Entwicklungen im Hinblick auf All-Flash Arrays ist das Aufkommen von QLC-NAND-Flash-Laufwerken (Quad-Level Cell) zur Steigerung der Leistung. Große Storage-Anbieter haben QLC-fähige Versionen ihrer AFAs für Cloud- und andere nicht unternehmenskritische Workloads auf den Markt gebracht. NetApp hat das All-Flash FAS C-Series Storage-Portfolio auf den Markt gebracht, das QLC-SSDs enthält, um die Kapazitätskosten zu senken.