- stock.adobe.com

Kriterien für Distributed File Systems und Object Storage

Distributed-File-System- und Object-Storage-Lösungen unterscheiden sich oft nur in Nuancen – umso wichtiger ist eine genaue Anforderungsdefinition und deren Prüfung am Produkt.

Der dynamische Storage-Markt erschwert es oft, Produkte sinnvoll zu klassifizieren. Sogar funktional gleichartige Produkte werden oft unter verschiedenen Labels und mit unterschiedlichen Beschreibungen verkauft.

Das gilt besonders für verteilte Filesysteme (Distributed File Systems, DFS) und Objekt-Storage.

Nur durch den detailgenauen Vergleich der einzelnen Angebote können Storage-Admins diese Produktkategorie verstehen und erkennen, was bei jedem Produkt im Einzelnen angeboten wird. Anders können sie kaum erkennen, ob ein Produkt zu ihren Anforderungen passt.

Der DFS-Markt ist breit und vielfältig

Das Marktforschungsunternehmen Gartner hat sich im Oktober 2020 mit DFS und Objekt-Storage befasst. Der entsprechende Report gehörte zur Magic-Quadrant-Serie. Er umfasste diverse Storage-Produkte und Anbieter, darunter Dell Technologies und IBM.

Die Marktforscher beschrieben DFS und Object Storage als Soft- und Hardwareplattformen, die auf einer verteilten Architektur basieren. Sie verwenden Objekt- oder Scale-Out-File-Technologie oder beides, um mit dem Zuwachs an unstrukturierten Daten fertig zu werden. Weiter klassifizierte Gartner diese Produkte dadurch, dass sie Daten und Metadaten verteilen, replizieren oder mittels Erasure Coding über ein Netzwerk und diverse Knoten eines Clusters hinweg verteilt speichern können.

Auch wenn man diese Eigenschaften zugrunde legt, bleibt die Produktkategorie breit und schwer zu definieren. Dell Technologies beispielsweise beschreibt seine Lösungen PowerScale und ECS unterschiedlich. Aber beide Produkte kommen im Magic Quadrant für DFS und Object Storage vor. Laut Herstellerangaben ist PowerScale jedoch eine Scale-out NAS-Plattform, während ECS als Software-definierte Object-Storage-Plattform im Cloudformat angeboten wird.

Drei Angebote von Großen: Dell, IBM, NetApp

Die wichtigste Gemeinsamkeit zwischen den Produkten, die Gartner für seinen Report bewertete, besteht darin, dass jedes auf einer verteilten Computer-Architektur aufbaut. Außerdem umfassen alle Produkte Object Storage oder unterstützen sie. Allerdings gibt es auch signifikante Unterschiede.

DellEMC PowerScale zum Beispiel ist eine Serie von NAS-Produkten. Hier läuft jeweils das Betriebssystem OneFS auf jedem Knoten des PowerScale-Clusters. Das Betriebssystem besitzt eine Software-definierte Architektur, um große Mengen Daten zu speichern, zu verwalten, zu sichern und zu analysieren.

OneFS orchestriert die Cluster-Komponente und bildet einen vereinheitlichten Storage-Pool, um die Daten zu konsolidieren. Das Betriebssystem unterstützt mehrere Industriestandard-Protokolle für den File-basierten Datenzugriff. Auch Amazon Simple Storage Service (S3) ist integriert, der Object Storage Service der AWS-Cloud. Das Protokoll wird auf der obersten Ebene der File Service Engine implementiert. Wegen dieses Designs können sowohl File-basierte als auch Objekt-basierte Applikationen auf ein Filesystem auf derselben Plattform zugreifen.

Im Gegensatz dazu ist IBM Spectrum Scale ein reines Softwareangebot, zu dem diverse Datendienste gehören. In seinem Zentrum steht ein globales paralleles Filesystem. Es basiert auf IBMs General Parallel File System (GPFS). Spectrum Scale ermöglicht es, Flash, Festplatten, Cloud- und Tape-Storage in einer einheitlichen Umgebung zu kombinieren.

Das Produkt bietet Resilienz, Skalierbarkeit und die Steuerung der gesamten Umgebung von einem Punkt aus. Laut IBM kann das Dateisystem Zehntausende Clients bewältigen, Milliarden Dateien und Yottabytes an Daten. Es integriert Schnittstellen für den Zugriff auf Files, Objekte und das Hadoop Distributed File System (HDFS). Für den Objektzugriff unterstützt Spectrum Scale die APIs OpenStack Swift oder S3 Storage System.

Davon unterscheidet sich NetApps Herangehensweise. Sein Produkt StorageGrid ist ein Object-Storage-System, mit dem Organisationen unstrukturierte Daten über hybride und Multi-Cloud-Umgebungen hinweg managen können.

Administratoren können StorageGrid als virtuelle, Hardware-Appliances oder Docker-Container implementieren. Es läuft auf Bare Metal oder in VMs. StorageGrid bietet einen einheitlichen Namensraum, der bis zu 16 Rechenzentren weltweit überspannt. Das Produkt integriert Regeln für das Lebenszyklusmanagement der Daten, um deren Platzierung zu optimieren. StorageGrid unterstützt auch die Funktionen des S3-API wie Objektversionierung, Objekt-Tags und Upload in mehreren Teilen.

Weitere DFS/Object-Storage-Lösungen

Es gibt weitere Produkte, die nicht im Magic Quadrant DFS/Object Storage aus dem Jahr 2020 auftauchen, aber trotzdem als DFS und Object Storage qualifiziert werden. Dazu gehören die von Panuzura und Nasuni.

Panzura baut sein Hochleistungs-Storage-Produkt auf das Filesystem CloudFS auf. Dabei handelt es sich laut Panzura um ein globales Cloud-Filesystem mit einheitlichem Namensraum. CloudFS ermöglicht skalierbare Multi-Site-Umgebungen und bietet gleichzeitig Konsistenz über Public und Private Clouds hinweg. CloudFS speichert oft genutzte Files an jedem Standort zwischen, um die lokale Leistung zu optimieren. Gleichzeitig bietet die Lösung eine einzige zuverlässige und hoch skalierbare Quelle für alle Daten. Im Verhalten lässt sich Panzuras System mit einem Enterprise-NAS mit Standard-Windows-Fileshare vergleichen, allerdings ohne die üblichen geografischen Restriktionen von NAS-Systemen.

Nasunis Lösung basiert auf UniFS, einem Cloud-nativen globalen Filesystem, das alle Daten auf Object Storage in Public oder Private Clouds speichert. UniFS cacht aktive Files ebenfalls lokal und verwendet dafür speziell entwickelte Appliances. Laut dem Hersteller ist allerdings ein globales Filesystem wie UniFS nicht dasselbe wie ein DFS oder ein globaler Namensraum. Diese Modelle binden Dateien an eine spezielle Hardware. Das DFS oder der globale Namensraum entdecken die Dateien und eröffnen den Zugriffsweg auf sie. Bei einem globalen Filesystem sind Files nicht an eine Hardware gebunden.

Weitere Produkte, die zu den DFS mit Object Storage gerechnet werden können, sind die Filespaces von Quobyte und LucidLink. Quobyte bezeichnet sein Produkt als Software-Storage-System, das hunderte Megabytes Daten verwalten kann. LucidLink sieht in Filespaces ein verteiltes globales Filesystem für Object Storage.

Fazit

Aus diesen Beschreibungen, die sich in Nuancen und Details unterscheiden, lässt sich schließen, dass Anwender nur mit äußerster Sorgfalt eine passende Lösung finden können. Sie müssen ihre Anforderungen im Detail festschreiben und diese Anforderungsdetails genauso genau an jedem in Frage kommenden Produkt abgleichen.

Erfahren Sie mehr über Software-defined Storage