pressmaster - stock.adobe.com

Vor- und Nachteile von Object, Block und File Storage

Wir fassen das Wichtigste zu File und Block Storage und die Vor- und Nachteile von Object Storage zusammen, welches im Vergleich zu SAN und NAS auch Pro und Kontras bietet.

Die Entwicklung von Object Storage oder Objektspeicher als praktikables Mittel zur Datenspeicherung fordert die bestehenden – eng miteinander verbundenen – Methoden der Datei- und Blockspeicherung heraus, auch bekannt als NAS und SAN.

Dieser Artikel fasst die Grundlagen von File und Block Storage zusammenfassen, mit dem Ziel, die ganz unterschiedlichen Eigenschaften der Objektspeicherung hervorzuheben, deren Basis Shared Storage ist. Im Endeffekt werden wir die Anwendungsfälle vorschlagen, die sich am besten für die Speicherung von Objekten sowie für File und Block eignen.

Objektspeicherung konnte sich in Form von Array-Produkten durchsetzen, aber auch als Basis für Cloud-basierte Protokolle wie Amazons S3.

Um zu sehen, wie sich die Objektspeicher von den SAN- und NAS-Protokollen unterscheidet, lassen Sie uns zunächst einen Blick darauf werfen. Datei und Block basieren auf greifen per File System auf den Speicher zu.

In beiden Fällen gibt es ein Dateisystem. Viele sind mit diesen vertraut - FAT und NTFS unter Windows oder ext unter Linux. Sie organisieren Daten in Dateien und Ordnern in einer baumartigen Hierarchie und geben einen Pfad zur Datei an, während sie gleichzeitig eine kleine Menge an Metadaten über die Datei speichern.

Das ist der Teil, den wir sehen. Aber im Hintergrund übernehmen dieser Dateipfad und das Dateisystem auch die Adressierung an den physischen Speicherort von Speicherblöcken auf dem Medium selbst.

Der wesentliche Unterschied zwischen Dateizugriff/NAS und Blockzugriff/SAN besteht darin, dass sich das Dateisystem beim NAS auf dem Array befindet. Hier laufen die I/O-Anforderungen einer Anwendung über das Dateisystem, das sich auf der NAS-Hardware befindet und als Volume oder Laufwerk aufgerufen wird. In einem SAN ist das Dateisystem außerhalb des Arrays und I/O-Aufrufe werden vom Dateisystem auf dem Server verarbeitet, wobei nur Informationen auf Blockebene benötigt werden, um auf Daten aus dem SAN zuzugreifen.

Der wichtigste praktische Unterschied

Aus dieser Unterscheidung ergibt sich der entscheidende praktische Unterschied zwischen NAS und SAN. NAS eignet sich am besten für die Aufbewahrung und den Zugriff auf ganze Dateien und verfügt über Locking-Systeme, die gleichzeitige Änderungen und Beschädigungen an Dateien verhindern.

Inzwischen ermöglichen SAN-Systeme Änderungen an Blöcken innerhalb ganzer Dateien und eignen sich daher hervorragend für die Datenbank- und Transaktionsverarbeitung.

Beide kommen in der Regel als Array-Produkte, auch wenn sie softwaredefiniert sind, und je nachdem, mit welcher Ausstattung, mit Funktionen wie synchrone und asynchrone Replikation, Snapshots, Kompression und Deduplizierung sowie Storage Tiering. Beide können auch die Vorteile von Flash-Speicher nutzen. SAN und NAS eignen sich gut für ihre Aufgaben, haben aber Nachteile.

Beispielsweise kann NAS durch Skalierung eingeschränkt werden. Historisch gesehen haben Organisationen eine NAS-Box installiert, um eine Abteilung zu bedienen, aber diese wuchsen und waren nicht miteinander verbunden, was zu Datensilos führte. Dieses Problem wird mit Scale-Out-NAS überwunden, bei dem mehrere NAS-Instanzen ein einziges, hochskalierbares paralleles Dateisystem betreiben. Die baumartige Dateisystemhierarchie kann Millionen von Dateien ganz einfach verarbeiten, aber sobald Sie sich auf Milliarden skaliert haben, kann sie sich verlangsamen.

Massive Skalierbarkeit

Objektspeicher bringt eine enorme Skalierbarkeit. Das liegt daran, dass es anders funktioniert als die SAN- und NAS-Protokolle. Es hat kein Dateisystem, aber, wie beim NAS, erfolgen Änderungen auf Dateiebene. Anstelle einer baumartigen Hierarchie organisiert die Object Storage Dateien oder Objekte in einem flachen Layout. Objekte sind eben nur Objekte mit eindeutigen identifizierenden Merkmalen.

Das bedeutet, dass die Objektspeicherung massiv skalierbar ist, auf Milliarden von Objekten, denn die Dateiorganisation wird nicht unhandlich, je größer sie wird.

Objekte haben auch Metadaten, und viele davon sind potentiell alle vom Anwender definierbar. Das bedeutet, dass jedes Attribut mit einem Objekt in seinen Kopf-Metadaten verknüpft werden kann: der Anwendung, der es zugeordnet ist, seiner Datenschutzmerkmale, den Tiering-Informationen, wann es gelöscht werden soll, und den benutzerdefinierten Geschäfts- oder organisationsbezogenen Merkmalen.

Die Objektspeicherung eignet sich daher hervorragend für die Analytik, da sie in sehr großen Datensätzen nach potenziell fast jedem Attribut durchsucht werden kann. Data Protection erfolgt in der Regel durch Erasure Coding, manchmal durch Replikation, obwohl erstere als die effizienter Methode angesehen wird, da sie weniger Overhead-Daten erzeugt.

Fast immer sind die Daten der Objektspeicherung jedoch „eventually consistent“ (letzlich konsistent, was bedeutet, dass die Mehrfachinstanzen für sichere Data Protection nicht sofort verfügbar oder gar auch nicht in der Nähe sind. Die Daten werden schließlich konsistent sein, da die Erasure Coding oder Replikation zwischen den Standorten funktioniert.

Aber auch mehrere Standorte können von Vorteil sein, so dass die Objektspeicherung für eine Organisation mit multiregionalen Anforderungen gut geeignet ist. Im Gegensatz dazu können SAN und NAS „stark konsistent“ sein, wobei nahezu Echtzeit-Spiegelungen von Datensätzen möglich sind.

Außerdem kann der Objektspeicher nicht so gut funktionieren wie SAN und manchmal auch NAS, hauptsächlich wegen der großen Dateiheader-Overheads, die er trägt. Es kann auch nicht die Manipulation auf Blockebene auf Unterdateiebene anbieten, die für Datenbank- und Transaktionsarbeiten erforderlich ist, auf die das SAN zugreifen kann.

Aus diesen beiden Hauptgründen eignet sich die Objektspeicherung am besten für große Datensätze unstrukturierter Daten, in denen sich Objekte nicht so oft ändern.

Außerhalb der Vor- und Nachteile der Technologie an sich hat die Objektspeicherung den Vorteil, relativ günstig zu sein, da sie oft auf handelsüblicher Hardware läuft. Das steht im Gegensatz zu potenziell teuren dedizierten Array-Produkten von Storage-Anbietern.

Allerdings können in anderen Bereichen Kosten anfallen, wie zum Beipsiel Änderungen an der Softwareumgebung. Nicht alle Anwendungen sind zwangsläufig nativ kompatibel mit Aufrufen von Objektspeicherdateien. Entwickelt für NFS, SCSI und so weiter, müssen sie an die Befehle Get, Put, Delete und andere Befehle der Objektspeicherung angepasst werden.

Zusammenfassung im Überblick

NAS: Gut im sicheren Dateiaustausch. Kann zum Silo werden. Scale-Out NAS potenziell maßstabsgetreu. Schlecht beim extremen Skalieren.

SAN: Gut bei Transaktions- und Datenbank-Workloads. Kann teuer sein.

SAN und NAS: Beide können mit erweiterten Speicherfunktionen wie zum Beispiel Replikation ausgestattet werden. Beide können im Vergleich zur Objektspeicherung auf herkömmlicher Hardware relativ teuer sein, obwohl sowohl SAN- als auch NAS-Software-definierter Speicher verfügbar sind. Beiden fehlt es an den umfangreichen Metadaten des Objektspeichers.

Object Storage: Sehr skalierbar, geeignet für unstrukturierte Daten und große Datensätze, potenziell gut für die Analyse über umfangreiche Metadaten. Highend-Performance fehlt und Data Protection ist in allen Clustern langsam. Kann in punkto Hardware sehr kosteneffizient sein.

Erfahren Sie mehr über Storage Management