Petrovich12 - Fotolia

Vier File-Systeme und ihre Entwicklung

Mit der Wandlung von Computing und Rechenzentren muss sich auch das Dateisystem der nächsten Generation weiterentwickeln. Hier ein Überblick über status quo und Aussichten.

Vor nicht allzu langer Zeit war das Speichern von Dateien noch einfach. Unter Windows wurde NTFS als Dateisystem verwendet. Unter Linux war Ext4 der beste Ansatz für Unternehmensdaten. Mit der Entwicklung verschiedener Dateisysteme hat sich viel verändert. Dateisysteme mit zahlreichen Volumes sind üblich, und parallele und verteilte Dateisysteme machen es einfach, die lokale Dateiablage auf die Cloud auszudehnen.

Um besser zu verstehen, was das in der Speicherwelt bedeutet, betrachten wir drei verschiedene Dateisysteme: Multi-Volume-Dateisysteme, verteilte Dateisysteme und hybride Cloud-Speicher. Wir werfen auch einen Blick auf eine Neuentwicklung: die dezentrale Speicherung von Cloud-Objekten.

Lokale Dateisysteme der nächsten Generation

Wir können seit etwa einem Jahrzehnt die Verbesserung des Dateisystems im Linux-Betriebssystem beobachten. Linux suchte nach einem Dateisystem, das ähnliche Funktionen bietet wie das ZFS-Dateisystem, das seinen Ursprung in Unix hat. Zu diesen Funktionen gehören Copy-on-Write, einfache Größenanpassung und erhöhte Datenintegrität.

Das Btrfs-Dateisystem, das Oracle für den Einsatz unter Linux entwickelt hat, schien diese Funktionen zu bieten. Die Entwicklung von Btrfs begann 2007 und gilt seit 2014 als stabil. Aber jetzt, da Red Hat, der wichtigste Unternehmensplayer im Linux-Markt, beschlossen hat, Btrfs nicht mehr zu unterstützen, ist seine Zukunft weniger sicher. Für moderne Rechenzentrums-Workloads, die eng mit Public oder Private Clouds integriert sind, sind lokale Dateisysteme der nächsten Generation jedoch nicht die wichtigste Entwicklung.

Verteilte Dateisysteme

Der größte Nachteil eines lokalen Dateisystems ist, dass es lokal ist. Computing findet zunehmend in einer verteilten Umgebung statt. Verteilte Dateisysteme ermöglichen eine verteilte Datenspeicherung. NFS und andere Client/Server-basierte verteilte Dateisysteme gibt es seit Jahrzehnten, aber heutzutage sind verteilte Dateisysteme auch in Clouds verfügbar.

Der Wert von Cloud-orientierten verteilten Dateisystemen besteht darin, dass sie es ermöglichen, eine Datei in mehrere Chunks aufzuteilen, die über mehrere Server repliziert werden können. Dies ermöglicht Redundanz und erleichtert gleichzeitig den Zugriff auf die Datei an dem Ort, an dem sie benötigt wird. Außerdem ermöglicht die Verteilung der Chunks auf mehrere Server den parallelen Zugriff auf verschiedene Teile der Datei, wodurch Locking-Probleme in einer Mehrmandantenumgebung vermieden werden.

Die Kernkomponenten des Hadoop-Dateisystems
Abbildung 1: Die Kernkomponenten des Hadoop-Dateisystems

Mehrere verteilte Dateisysteme verfügen über Ansätze zur Objektspeicherung, wie Ceph und Swift. Es gibt auch Cloud-basierte Speicher wie Google und Hadoop-Dateisysteme. In verteilten Dateisystemen können Hunderte von Speicherknoten vorhanden sein, was das Dateisystem weniger anfällig für Ausfälle aufgrund von Hardwareausfällen macht.

Hybrider Cloud-Speicher

Da immer mehr Rechenzentren eng mit der Cloud integriert werden, ist es sinnvoll, lokalen Storage mit Speicher in privaten oder Public Clouds zu integrieren. Traditionelle Storage-Anbieter wie Dell EMC, IBM und NetApp sowie Public-Cloud-Plattformen wie AWS und Azure bieten solche hybriden Ansätze. Hybridspeicher ist ein Markt, der immer noch von Cloud- und Speicheranbietern dominiert wird. Aufgrund der Architektur des hybriden Speichers gibt es keine wichtigen Open-Source-Projekte.

Mit der Entwicklung verschiedener Dateisysteme hat sich viel verändert. Dateisysteme mit zahlreichen Volumes sind üblich, und parallele und verteilte Dateisysteme machen es einfach, die lokale Dateiablage auf die Cloud auszudehnen.

Es gibt viele Gründe, warum Unternehmen anfangen, sich mit hybridem Storage zu befassen, wenn sie verschiedene Dateisysteme in Erwägung ziehen. Ein überzeugender Punkt ist, dass hybrides Cloud-Storage Skalierbarkeit bietet, ohne dass eine große Investition in eine erweiterte Speicherinfrastruktur erforderlich ist. Unter den verschiedenen Dateisystemen zeichnet sich Cloud-Storage dadurch aus, dass es nur dann bezahlt wird, wenn es wirklich verwendet wird. Sobald es nicht mehr genutzt wird, können Benutzer auf den lokalen Speicher zurückgreifen.

Die Verbindung von lokalem Speicher mit Cloud-Speicher erfordert ein Protokoll, um Daten zu verschieben. iSCSI, die S3-API und NAS-Protokolle, wie zum Beispiel NFS, sind die üblichen Optionen. Ein weiteres bekanntes Element ist ein Gateway, das die Verbindung zwischen den lokalen Daten und der Public Cloud herstellt.

Dezentrale Speicherung von Cloud-Objekten

Viele Server in der Cloud haben zu viel Speicherkapazität, und das ist die Grundlage für die dezentrale Speicherung von Cloud-Objekten. Bei dieser Art von Speicher wird eine Client-seitige Verschlüsselung verwendet, um Daten über mehrere anonyme Geräte im Internet zu verteilen.

Verschiedene kleine Teile der verschlüsselten Daten sind auf vielen Computern gespeichert, aber die Besitzer der Computer können mit den Daten nichts anfangen. Storj implementiert diese Art von Speicher. Das Netzwerk soll Anfang 2019 verfügbar sein.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Kommt das Aus für das traditionelle File System?

Im Vergleich: Open-Source-Dateisysteme Ceph und GlusterFS

Datenexplosion mit Global-File-System-Interface minimieren

Erfahren Sie mehr über Storage Management