Coloures-pic - Fotolia
Ceph und GlusterFS: Open-Source-Dateisysteme im Vergleich
Zwei Alternativen, um die höheren Flexibilitätsanforderungen moderner Storage-Umgebungen zu erfüllen, sind die Software-basierten Open-Source-Lösungen Ceph und GlusterFS.
Die Storage-Welt hat sich in der letzten Zeit stark verändert. Vor zehn Jahren war ein Fibre Channel SAN Filer der Standard bei Enterprise Storage. Heute braucht Daten-Storage, verursacht durch die IaaS-Cloud (Infrastructure as a Service), mehr Flexibilität.
GlusterFS und Ceph sind zwei flexible Storage-Systeme, die in Cloud-Umgebungen gut funktionieren.
Bevor wir die Unterschiede und Gemeinsamkeiten von Ceph und GlusterFS beschreiben, soll es zunächst um die Anforderungen an flexibles Storage in Cloud-Umgebungen gehen.
- Scale-Up und Scale-Out: In Cloud-Umgebungen muss es extrem einfach sein, Servern mehr Storage hinzuzufügen und den Pool verfügbaren Storages zu erweitern. Ceph und GlusterFS tun dies, indem sie es sehr einfach machen, neue Storage-Geräte in ein bestehendes Storage-Angebot zu integrieren.
- Hochverfügbarkeit: GlusterFS und Ceph wurden als Softwareschicht über einem Linus-Betriebssystem entwickelt. Daher besteht die einzige Hardwareanforderung dieser Lösungen darin, dass die verwendete Hardware Linux-fähig sein muss. Da jede handelsübliche Hardware Linux-fähig ist, können Unternehmen damit ihre Investitionen in Hardware dramatisch verringern – wenn sie wollen. In der Realität zeigt sich allerdings, dass viele Unternehmen in spezifische Hardware investieren, auf der dann GlusterFS oder Ceph laufen, ganz einfach, weil schnellere Hardware auch einen schnelleren Zugriff auf das Storage bedeutet.
- Dezentralisierung: In einer Cloud-Umgebung sollte es niemals einen zentralen Punkt ohne Redundanz geben. Für Storage bedeutet das, dass Metadaten keinesfalls an einer zentralen Stelle gespeichert werden sollten. GlusterFS und Ceph implementieren eine Lösung, bei der nur der Metadatenzugriff dezentralisiert erfolgt. Das verringert die Verfügbarkeit und die Redundanz des Storage-Zugangs.
Nun zu den Unterschieden zwischen GlusterFS und Ceph. Wie schon der Name nahelegt, ist GlusterFS ein Dateisystem, das aus der Linux-Welt stammt und POSIX-konform (Portable Operating System Interface) ist. Während man GlusterFS sehr einfach in Linux-Umgebungen integrieren kann, ist das in Windows-Umgebungen zumindest schwierig.
Ceph repräsentiert eine vollständig neue Herangehensweise an Storage. Entwickelt wurde Ceph als Reaktion auf Swift Object Storage. Bei Objekt-Storage-Systemen schreiben Applikationen nicht in ein File-System, sondern mit Hilfe einer API direkt auf das Storage. Damit umgeht die Applikation hier die Funktionen und Begrenzungen von Betriebssystemen. Wurde eine Applikation entwickelt, um auf Ceph-Storage zu schreiben, ist es unwichtig, welches Betriebssystem auf dem System läuft. Im Ergebnis integriert sich Ceph genauso leicht in die Windows- wie in die Linux-Welt.
Applikationen können nicht nur über eine API auf Ceph-Storage zugreifen. Für optimale Integration gibt es auch ein Block-Device für Ceph, das wie ein normales Block-Device in einer Linux-Umgebung verwendet werden kann. Damit lässt sich Ceph genauso zu verwenden, als ob man auf eine normale Linux-Harddisk zugreifen würde. Ceph besitzt aber mit CephFS auch ein File-System, das für Linux-Umgebungen geschrieben wurde.
SUSE hat eine iSCSI-Schnittstelle hinzugefügt, die es Clients mit einem iSCSI-Client ermöglicht, wie jedes andere iSCSI-Ziel auf Ceph-Speicher zuzugreifen. All diese Angebote machen Ceph zur besseren Wahl in heterogenen Umgebungen, in denen nicht nur Linux eingesetzt wird.
Ceph ist also ein flexibleres Angebot, das sich leichter in Nicht-Linux-Umgebungen integrieren lässt. Das reicht vielen Unternehmen, um sich beim Aufbau ihres Storage-Produkts eher auf Ceph als auf GlusterFS zu verlassen. In Umgebungen, in denen ausschließlich Linux läuft, ist das aber nicht überzeugend. Hier zählt ein weiteres wichtiges Argument: die Schnelligkeit.
Zum Vergleich zwischen GlusterFS und Ceph wurden mehrere Tests durchgeführt, um zu ermitteln, welches der beiden Storage-Produkte schneller ist. Bislang gab es keinen klaren Gewinner. Der Storage-Algorithmus von GlusterFS ist schneller, und wegen der Hierarchie, nach der GlusterFS die einzelnen Storage-Bausteine integriert, kann das in manchen Szenarien die Arbeit beschleunigen. Das gilt insbesondere, wenn nicht optimiertes Ceph im Vergleichsszenario verwendet wird. Andererseits erlaubt Ceph mehr kundenspezifische Anpassungen, durch die es fast so schnell wie GlusterFS werden kann. Im Ergebnis ist keines der beiden Systeme klar überlegen.
Die Realität zeigt, dass die unterschiedlichen Zugriffsmethoden auf Storage, die mit Ceph möglich sind, diese Lösung populärer machen. Das belegen zwei Tatsachen: Mehr Unternehmen ziehen Ceph in Erwägung und GlusterFS ist noch immer vor allem mit Red Hat assoziiert. Beispielsweise bietet SUSE keine kommerzielle Implementierung von GlusterFS an, während Ceph inzwischen weitgehend von der Open Source Community akzeptiert wird. Deshalb gibt es unterschiedliche Ceph-basierte Produkte auf dem Markt. Daher ist im Wettbewerb zwischen den beiden Dateisystemen Ceph eindeutig stärker als GlusterFS.
Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!