mars58 - Fotolia
Die wichtigsten Funktionen verteilter Dateisysteme
DFS (Distributed File Systems) oder verteilte Dateisysteme dienen dazu, Daten unabhängig vom Speicherort der Daten oder dem Zugriffsort der Anwender verfügbar zu machen.
Mit verteilten Dateisystemen (Distributed File Systems, DFS) kann man die Daten auf einem Rechner zwischen mehreren Servern und den an sie angebundenen Anwendern teilen. Client-Systeme können dann mehrere Storage-Ressourcen so verwenden, als ob es sich um lokale Storage handelte. Mit DFS können Organisationen sicher, skalierbar und bequem auf ihre Daten zugreifen.
Ein DFS bietet also direkten Host-Zugriff auf File-Daten von mehreren Orten aus. NFS beispielsweise ist eine Art DFS-Protokoll. Storage-Ressourcen verbinden sich über Netzwerkressourcen wie LAN oder SAN mit einem Computer. Hosts können auf Daten über Protokolle wie NFS oder SMB zugreifen. Administratoren können neue Knoten zum System hinzufügen, wenn es schnell skalieren soll. Ein DFS sollte Sicherungskopien generieren, damit keine Daten verloren gehen, wenn ein Laufwerk ausfällt.
Funktionen von DFS
DFS haben vielfältige Funktionen. Einige Beispiele:
- Transparenz. Transparenz ist ein Sicherheitsmechanismus, der Details eines Filesystems von anderen Filesystemen und Anwendern verbirgt. Es gibt vier Transparenztypen:
- Strukturtransparenz. Die aktuelle Struktur des DFS, etwa die Nummer des Fileservers und der Storage-Systeme, bleibt dem Anwender verborgen.
- Zugriffstransparenz. Das DFS sollte die File-Ressourcen des Anwenders nur nach einem korrekten und sicheren Login-Prozess anzeigen, egal, wo der Anwender sich befindet.
- Replikations-Transparenz. Replizierte Files, die auf verschiedenen Knoten des DFS gespeichert werden, werden vor den anderen Knoten im Filesystem verborgen.
- Namenstransparenz. Dateinamen sollten nichts darüber aussagen, wo die Datei sich befindet. Sie sollten sich bei einer Verschiebung des Files auf einen anderen Knoten innerhalb der Reichweite des DFS auch nicht ändern.
- Leistung. Gemessen wird die Zeit, die das System zur Verarbeitung von Zugriffsanforderungen der Anwender braucht. Dazu gehören die Prozessorzeit, die Netzwerktransportzeit, die Zugriffszeit auf das Speichersystem und die Auslieferung des abgefragten Inhalts.
- Skalierbarkeit. Mit der Zunahme der Anforderungen an die Storage implementieren Anwender normalerweise weitere Storage-Ressourcen. Das DFS sollte stark genug sein, dass es, wenn das System wächst, auch die zusätzlichen Ressourcen handhaben kann. Anwender sollen keine Leistungsunterschiede bemerken.
- Hochverfügbarkeit. Wie jedes Storage-System müssen auch Geräte, die von einem DFS verwaltet werden, unterbrechungsfrei zur Verfügung stehen. Falls ein Knoten ausfällt oder ein Laufwerk kaputt geht, muss das DFS weiterlaufen und sich für ununterbrochenen Betrieb schnell auf andere Storage-Ressourcen umkonfigurieren. DR-Pläne müssen auch Vorbereitungen für die Sicherung und Wiederinbetriebnahme von Storage-Systemen und DFS-Servern umfassen.
- Datenintegrität. Wenn mehrere Anwender auf dieselben File-Storage-Systeme oder sogar dieselben Files zugreifen, muss das DFS den eingehenden Strom von Zugriffsanforderungen so verwalten, dass es nicht zu Unterbrechungen beim Zugriff kommt oder die Dateiintegrität beeinträchtigt wird.
- Hohe Zuverlässigkeit. Eine andere Methode, die Datenverfügbarkeit und das Überleben der Daten während einer Betriebsunterbrechung sicherzustellen, besteht darin, dass man das DFS für Sicherungskopien spezieller, von den Anwendern definierter Dateien konfiguriert. Diese Funktion ergänzt die Hochverfügbarkeit und stellt sicher, dass Dateien und Datenbanken zur Verfügung stehen, wenn man sie braucht.
- Sicherheit. Wie bei jeder Storage-Umgebung müssen Daten vor unautorisierten Zugriffen und Cyberangriffen geschützt werden, die die Daten beschädigen oder zerstören könnten. Datenverschlüsselung sowohl der ruhenden Daten als auch während des Transports erhöht die Datensicherheit und den Datenschutz.
- Mobilität der Anwender. Diese Funktion leitet das Dateiverzeichnis eines Anwenders zu dem Knoten um, wo er oder sie sich einloggt.
- Namensraum (Namespace). Ein Namensraum bezeichnet einen Vorrat an Befehlen und Variablen, die spezifische Aktivitäten vereinfachen. In DFS enthalten Namensräume die nötigen Befehle und damit verknüpften Aktionen, die das DFS zum Funktionieren braucht. Ein einzelner Namensraum, der mehrere Filesysteme unterstützt, generiert eine einheitliche Benutzerschnittstelle. Dann scheint es dem Anwender, als ob alle diese Filesysteme ein Filesystem wären. Namensräume reduzieren auch die Wahrscheinlichkeit von Inhaltsüberschneidungen mit anderen Namensräumen.
Selbständige DFS und Domänen-basierte DFS-Namensräume
Selbständige DFS verwenden kein Active Directory (AD). Stattdessen werden sie lokal mit eigenen Root-Verzeichnissen erzeugt. Sie können nicht mit anderen DFS-Entitäten verbunden werden. Wahrscheinlich deshalb sind sie nicht so verbreitet wie Domain-basierte DFS-Namensräume.
Domain-basierte DFS-Namensräume speichern die Konfiguration eines DFS im AD. Das macht sie einfacher nutzbar und erleichtert den Zugriff aus dem gesamten System.
Stärken und Grenzen von DFS
Die DFS-Technologie sorgt dafür, dass kritische Files und Datenbanken weniger leicht zerstört werden oder verloren gehen. Dafür werden sie über mehrere Storage-Systeme verteilt. Einige dieser Storage-Einheiten befinden sich an anderen Unternehmensniederlassungen oder in der Cloud, was zusätzliche DR-Unterstützung bedeutet. Anwender können Daten leichter zwischen Storage-Knoten verschieben.
Schwierigkeiten entstehen, wenn der File Server, die Anwendungen für die File Storage oder die Storage-Protokolle verändert werden, falls die Veränderungen nicht kompatibel zur DFS/NFS-Anwendung sind. In diesem Fall kann es ohne Sicherheitsvorkehrungen zu Datenverlusten kommen. Dasselbe gilt für Verschiebungen von Daten zwischen Storage-Systemen.