Mike Kiev - Fotolia

Explosion unstrukturierter Daten erfordert modernen Speicher

Neue Entwicklungen wie Internet of Things, Einsatz von Sensoren oder Analytics führen zu einer Vielzahl von Daten. Diese müssen in modernem Speicher abgelegt werden müssen.

Die digitale Transformation ist der wesentliche IT-Trend, der die Modernisierung in den Rechenzentren der Unternehmen unterstützt. Unternehmen installieren heute schnell Web-Scale-Anwendungen, Services für File Sharing, Online-Datenspeicher, Sensoren für das Internet of Things und Analytics-Tools für Big Data.

Während diese digitalen Fortschritte zu neuen Einsichten führen, Prozesse verschlanken und bessere Zusammenarbeit ermöglichen, vergrößern sie aber auch unstrukturierte Daten in einem besorgniserregenden Tempo.

Mit dem Wachstum unstrukturierten Daten zurechtzukommen, kann so zu einer Belastung der bestehenden File-Systeme für Speicher werden, da diese kaum dafür geeignet sind, große Mengen solcher Daten aufzunehmen.

Die Taneja Group untersuchte vor kurzem die am meisten verbreiteten Begrenzungen von File Storage: Laut dieser Studie gehören zu den größten Herausforderungen der IT bei traditionellem File Storage der Mangel an Flexibilität, die geringe Ausnutzung der Kapazitäten, die Unfähigkeit, bis auf Petabyte-Ebenen zu skalieren, und die fehlende Unterstützung von verteilten Daten.

Diese Beeinträchtigungen führen oft zu hohen Speicherkosten, zu einem komplexen Speicher-Management und generell zu einer begrenzten Flexibilität beim Speichern unstrukturierter Daten.

Angesichts dieser Situation stellt sich aber die Frage, wie Unternehmen vorgehen sollen, um das Management-Problem bei unstrukturierten Daten in den Griff zu bekommen. Wie bei allen IT-Einrichtungen handelt es sich im Wesentlichen darum, die richtige Architektur einzurichten.

Für das Speichern von unstrukturierten Daten bedeutet dies, eine hoch skalierbare, zuverlässige, flexible, ökonomisch vernünftige und leicht zugängliche sekundäre Speicherumgebung zu schaffen.

Im Folgenden werfen wir einen näheren Blick auf moderne Speicherumgebungen für unstrukturierte Daten und prüfen, warum verteilte File-Systeme und eine Scale-Out Objekt-Storage-Architektur (kurz Scale-Out Storage) dabei sind, ein wesentlicher Teil von modernem Secondary Storage Management zu werden. 

Skalierbarkeit und Zuverlässigkeit

Wenn man von den enormen Mengen an unstrukturierten Daten ausgeht, ist Skalierbarkeit ohne Zweifel der besondere kritische Aspekt von modernem Secondary Storage. Und hier glänzt Scale-Out Storage besonders.

Für die Verwaltung von solchen großen unstrukturierten Datenmengen ist diese Technologie ideal, weil sie durch einfaches Hinzufügen von Storage Nodes zu Hunderten von Petabytes erweitert werden kann. Dieser besondere Vorteil gegenüber Scale-Up Appliances für File Storage, bei denen es durch den Einsatz von Single- oder Dual-Controllern zu Engpässen kommt, hat mehrere Anbieter von Data Protection dazu gebracht, Scale-Out Plattformen für Secondary Storage herauszubringen. Namhafte Hersteller von solchen Angeboten sind Cohesity, Rubrik und seit kurzem Commvault.

Zuverlässigkeit von Speichersystemen zu erreichen, ist eine andere wichtige Anforderung an modernen Secondary Storage. Zwei Schlüsselfaktoren sind entscheidend, um Speicherzuverlässigkeit zu erlangen.

Der erste ist Fehlertoleranz (Fault Tolerance). Scale-Out Storage ist auf diesem Gebiet ideal, weil Platz sparendes Erasure Coding und flexible Replikations-Policies eingesetzt werden, um Ausfälle von ganzen Seiten, mehreren Nodes oder Festplatten abzufangen oder ganz zu vermeiden.

Der zweite Schlüsselfaktor besteht in schnellem Data Recovery. Für fast augenblickliche Recovery-Zeiten sollten sich IT-Administratoren nach Produkten für Secondary Storage umsehen, die Clones von Backup-Snapshots zur Verfügung stellen, um Anwendungen in Minuten oder sogar Sekunden wiederherzustellen.

Produkte für Secondary Storage müssen es den Administratoren erlauben, wiederhergestellte Anwendungen so lange direkt auf dem Secondary Storage laufen zu lassen, bis die Daten zum primären Storage zurückkopiert sind. Es sollte auch möglich sein, das Recovery von Multi-Tier-Applikationen durchzuführen.

Flexibilität und Kosten

Um mit verschiedenen Anwendungsfällen von unstrukturierten Daten zurechtzukommen, müssen zeitgemäße sekundäre Speichersysteme zudem flexibel sein. Scale-Out Storage sollte deshalb sowohl File- als auch Object-Protokolle wie zum Beispiel NFS für Linux, SMB oder CIFS für Windows und Amazon Simple Storage Service (S3) für webskalierende Anwendungen unterstützen.

Echte System-Flexibilität erfordert auch eine modulare oder zusammengesetzte Architektur, die multidimensionale Erweiterbarkeit und I/O-Flexibilität ermöglicht. Administratoren müssen in der Lage sein, schnell Compute-, Netzwerk- und Storage-Ressourcen verändern zu können, um sich so intensiven Workloads bei IOPS, Durchsatz und Kapazität anzupassen.

Vernünftige Kostenstrukturen spielen bei modernem Secondary Storage ebenfalls eine wichtige Rolle. Scale-Out Storage reduziert die Hardwareausgaben durch den Einsatz von Software-defined Storage, bei dem Standardserver aus der Massenproduktion eingesetzt werden. Ihre Instandhaltung ist darüber hinaus recht einfach.

Administratoren können leicht ein Upgrade durchführen oder Compute Nodes ersetzen, ohne dabei die Daten zwischen den Systemen migrieren zu müssen, was die Verwaltungsarbeiten und Betriebskosten reduziert. Scale-Out Secondary Storage stellt auch die Option zur Verfügung, Daten in kostengünstigen Public-Cloud-Diensten wie Amazon Web Services, Google Cloud und Microsoft Azure zu speichern.

Darüber hinaus verkürzt Scale-Out Storage die Verwaltungszeiten, indem Speichersilos und die strengen hierarchischen Strukturen in File-Appliances verringert werden. Stattdessen werden alle Daten in einem flachen Dateiverzeichnis oder in einem einzigen Storage-Pool gespeichert. Solche Speichersysteme stellen auch eingebaute Suchfähigkeiten für Metadaten zur Verfügung, die den Usern dabei helfen, schnell die jeweils benötigten Daten aufzuspüren.

Einige Hersteller wie zum Beispiel Cohesity bieten Volltext-Suche an, die Compliance-Aufgaben unterstützen, indem Unternehmen schnell Dateien mit sensiblen Daten finden – darunter Passwörter oder Sozialversicherungsnummern. Nimmt man noch die Unterstützung von geografisch verteilten Umgebungen hinzu, wird es noch klarer, dass Scale-Out Storage für das Management von Speicherumgebungen auf großer Stufenleiter wesentlich ist. 

Daten-Management

Der letzte wichtige Punkt im Zusammenhang mit modernen Umgebungen für Secondary Storage betrifft den einfachen Zugang zu Management-Services für die sekundären Daten. In dem Maße, wie die unstrukturierten Daten anwachsen, kann die IT die Arbeit der Storage-Administratoren vereinfachen, indem sie Tools für die Automatisierung des Lebenszyklus der Daten zur Verfügung stellt.

Dies bedeutet, ein Portal, einen Marktplatz oder vordefinierte Module für SLA-Vereinbarungen anzubieten, mit denen die Speichervorgaben für die Daten definiert werden. Diese Parameter umfassen Recovery Points, Aufbewahrungszeiten und die Abfolge von Workloads entsprechend den Regeln eines Unternehmens. Secondary Storage sollte auch in Abstimmung mit den Vorgaben für die Datenbankverwaltung erfolgen – zum Beispiel mit Oracle Recovery Manager.

Offensichtlich sind Distributed File Systems und Architekturen für Scale-Out Objekt-Storage ein Schlüsselfaktor für Angebote von modernem Secondary Storage. Es ist eine Evolution von sekundären Produkt-Portfolios zu beobachten, die die sehr großen Anforderungen für unstrukturierten Datenspeicher in der gegenwärtigen digitalen Ära aufnehmen.

Anwender sollten deshalb aufmerksam verfolgen, was die größeren Hersteller von Data Protection in den nächsten 12 bis 18 Monaten an Scale-OutßProdukten für Secondary Storage auf den Markt bringen werden.

Folgen Sie SearchStorage.de auch auf Twitter, Google+, Xing und Facebook!

Nächste Schritte

Wissenswerte Fakten über Scale-Out Storage.

Welchen Einfluss haben Scale-Out NAS auf das Storage-Management?

Kann Image Cloning beim Daten-Management im NAS helfen?

Erfahren Sie mehr über Storage und Virtualisierung