vejaa - stock.adobe.com

Wozu brauche ich eine datenzentrierte Architektur?

Anwendungszentrierte Architekturen können die Anforderungen moderner, datengestützter Geschäftsmodelle nicht bedienen. Die Alternative ist eine datenzentrierte Infrastruktur.

Unternehmen generieren mehr Daten als je zuvor. Das belastet ihre Infrastruktur, die für das Verarbeiten, Übertragen und Speichern erforderlich ist. Herkömmliche Datenverwaltungsansätze können nicht mehr mit der Nachfrage Schritt halten, und Unternehmen müssen andere Wege finden, um immer komplexeren und datenintensiveren Workloads gerecht zu werden.

Dieses Problem erfordert mehr als nur schnellere Netzwerke und All-Flash-Speicher-Arrays. Es erfordert eine Umstellung von einer anwendungsorientierten auf eine datenzentrierte Architektur. Das gelingt nur, wenn IT-Entscheider Daten als einen ihrer wichtigsten Vermögenswerte betrachten und entsprechend handeln.

Das Datenmanagement entwickelt sich weiter

Die Datenverwaltungsbranche befindet sich im Umbruch. Unternehmen generieren nicht nur mehr Daten, sondern diese Daten weisen immer unterschiedlichere Formate auf und sind räumlich weit verstreut. Daneben müssen Organisationen eine ganze Menge datenbezogener Vorschriften erfüllen, während auf der anderen Seite Verbraucher einen immer schnelleren Zugriff auf Daten wünschen. Zeitgleich versuchen Unternehmen aus all diesen Daten einen Mehrwert zu generieren, was sich in Trends wie Big Data und Advanced Analytics widerspiegelt.

Daten spielen eine wesentliche Rolle in nahezu jedem Aspekt des täglichen Lebens, sei es im Gesundheitswesen, beim Einkaufen, bei der Unterhaltung oder bei Haushaltsgeräten. Unter solchen Umständen müssen Organisationen eine Architektur einsetzen, die diesen Daten die zentrale Position einräumt, die sie mittlerweile bei der Bereitstellung von Anwendungen und Diensten erfüllen.

Das anwendungszentrierte Paradigma überwinden

Bis vor kurzem haben die meisten Unternehmen einen anwendungsorientierten Ansatz für das Datenmanagement und die Infrastrukturplanung gewählt. Sie behandelten Daten oft als zweitrangig. Aus dieser Perspektive bilden Anwendungen den Kern des Geschäfts und der Architektur; Daten werden zu ihrer Unterstützung um sie herum geplant. Jede Anwendung hält sich an ihr eigenes Datenmodell und verfügt über einen eigenen Datenspeicher, unabhängig davon, ob es sich um eine relationale Datenbank, ein Key Value Repository oder ein anderes Speicherformat handelt.

Der anwendungsorientierte Ansatz führt normalerweise zu redundanten Daten und somit überflüssiger Arbeit. Wenn eine Organisation eine Anwendung plant, wird häufig wenig darüber nachgedacht, wie sie die Daten wiederverwenden oder andere Vorteile aus ihnen ziehen können. Die Anwendung spielt die erste Geige und die Daten werden vernachlässigt.

Unternehmen, die sich an das anwendungsorientierte Modell halten, haben zudem häufig mit Datensilos zu kämpfen, was zu Inkonsistenz und Fehlern führen kann. In einer solchen Umgebung haben Sicherheitsteams Schwierigkeiten, Daten zu schützen und die Einhaltung von Sicherheitsrichtlinien durchzusetzen. Darüber hinaus haben Abteilungen und einzelne Teams oft nur eine Teilperspektive auf Daten, die sie eigentlich gewinnbringend nutzen könnten. Sie können nicht auf die benötigten Informationen zugreifen oder umfassende Analysen durchführen.

Das macht unternehmensweite Strategien kompliziert, zeitaufwändig und teuer in der Implementierung, insbesondere wenn sich das Unternehmen das Ziel gesetzt hat, seine Daten für die gemeinsame Nutzung zu öffnen, zu bereinigen oder zu transformieren. Um die Einschränkungen des anwendungsorientierten Ansatzes auszugleichen, haben viele Unternehmen Data Warehouses, Data Lakes oder andere Technologien und Projekte im Zusammenhang mit Big Data implementiert.

Das bloße Hinzufügen technischer Hilfsmittel trägt aber nur einen kleinen Teil dazu bei, die zugrundeliegenden Probleme mit anwendungsorientierter Architektur zu bewältigen. Darüber hinaus können die Bereitstellung und Wartung solcher Projekte schwierig und teuer sein. Tatsächlich scheitern sie nicht selten und werden teilweise wieder aufgegeben, bevor sie jemals in Produktion gingen.

Was ist eine datenzentrierte Architektur?

Unternehmen bewegen sich aufgrund der Einschränkungen des anwendungsorientierten Ansatzes hin zu einem datenzentrierten Modell. Das neue Paradigma könnte als datenzentrierte Architektur oder datenzentrierte Infrastruktur bezeichnet werden, aber das Ziel ist dasselbe: Daten in den Fokus des Geschehens zu rücken.

Viele Unternehmen mit einer Ausrichtung aufs Onlinegeschäft verfolgen seit ihrer Gründung einen datenorientierten Ansatz. Sie organisieren ihre Infrastruktur und Dienste so, dass die Datenstruktur erhalten bleibt, unabhängig davon, wie einzelne Anwendungen bereitgestellt, aktualisiert, ersetzt oder stillgelegt werden.

In diesem Modell fluktuieren die Anwendungen, doch die Daten bleiben erhalten. Mit dem datenzentrierten Ansatz entwerfen IT-Teams die Infrastruktur nach Datenanforderungen, anstatt Daten an die Infrastruktur anzupassen. Kosten und Benutzerfreundlichkeit spielen zwar ebenfalls eine wichtige Rolle, doch die Daten bestimmen maßgeblich, wie die Infrastruktur aufgebaut ist.

Eine datenzentrierte Architektur betrifft nicht nur die Infrastrukturplanung. Sie wirkt sich auch auf die Anwendungsentwicklung und Geschäftsentscheidungen aus. Wenn eine Organisation beispielsweise eine datenzentrierte Strategie anwendet, erstellt sie Anwendungen so, dass sie das vorhandene Datenmodell nutzen können, statt für jede Anwendung ein spezifisches Modell zu entwickeln.

Ein datenzentrierter Ansatz geht neben der veränderten Infrastruktur ebenso mit einem Wandel der Kultur und Denkweise einher. Erst müssen Unternehmen ihre Datenmanagement- und Auslieferungsstrategien anpassen, dann können sie mit dem Entwickeln passender Anwendungen beginnen. Der datenzentrierte Ansatz eliminiert nicht nur Silos, sondern vereinfacht auch die Datenverwaltung und Anwendungsentwicklung, da alle innerhalb eines gemeinsamen Datenrahmens arbeiten.

So wird Ihr Unternehmen datenzentriert

Um eine datenzentrierte Architektur einzuführen, behandeln Sie Daten als das zentrale Asset, das Ihnen immer erhalten bleibt – auch dann, wenn Ihre Infrastruktur und Anwendungen schon längst ersetzt wurden. Bemühen Sie sich, Silos, Redundanzen und unkontrollierten Wildwuchs zu beseitigen. Implementieren Sie ein einzelnes Datenmodell für mehrere Anwendungen, das erweiterbar genug ist, um auch zukünftige Anforderungen zu erfüllen.

Das bedeutet nicht, dass Sie nur noch eine einzige Datenbank oder einen einzigen Datenspeicher benutzen dürfen, sondern dass Sie eine klare Vorstellung davon haben, wie Ihre Daten in Zukunft aussehen können und dafür eine einheitliche Definition finden.

Die datenzentrierte Infrastruktur erleichtert das Teilen und Verschieben von Daten. Sie unterstützt föderierte Abfragen über mehrere Repositorys hinweg. Sie bietet hohe Verfügbarkeit und Zuverlässigkeit. Sie stellt sicher, dass Unternehmen bei Bedarf und in Echtzeit auf die Daten zugreifen können.

Darüber hinaus ermöglicht eine datenzentrierte Infrastruktur Unternehmen, ihre Daten zu teilen und bereitzustellen, wann und wo sie das für sinnvoll erachten. Im Idealfall bietet sie die erforderliche Leistung, Kapazität, Skalierbarkeit und Sicherheit. Die Infrastruktur kann sich weiterentwickeln, um den sich ändernden Anforderungen der Workloads gerecht zu werden und neue Technologien einzuführen.

Abbildung 1: Der Wechsel zu einer datenzentrierten Infrastruktur unterstützt ein datenbasiertes Geschäftsmodell.
Abbildung 1: Der Wechsel zu einer datenzentrierten Infrastruktur unterstützt ein datenbasiertes Geschäftsmodell.

In den letzten Jahren haben Anbieter Produkte eingeführt, die Unternehmen dabei unterstützen sollen, ihre datenorientierten Ziele zu erreichen. Composable Disaggregated Infrastructure ist flexibel genug, um den sich ändernden Datenanforderungen gerecht zu werden. So stellte Hewlett Packard Enterprise 2015 seine zusammensetzbare Synergy-Infrastruktur-Appliance vor, die IT-Ressourcen schnell und automatisch bereitstellt, um sich ändernden Anforderungen gerecht zu werden.

Einzelne Geräte können die erforderlichen Komponenten hinzufügen, um eine datenzentrierte Infrastruktur umzusetzen. Intel, beispielsweise, bietet seine Xeon-Prozessoren und Optane-Memory- und Speichergeräte gezielt als Lösungen für Unternehmen an, die eine datenzentrierte Lösung suchen.

Laut Intel ermöglichen diese Produkte Benutzern das Speichern, Verarbeiten und Verschieben von Daten über anspruchsvolle Workloads hinweg, einschließlich solcher am Edge und in Umgebungen mit mehreren Clouds. Fungible unterstützt ebenfalls die datenzentrierte Vision.

Das Unternehmen hat eine Reihe von Datenverarbeitungseinheiten (Data Processing Unit, DPU) im Angebot, mit denen sich zwei typische Probleme bei skalierbaren, disaggregierten Rechenzentren beheben lassen sollen: die ineffiziente Ausführung datenzentrierter Berechnungen innerhalb von Serverknoten und der ineffiziente Datenaustausch zwischen Knoten.

Zu diesem Zweck hat Fungible seine DPU in den Fungible Storage Cluster integriert: All-Flash disaggregierter NVMe-oF-Speicher, der laut Angaben des Unternehmens Geschwindigkeiten erreichen kann, die sich einem direkt angeschlossenen NVMe-Speicher annähern, so dass datenzentrierte Workloads effizienter verarbeitet werden.

Geräte allein bilden jedoch keine datenzentrierte Infrastruktur. Stellen Sie zunächst Daten in den Mittelpunkt einer IT-Strategie und bestimmen Sie dann, wie Sie die erforderliche Infrastruktur implementieren können.

Erfahren Sie mehr über Datenverwaltung