Mike Kiev - Fotolia
DataOps: Geschäfts- und Datenstrategie aufeinander abstimmen
Das Motto „Wir brauchen mehr Daten” können Firmen heute ad acta legen. Was sie brauchen sind anwendbare Daten und vor allem intelligenteres Datenmanagement. DataOps kann helfen.
Mit moderner Technologie, etwa dem IoT (Internet of Things, Internet der Dinge) und smarten Sensoren, kann im Unternehmenskontext praktisch alles gemessen werden. Und es hat sich gezeigt: Was gemessen werden kann, wird in aller Regel auch gemessen.
Zu Anfangszeiten der Digitalisierung und mit dem Aufkommen von Data Warehouses war dies auch sinnvoll und richtig: Informationen waren oft Gold wert und Daten, die Auskunft über Prozesse oder den Zustand von Maschinen gaben, waren immens hilfreich.
Heute muss man dies differenzierter betrachten: Daten sind kein Selbstzweck, sie sammeln sich oft schneller an, als die meisten Unternehmen mithalten können. Sie füllen immer riesigere Datenspeicher und erfordern kostspielige Ressourcen zur Verwaltung. In der Praxis umfasst eine durchschnittliche Unternehmensumgebung mittlerweile mehr als acht Data Lakes.
Mehr ist nicht immer besser
Verteilte Datenquellen und Data Lakes verursachen oft mehr Chaos und Störungen, als dass sie einen Mehrwert schaffen. Allein die notwendigen Schritte zur Durchsetzung der Datenqualität in einer solchen dynamischen Situation sind eine große Herausforderung: IT-Manager müssen die Daten nicht nur profilieren, katalogisieren und speichern, sondern auch immer mehr gesetzliche Vorschriften für ihre Verwendung einhalten. Dies ist ein manueller, langsamer und fehleranfälliger Prozess. Ein paar Gründe:
- Bestehende Datensilos behindern den Austausch nützlicher Informationen im Unternehmen, die auch für andere Abteilungen wertvoll sein könnten. Die Daten sind meistens nur teilstrukturiert und nicht sofort nutzbar, da keine Metadaten existieren.
- Es fehlt eine interne Kultur der Daten und der Zusammenarbeit, die für Entscheidungsprozesse eine Rolle spielt.
- Durch überlappende oder parallel gestartete Initiativen sitzen Unternehmen oft auf Daten, die doppelt vorhanden oder deren Herkunft unklar ist. Und ohne verlässliche Datenqualität gilt im Grunde genommen das altbekannte „Garbage in, Garbage out“, was jede Art von Analysen oder Einblicken direkt entwertet. Anders ausgedrückt: Die Ungewissheit über die Herkunft der vorliegenden Informationen behindert Datenfachkräfte bei ihrer Arbeit.
All dies führt dazu, dass Daten ohne Ziel gesammelt, verschwendet und nicht adäquat verwertet werden. Nun könnte man entgegnen, „wer weiß, wann ich die und die Daten einmal benötige“ – aber der Besitz bringt Kosten mit sich, so sind beispielsweise bei personenbezogenen Daten die Risiken für die (Nicht-)Einhaltung von Vorschriften sehr hoch, auch wenn die Unternehmen weiterhin Unsummen ausgeben, um all diese Daten zu verwalten. Hier kann der Einsatz von DataOps Unternehmen helfen, wieder auf Kurs zu kommen und Untiefen zu umschiffen.
Die Zukunft heißt DataOps
In den letzten Jahren hat sich der Begriff Data Operations oder DataOps immer mehr durchgesetzt. DataOps steht für das Management von Unternehmensdaten im Zeitalter der Künstlichen Intelligenz. Damit lassen sich Datenverbraucher und -ersteller nahtlos miteinander verbinden, um Daten jeder Art schnell zu finden und optimal zu nutzen.
Es handelt sich explizit weder um ein Produkt noch einen Service oder eine Lösung, sondern vielmehr um eine Methodik, die einen technologischen und kulturellen Wandel in Gang setzen soll. Durch verstärkte Kooperation und Automatisierung wird die Verwendung von Daten im Unternehmen verbessert, was letzten Endes zu einer höheren Datenzuverlässigkeit und -sicherheit, kürzeren Zyklen für die Informationsbereitstellung und einem per Saldo kostengünstigeren Datenmanagement führt.
Das Konzept orientiert sich an den Praktiken von Lean Manufacturing, Agile und DevOps und hilft Unternehmen, bürokratische Hürden und Komplexitäten zu überwinden, um Analysen schnell und flexibel bereitzustellen – ohne Kompromisse bei der Qualität oder der Datenverwaltung einzugehen. Immer mehr Unternehmen übernehmen die agilen Prinzipien für die Datenverwaltung oder ziehen dies zumindest ernsthaft in Erwägung. Die geschäftlichen Vorteile zahlen sich aus in Form von mehr Innovationen, kürzeren Datenanalysezyklen und letzten Endes mehr Umsatz. Dabei können die positiven Effekte auf folgende Faktoren heruntergebrochen werden:
- Ein gemeinsames Geschäftsverständnis für Daten: Dazu gehört eine Kombination aus einem Datenkatalog und stärkerer Zusammenarbeit bei der Aufbereitung der Daten.
- Die Automatisierung von Datenqualitäts-, Governance- und Compliance-Aufgaben, um sicherzustellen, dass vorliegende Daten auch für die Nutzung geeignet und bereit sind.
- Ein organisatorischer Schwerpunkt auf dem agilen und automatisierten Datenmanagement, bei dem sich Menschen, Prozesse und Technologien auf die Verwaltung solcher Daten konzentrieren, die auf Geschäftsergebnisse und -ziele ausgerichtet sind, während gleichzeitig Governance-Risiken niedrig und Kosten unter Kontrolle gehalten werden.
- Das Aufbrechen von Silos: Hier liegt bei weitem das größte Potential, weil Unternehmen viel schneller arbeiten und neue Produkte auf den Markt bringen können, wenn wertvolle Informationen nicht mehr in einer einzigen Abteilung eingeschlossen sind, sondern im gesamten Unternehmen gemeinsam genutzt werden können.
KI, ML und Automatisierung
Die Grundlage für jeden guten DataOps-Ansatz sind Metadaten. Durch die automatische Erstellung von Metadaten beim Eintritt der Daten (Ingestion) mithilfe von Algorithmen der künstlichen Intelligenz (KI) und des maschinellen Lernens (ML) kann ein Unternehmen den manuellen Aufwand erheblich reduzieren. Das beschleunigt sowohl die Entwicklung von Datenpipelines als auch die Akzeptanz und effektive Analyse in Teams.
„Der Schlüssel zu einer erfolgreichen Datentransformation liegt darin, die Ergebnisse zu definieren und sich über die endgültigen Ziele im Klaren zu sein.“
Jürgen A. Krebs, Hitachi Vantara
Durch die Automatisierung der End-to-End-Verwaltung dieser Metadaten kann die Technologie dann beginnen, ihre Versprechen zu erfüllen. Mit Datenintegrationstechnologien lassen sich Daten aus praktisch jeder Quelle an Bord holen, effektive Mechanismen helfen dabei, die Daten zu katalogisieren und auf die Daten Regeln hinsichtlich ihrer Herkunft anzuwenden.
Was solche Operationen zum Scheitern bringen kann, ist ein iterativer Ansatz, bei dem die Daten von einem Tool zum anderen weitergereicht werden. Hier können KI und ML helfen, die Daten besser zu verstehen und sie bei Bedarf semantisch anzureichern. Darüber hinaus kann die Integration von KI und ML Qualitätsprobleme erkennen und gleichzeitig Governance-Regeln zu den Daten hinzufügen.
Die Transformation
Der Schlüssel zu einer erfolgreichen Datentransformation liegt darin, die Ergebnisse zu definieren und sich über die endgültigen Ziele im Klaren zu sein. Es geht darum, herauszufinden, woher die Daten kommen, die beste Methode für ihre Speicherung und Verwaltung auszuwählen und herauszufinden, wie man sie nutzen kann, um dem Endkunden schnell einen Mehrwert zu bieten.
Gleichzeitig ist ein großer Teil dieser Entwicklung kulturell bedingt. Der Erfolg von DataOps wird insbesondere davon abhängen, dass Silos ein für alle Mal aufgelöst werden und die Zusammenarbeit zwischen Daten- und IT-Teams gefördert wird, so dass ein durchgängiges Designkonzept entwickelt wird und Daten als gemeinsames Gut behandelt werden.
Diese Herausforderungen sind nicht trivial. Aber wenn Unternehmen ihre Datenlage überprüfen, sollten sie ernsthaft darüber nachdenken, Daten wirklich als Assets zu behandeln, die Ergebnisse bringen. Wenn sich alle Beteiligten über das Ziel einig sind, ist DataOps der richtige Weg.
Über den Autor:
Jürgen A. Krebs ist seit Juli 2004 bei Hitachi Vantara tätig und fokussiert sich seit 2021 auf einen großen europäischen Channel Partner, als Sales Director für EMEA. Mit Hilfe seiner umfangreichen Branchenerfahrung von mehr als 40 Jahren gestaltet er die strategische Ausrichtung von Hitachi Vantara mit Fokus auf die Kernkompetenzen des Unternehmens. Der begeisterte Techniker beschäftigt sich in seiner Freizeit leidenschaftlich mit jeglicher Art von Elektronik, Motorenbearbeitung und dem Motocross.