Definition

Data Governance

Data Governance verwaltet die Verfügbarkeit, Nutzbarkeit, Integrität und Sicherheit der Daten in Unternehmenssystemen, basierend auf internen Datenstandards und Richtlinien, die auch die Datennutzung kontrollieren. Eine effektive Data Governance stellt sicher, dass die Daten konsistent und vertrauenswürdig sind und nicht missbraucht werden. Dies wird immer wichtiger, da Unternehmen mit neuen Datenschutzbestimmungen konfrontiert sind und sich immer mehr auf Datenanalysen verlassen, um die Betriebsabläufe zu optimieren und die geschäftliche Entscheidungsfindung voranzutreiben.

Ein gut konzipiertes Data-Governance-Programm umfasst in der Regel ein Governance-Team, einen Lenkungsausschuss, der als Leitungsorgan fungiert, und eine Gruppe von Datenmanagern. Sie arbeiten zusammen, um die Standards und Richtlinien für die Datenverwaltung sowie die Implementierungs- und Durchsetzungsverfahren zu erstellen, die in erster Linie von den Data Stewards durchgeführt werden. Neben den IT- und Datenmanagementteams nehmen auch Führungskräfte und andere Vertreter aus dem operativen Geschäft einer Organisation teil.

Obwohl die Data Governance eine Kernkomponente einer allgemeinen Datenmanagementstrategie ist, sollten sich Organisationen auf die gewünschten Geschäftsergebnisse eines Governance-Programms konzentrieren und nicht auf die Daten selbst, schreibt Gartner-Analyst Andrew White in einem Blogbeitrag vom Dezember 2019. Ein umfassender Leitfaden zur Data Governance klärt, was Data Governance ist, wie es funktioniert, welche geschäftlichen Vorteile es bietet und welche Herausforderungen Data Governance mit sich bringt.

Warum Data Governance wichtig ist

Ohne eine effektive Data Governance können Inkonsistenzen in verschiedenen Systemen innerhalb einer Organisation möglicherweise nicht gelöst werden. Zum Beispiel können Kundennamen in Vertriebs-, Logistik- und Kundenservicesystemen unterschiedlich aufgelistet sein. Dies kann die Datenintegration erschweren und Datenintegritätsprobleme verursachen, die die Genauigkeit von Business Intelligence (BI), Unternehmensberichten und Analyseanwendungen beeinträchtigen. Darüber hinaus können Datenfehler möglicherweise nicht identifiziert und behoben werden, was die BI- und Analysegenauigkeit beeinträchtigt.

Warum Organisationen Daten verwalten müssen
Abbildung 1: Gründe für ein Data-Governance-Programm.

Eine schlechte Data Governance kann auch Initiativen zur Einhaltung gesetzlicher Vorschriften behindern, was Unternehmen, die neue Datenschutzgesetze wie die EU-Datenschutz-Grundverordnung (EU-DSGVO) und den California Consumer Privacy Act (CCPA) einhalten müssen, Probleme bereitet. Ein Data-Governance-Programm für Unternehmen führt in der Regel zur Entwicklung gemeinsamer Datendefinitionen und Standarddatenformate, die in allen Geschäftssystemen angewendet werden, wodurch die Datenkonsistenz sowohl für geschäftliche als auch für Compliance-Zwecke verbessert wird.

Ziele und Vorteile der Data Governance

Ein Hauptziel der Data Governance ist die Auflösung von Datensilos in einer Organisation. Solche Silos bilden sich häufig, wenn einzelne Geschäftseinheiten separate Transaktionsverarbeitungssysteme ohne zentrale Koordination oder eine Unternehmensdatenarchitektur einsetzen. Data Governance zielt darauf ab, die Daten in diesen Systemen durch einen kollaborativen Prozess zu harmonisieren, an dem Akteure aus den verschiedenen Geschäftsbereichen beteiligt sind.

Ein weiteres Data-Governance-Ziel besteht darin, sicherzustellen, dass die Daten ordnungsgemäß verwendet werden, um sowohl die Einführung von Datenfehlern in die Systeme zu vermeiden als auch den potenziellen Missbrauch von persönlichen Daten über Kunden und andere sensible Informationen zu blockieren. Dies kann durch die Schaffung einheitlicher Richtlinien für die Nutzung von Daten sowie durch Verfahren zur Überwachung der Nutzung und zur kontinuierlichen Durchsetzung der Richtlinien erreicht werden. Darüber hinaus kann die Data Governance dazu beitragen, ein Gleichgewicht zwischen Datenerhebungspraktiken und Datenschutzmandaten herzustellen.

Neben genaueren Analysen und einer stärkeren Einhaltung gesetzlicher Vorschriften bietet Data Governance unter anderem folgende Vorteile: verbesserte Datenqualität, niedrigere Datenmanagementkosten und einen besseren Zugang zu den benötigten Daten für Data Scientists, Analysten und Geschäftsanwender.

Data Governance kann dazu beitragen, die Entscheidungsfindung im Unternehmen zu verbessern, indem Führungskräfte bessere Informationen erhalten. Im Idealfall führt dies zu Wettbewerbsvorteilen sowie zu höheren Einnahmen und Gewinnen.

Wer ist für die Data Governance verantwortlich?

In den meisten Organisationen sind verschiedene Personen in den Data-Governance-Prozess involviert. Dazu gehören Führungskräfte, Datenverwaltungsexperten und IT-Mitarbeiter sowie Endanwender, die mit den relevanten Datenbereichen in den Systemen eines Unternehmens vertraut sind. Dies sind die Hauptbeteiligten und ihre Hauptverantwortlichkeiten für die Datenverwaltung:

Chief Data Office (CDO)

Der Chief Data Officer (CDO), falls es einen solchen gibt, ist häufig die oberste Führungskraft, die ein Data-Governance-Programm beaufsichtigt und für dessen Erfolg oder Misserfolg verantwortlich ist. Zu den Aufgaben des CDO gehört es, die Genehmigung, Finanzierung und Personalausstattung für das Programm sicherzustellen, eine führende Rolle bei der Einrichtung des Programms zu spielen, seinen Fortschritt zu überwachen und intern als Fürsprecher für das Programm zu fungieren. Wenn eine Organisation keine CDO hat, wird in der Regel ein anderer C-Level-Vorstand als Verantwortlicher fungieren und die gleichen Funktionen übernehmen.

Data-Governance-Manager und -Team

In einigen Fällen kann der CDO oder eine gleichwertige Führungskraft auch der praktische Data-Governance-Programmmanager sein. In anderen Fällen ernennen Organisationen einen Data-Governance-Manager oder führen speziell das Programm durch. In beiden Fällen leitet der Programmmanager in der Regel ein Data-Governance-Team, das in Vollzeit am Programm arbeitet. Dieses koordiniert den Prozess, leitet Besprechungen und Schulungssitzungen, verfolgt Metriken, verwaltet die interne Kommunikation und führt andere Verwaltungsaufgaben aus.

Data-Governance-Ausschuss

Das Governance-Team trifft jedoch in der Regel keine Entscheidungen über Policies, Richtlinien oder Standards. Dafür ist der Data-Governance-Ausschuss oder -Rat zuständig, der sich in erster Linie aus Geschäftsführern und anderen Dateneigentümern zusammensetzt. Der Ausschuss genehmigt die grundlegende Data-Governance-Richtlinie und die damit verbundenen Richtlinien und Regeln zu Dingen wie Datenzugriff und -nutzung sowie die Verfahren zu deren Umsetzung. Er schlichtet auch Streitigkeiten, wie zum Beispiel Meinungsverschiedenheiten zwischen verschiedenen Geschäftsbereichen über Datendefinitionen und -formate.

Data Stewards

Zu den Aufgaben der Data Stewards gehört es, die Datensätze zu überwachen, um sie in Ordnung zu halten. Sie sind auch dafür verantwortlich, sicherzustellen, dass die vom Data-Governance-Ausschuss genehmigten Richtlinien und Regeln umgesetzt werden und dass die Endanwender diese einhalten. In der Regel werden Mitarbeiter mit Kenntnissen über bestimmte Datenbestände und Domänen ernannt, um die Rolle der Datenverwalter zu übernehmen. In einigen Unternehmen ist dies eine Vollzeitbeschäftigung, in anderen eine Teilzeitstelle; es kann auch eine Mischung aus IT- und Geschäftsdaten-Stewards geben.

Wer ist Teil des Data-Governance-Programms.
Abbildung 2: Wichtige Teilnehmer des Data-Governance-Prozesses.

Datenarchitekten, Datenmodellierer und Datenqualitätsanalysten und -ingenieure sind ebenfalls Teil des Datenmanagementprozesses. Darüber hinaus müssen Geschäftsanwender und Analyseteams in Data-Governance-Richtlinien und Datenstandards geschult werden, damit sie vermeiden können, Daten auf fehlerhafte oder unsachgemäße Weise zu verwenden.

Komponenten eines Data Governance Frameworks

Ein Data Governance Framework besteht aus den Richtlinien, Regeln, Prozessen, Organisationsstrukturen und Technologien, die als Teil eines Governance-Programms eingeführt werden. Außerdem werden darin Dinge wie ein Leitbild für das Programm, seine Ziele und die Art und Weise, wie sein Erfolg gemessen werden soll, sowie die Verantwortlichkeiten für die Entscheidungsfindung und die Rechenschaftspflicht für die verschiedenen Funktionen, die Teil des Programms sein werden, festgelegt. Das Framework sollte dokumentiert und intern ausgetauscht werden, um zu zeigen, wie das Programm funktionieren wird, damit dies für alle Beteiligten von Anfang an klar ist.

Was die Technologie anbelangt, so kann Datenmanagementsoftware dazu verwendet werden, Aspekte der Verwaltung zu automatisieren. Obwohl Data Governance Tools keine obligatorische Framework-Komponente sind, unterstützen sie das Programm- und Workflow-Management, die Zusammenarbeit, die Entwicklung von Governance-Richtlinien, die Prozessdokumentation, die Erstellung von Datenkatalogen und andere Funktionen. Sie können auch in Verbindung mit Tools für Datenqualität, Metadatenverwaltung und Stammdatenverwaltung (Master Data Management, MDM) verwendet werden.

Implementierung der Data Governance

Der erste Schritt bei der Implementierung eines Data-Governance-Frameworks besteht darin, die Eigentümer oder Verwahrer der verschiedenen Datenbestände innerhalb eines Unternehmens zu identifizieren und sie oder benannte Stellvertreter in das Governance-Programm einzubeziehen. Der CDO, der geschäftsführende Sponsor oder der Data-Governance-Manager übernimmt dann die Führung bei der Erstellung der Programmstruktur, arbeitet an der Besetzung des Data-Governance-Teams, identifiziert die Data Stewards und formalisiert den Governance-Ausschuss.

Sobald die Struktur fertiggestellt ist, beginnt die eigentliche Arbeit. Die Richtlinien für die Datenverwaltung und Datenstandards müssen entwickelt werden, zusammen mit Regeln, die festlegen, wie Daten von autorisiertem Personal verwendet werden können. Darüber hinaus sind eine Reihe von Kontrollen und Prüfverfahren erforderlich, um die fortlaufende Einhaltung interner Richtlinien und externer Vorschriften zu gewährleisten und sicherzustellen, dass die Daten anwendungsübergreifend konsistent verwendet werden. Das Governance-Team sollte auch dokumentieren, woher die Daten stammen, wo sie gespeichert sind und wie sie vor Pannen und Sicherheitsangriffen geschützt werden.

Data Governance-Initiativen umfassen in der Regel auch folgende Elemente:

Mapping und Klassifizierung. Das Mapping der Daten in Systemen hilft bei der Dokumentation von Datenbeständen und des Datenflusses durch eine Organisation. Verschiedene Datensätze können dann auf der Grundlage von Faktoren klassifiziert werden, zum Beispiel ob sie persönliche Informationen oder andere sensible Daten enthalten. Die Klassifizierungen beeinflussen die Art und Weise, wie Data-Governance-Richtlinien auf einzelne Datensätze angewendet werden.

Geschäftsglossar. Ein Business- oder Geschäftsglossar enthält Definitionen von Geschäftsbegriffen und -konzepten, die in einer Organisation verwendet werden, zum Beispiel was einen aktiven Kunden ausmacht. Indem sie helfen, ein gemeinsames Vokabular für Geschäftsdaten zu schaffen, können Geschäftsglossare die Bemühungen um die Unternehmensführung unterstützen.

Datenkatalog. Datenkataloge sammeln Metadaten aus Systemen und verwenden sie, um ein indexiertes Inventar der verfügbaren Datenbestände zu erstellen, das Informationen über die Datenherkunft, Suchfunktionen und Collaboration-Werkzeuge enthält. Informationen über Data-Governance-Richtlinien und automatisierte Mechanismen zu deren Durchsetzung können ebenfalls in Kataloge eingebaut werden.

Best Practices für die Verwaltung von Data-Governance-Initiativen

In dem Maße, in dem die Data Governance Einschränkungen bei der Handhabung und Nutzung von Daten auferlegen kann, kann sie in Organisationen kontrovers sein. Eine häufige Sorge unter IT- und Datenmanagementteams ist, dass sie von Geschäftsanwendern als eine Art Datenpolizei angesehen werden, wenn sie Data-Governance-Programme leiten. Um die Zustimmung der Benutzer zu fördern und Widerstand gegen Governance-Richtlinien zu vermeiden, empfehlen erfahrene Data-Governance-Manager und Branchenberater, dass Programme geschäftsorientiert sein sollten, wobei die Dateneigentümer einbezogen werden und der Governance-Ausschuss die Entscheidungen über Standards, Richtlinien und Regeln trifft.

Schulung und Ausbildung im Bereich Data Governance ist ein notwendiger Bestandteil von Initiativen, insbesondere um Geschäftsanwender und Datenanalysten mit den Regeln für die Datennutzung, den Datenschutzbestimmungen und ihrer Verantwortung für die Konsistenz von Datensätzen vertraut zu machen. Auch die kontinuierliche Kommunikation mit Unternehmensleitern, Geschäftsführern und Endbenutzern über den Fortschritt eines Data-Governance-Programms ist ein Muss, und zwar über eine Kombination aus Berichten, E-Mail-Newslettern, Workshops und anderen Outreach-Methoden.

In einem im Oktober 2019 veröffentlichten Bericht listete der Gartner-Analyst Saul Judah diese sieben Grundlagen für eine erfolgreiche Verwaltung von Daten- und Analyseanwendungen auf:

  • ein Fokus auf Geschäftswert und organisatorische Ergebnisse;
  • eine interne Vereinbarung über Datenverantwortung und Entscheidungsrechte;
  • ein auf Vertrauen basierendes Governance-Modell, das sich auf Datenabstammung und Kuration stützt;
  • eine transparente Entscheidungsfindung, die sich an eine Reihe ethischer Grundsätze hält;
  • Risikomanagement und Datensicherheit als zentrale Governance-Komponenten;
  • ständige Aus- und Weiterbildung mit Mechanismen zur Überwachung ihrer Wirksamkeit; und
  • eine Kultur der Zusammenarbeit und einen Governance-Prozess, der eine breite Beteiligung fördert.

Data-Governance-Herausforderungen

Häufig sind die ersten Schritte bei Data-Governance-Bemühungen die schwierigsten, da es charakteristisch ist, dass verschiedene Teile einer Organisation unterschiedliche Ansichten über wichtige Unternehmensdateneinheiten wie Kunden oder Produkte haben. Diese Differenzen müssen als Teil des Data-Governance-Prozesses gelöst werden – zum Beispiel durch die Einigung auf gemeinsame Datendefinitionen und -formate. Das kann ein schwieriges und aufwendiges Unterfangen sein, weshalb der Data-Governance-Ausschuss ein klares Streitbeilegungsverfahren benötigt.

Weitere häufige Herausforderungen, mit denen Organisationen bei der Datenverwaltung konfrontiert sind:

Demonstration ihres Geschäftswerts. Das fängt oft ganz am Anfang an: „Es kann ein echter Kampf sein, seine Data-Governance-Initiative überhaupt erst durchzusetzen", schrieb die Data-Governance-Beraterin und -Ausbilderin Nicola Askham in einem Blogbeitrag vom September 2019. Um bei der Erstellung eines Business Case für ein Data-Governance-Programm zu helfen, empfahl Askham den Befürwortern, Horrorgeschichten über Datenqualität zu dokumentieren und die erwarteten Ergebnisse des Programms mit spezifischen Unternehmensprioritäten zu verknüpfen.

Auf kontinuierlicher Basis erfordert der Nachweis des Geschäftswerts die Entwicklung quantifizierbarer Metriken, insbesondere zur Verbesserung der Datenqualität. Dazu könnten die Anzahl der auf vierteljährlicher Basis gelösten Datenfehler und die daraus resultierenden Umsatzgewinne oder Kosteneinsparungen gehören. Andere gebräuchliche Datenqualitätsmetriken messen die Genauigkeit und Fehlerraten in Datensätzen und damit verbundene Attribute wie Datenvollständigkeit und -konsistenz.

Unterstützung von Self-Service-Analysen. Die Self-Service-BI- und Analyse-Bewegung hat neue Herausforderungen für die Daten-Governance geschaffen, indem sie die Daten in die Hände von mehr Anwendern in den Unternehmen gebracht hat. Governance-Programme müssen sicherstellen, dass die Daten korrekt und für Self-Service-Benutzer zugänglich sind, und gleichzeitig sicherstellen, dass diese Benutzer – unter anderem Geschäftsanalysten, Führungskräfte und Citizen Data Scientists – die Daten nicht missbrauchen oder mit Datenschutz- und Sicherheitseinschränkungen in Konflikt geraten. Das Streaming von Daten, die für Echtzeit-Analysen verwendet werden, erschwert diese Bemühungen zusätzlich.

Big Data Governance. Der Einsatz von Big-Data-Systemen bringt auch neue Verwaltungsanforderungen und Herausforderungen mit sich. Datenmanagementprogramme konzentrierten sich traditionell auf strukturierte Daten, die in relationalen Datenbanken gespeichert sind, müssen aber mittlerweile mit der Mischung aus strukturierten, unstrukturierten und halbstrukturierten Daten umgehen, die Big-Data-Umgebungen normalerweise enthalten, sowie mit einer Vielzahl von Datenplattformen, einschließlich Hadoop- und Spark-Systemen, NoSQL-Datenbanken und Cloud Object Storage. Außerdem werden große Datensätze oft in Rohform in Data Lakes gespeichert und dann nach Bedarf für Analysezwecke gefiltert.

Data-Governance-Programme

Data-Governance-Programme werden durch mehrere andere Facetten des gesamten Datenverwaltungsprozesses unterstützt. Dazu gehören:

Data Stewardship. Wie bereits angedeutet, besteht eine wesentliche Verantwortung des Data Stewards darin, für einen Teil der Daten einer Organisation verantwortlich zu sein, mit Aufgaben in Bereichen wie Datenqualität, -sicherheit und -nutzung. Teams von Data Stewards werden in der Regel gebildet, um die Umsetzung von Data-Governance-Richtlinien zu lenken und auszuführen. Häufig handelt es sich dabei um datenversierte Geschäftsanwender, die Experten auf ihrem Gebiet sind, wenngleich ein Data Steward auch eine IT-Position sein kann. Data Stewards arbeiten mit Datenqualitätsanalysten, Datenbankadministratoren und anderen Datenverwaltungsexperten zusammen, während sie gleichzeitig mit Geschäftsbereichen zusammenarbeiten, um Datenanforderungen und -probleme zu identifizieren.

Datenqualität. Die Verbesserung der Datenqualität ist eine der größten treibenden Kräfte hinter Data-Governance-Aktivitäten. Datengenauigkeit, Vollständigkeit und Konsistenz über Systeme hinweg sind entscheidende Merkmale erfolgreicher Governance-Initiativen. Datenbereinigung, auch als Data Scrubbing bekannt, ist ein gemeinsames Datenqualitätselement. Es behebt Datenfehler und Inkonsistenzen und entfernt außerdem doppelte Instanzen derselben Datenelemente und harmonisiert so die verschiedenen Arten, in denen derselbe Kunde oder dasselbe Produkt in Systemen gelistet sein kann. Datenqualitätswerkzeuge stellen diese Fähigkeiten unter anderem durch Funktionen zur Datenprofilierung, zum Parsing und zum Abgleich von Daten bereit.

Master Data Management (MDM). MDM ist eine weitere Datenmanagementdisziplin, die eng mit Data-Governance-Prozessen verbunden ist. MDM-Initiativen richten einen Stammdatensatz über Kunden, Produkte und andere Geschäftseinheiten ein, um sicherzustellen, dass die Daten in verschiedenen Systemen innerhalb eines Unternehmens konsistent sind. Infolgedessen ist MDM natürlich mit der Data Governance verzahnt. Wie bei Governance-Programmen können jedoch auch MDM-Bemühungen in Unternehmen aufgrund der Unterschiede zwischen Abteilungen und Geschäftseinheiten hinsichtlich der Formatierung von Stammdaten zu Kontroversen führen. Darüber hinaus hat die Komplexität von MDM im Vergleich zur Data Governance seine Akzeptanz eingeschränkt.

Anwendungsfälle für Data Governance. Effektive Data Governance ist das Herzstück des Datenmanagements, die in operativen Systemen und den BI- und Analyseanwendungen verwendet werden, die von Data Warehouses, Data Marts und Data Lakes gespeist werden. Sie ist auch eine besonders wichtige Komponente bei Initiativen zur digitalen Transformation und kann bei anderen Unternehmensprozessen hilfreich sein, zum Beispiel beim Risikomanagement, Business Process Management (BPM) und bei Fusionen und Übernahmen. Da sich die Datennutzung immer weiter ausbreitet und neue Technologien aufkommen, wird Data Governance wahrscheinlich eine noch breitere Anwendung finden. Beispielsweise gibt es Bemühungen, Data-Governance-Prozesse auf Machine-Learning-Algorithmen und andere KI-Tools anzuwenden. Darüber hinaus haben öffentlichkeitswirksame Datenverstöße und Vorschriften wie die EU-DSGVO und der California Consumer Privacy Act den Datenschutz und die Privatsphäre in den Mittelpunkt der Governance-Bemühungen gerückt.

Die vier Säulen der Data Governance.
Abbildung 3: Einige der Kernelemente von Data-Governance-Initiativen.

Data-Governance-Anbieter und Tools

Data Governance Tools sind von verschiedenen Anbietern erhältlich. Dazu gehören große IT-Anbieter wie IBM, Informatica, Information Builders, Oracle, SAP und SAS Institute sowie Datenmanagementspezialisten wie Adaptive, ASG Technologies, Ataccama, Collibra, Erwin, Infogix und Talend. In den meisten Fällen werden die Governance Tools als Teil größerer Suiten angeboten, die auch Funktionen zur Verwaltung von Metadaten und Datenabstammung enthalten.

Datenkatalogsoftware ist auch in vielen der Data-Governance- und Metadatenmanagementplattformen enthalten. Sie ist auch als eigenständiges Produkt von Anbietern wie Alation, Alteryx, Boomi, Cambridge Semantics und Data.world erhältlich.

Diese Definition wurde zuletzt im September 2020 aktualisiert

Erfahren Sie mehr über Datenverwaltung