Definition

Datenhygiene

Unter Datenhygiene versteht man alle Prozesse, um die Reinheit von Daten sicherzustellen. Daten gelten dann als rein, wenn sie relativ fehlerfrei sind. Verschmutzte Daten können durch eine Vielzahl von Faktoren verursacht werden. Dazu zählen doppelte Datensätze, unvollständige oder veraltete Daten und das nicht sachgemäße Parsen von Datensatzfeldern durch disparate Systeme. Fehler können an jedem Punkt der Dateneingabe, -speicherung und -verwaltung entstehen.

Die Datenqualität ist äußerst wichtig für Betriebs- und Transaktionsprozesse in Unternehmen und für die Verlässlichkeit des Berichtswesens in den Bereichen Business Analytics (BA) und Business Intelligence (BI).

Datenbereinigung, auch als Datensäuberung bezeichnet, ist der Prozess, mit dem falsche, unvollständige, unzulässig formatierte oder doppelt vorhandene Daten aus einer Datenbank korrigiert oder entfernt werden.

Üblicherweise besteht der Vorgang aus der Aktualisierung, Standardisierung und Deduplizierung von Datensätzen, um eine konsistente Ansicht der Daten zu erzeugen, selbst wenn sie auf mehreren disparaten Systemen gespeichert sind.

Diese Definition wurde zuletzt im April 2013 aktualisiert

Erfahren Sie mehr über Data Governance