Definition

Enterprise Data Hub

Ein Enterprise Data Hub ist ein Big-Data-Managementmodell, das eine Hadoop-Plattform als zentrales Daten-Repository verwendet.  Das Ziel eines Enterprise Data Hubs ist es, einer Organisation eine zentrale, einheitliche Datenquelle zur Verfügung zu stellen, die verschiedene Geschäftsanwender schnell mit den Informationen versorgt, die sie für ihre Arbeit benötigen. 

Enterprise Data Hubs unterscheiden sich von traditionellen Datenmanagementmodellen, weil die Daten an Ort und Stelle bleiben. Beim traditionellen ETL-Modell (Extract, Transform, Load) werden die Daten aus einem System extrahiert, in das erforderliche Format umgewandelt und dann in ein anderes System für Analysen oder andere Geschäftszwecke geladen.

In einem Enterprise-Data-Hub-Modell hingegen werden die Daten zunächst in die Hadoop-Plattform geladen und anschließend Analyse- und Data-Mining-Tools auf die Daten angewendet, wo sie sich im Hub befinden. Das Auslagern der ELT-Verarbeitung auf Hadoop kann eine bessere Integration für disparate Datenquellen bieten und Datenbewegungen und Datenlatenz, die zu Engpässen führen können, reduzieren.

Enterprise Data Hubs wurden entwickelt, um die Herausforderung von Daten zu bewältigen, die in Bezug auf Volumen, Vielfalt und Geschwindigkeit (3Vs) immer größer werden. Der Begriff wird weitgehend mit Cloudera und früher MapR in Verbindung gebracht.

Diese Definition wurde zuletzt im Februar 2021 aktualisiert

Erfahren Sie mehr über Business-Software