Big-Data-Management
Big-Data-Management betrifft die Organisation, Verwaltung und Governance von großen strukturierten und unstrukturierten Datenvolumen.
Das Ziel von Big-Data-Management ist es, einen hohen Grad an Datenqualität zu sichern und darüber hinaus den Zugang für Applikationen aus den Bereichen Business Intelligence und Analytics zu gewährleisten. Unternehmen, Regierungsbehörden und andere Organisationen setzen Management-Strategien für Big Data ein, um die schnell wachsenden Datenmengen beherrschen zu können.
Diese Daten-Pools umfassen in der Regel viele Terabytes oder sogar Petabytes an Informationen, die in unterschiedlichen Dateiformaten gespeichert sind. Effektives Big-Data-Management hilft den Anwendern dabei, wertvolle Informationen in den großen Mengen von unstrukturierten und halbstrukturierten Daten ausfindig zu machen. Die vielfältigen Datenquellen umfassen zum Beispiel auch Telefon-Logdaten, Metadaten von Applikationen oder Geräten und Details von Webseiten im Social-Media-Bereich.
Die meisten Big-Data-Umgebungen gehen über relationale Datenbanken und traditionelle Plattformen für Data Warehouses hinaus: Sie umfassen heute auch Technologien, die in der Lage sind, verschiedene nicht-transaktionale Datenformen herauszufiltern und zu speichern.
Der zunehmende Fokus auf das Sammeln und Analysieren großer Datenmengen führt zu neuen Ansätzen für Plattformen, die traditionelle Data-Warehouse- mit Big-Data-Lösungen verbinden. Das Resultat sind umfassende logische Data-Warehouse-Architekturen.
Teilaufgaben im Rahmen der Analyseprozesse betreffen Entscheidungen darüber, welche Daten aus Compliance-Gründen nicht gelöscht werden dürfen, auf welche Informationen man verzichten kann und welche Daten auf jeden Fall erfasst und analysiert werden müssen, um die Geschäftsprozesse zu verbessern und die Konkurrenzfähigkeit zu erhöhen. Alle diese Entscheidungen erfordern eine sorgfältige Klassifizierung der Informationen mit dem Ziel, kleinere Daten-Sets schneller und produktiver zu analysieren.