Definition

Dimensionstabelle

Eine Dimensionstabelle ist eine Tabelle in einem Sternschema eines Data Warehouse. Eine Dimensionstabelle speichert Attribute beziehungsweise Dimensionen, die die Objekte in einer Faktentabelle beschreiben.

Beim Data Warehousing stellt eine Dimension eine Sammlung von Referenzinformationen zu einem messbaren Ereignis dar. Diese Ereignisse werden als Fakten bezeichnet und in einer Faktentabelle gespeichert. Dimensionen kategorisieren und beschreiben Fakten und Messwerte von Data Warehouses so, dass aussagekräftige Antworten auf Geschäftsfragen unterstützt werden. Sie bilden den innersten Kern der Dimensionsmodellierung.

Ein Data Warehouse organisiert beschreibende Attribute als Spalten in Dimensionstabellen. Zum Beispiel könnten die Attribute einer Kundendimension den Vor- und Nachnamen, das Geburtsdatum und das Geschlecht enthalten, während die Dimension einer Website die Attribute für den Sitenamen und die URL umfasst.

Eine Dimensionstabelle besitzt eine Spalte mit dem Primärschlüssel, der jeden Dimensionsdatensatz (Zeile) eindeutig identifiziert. Unter Verwendung dieses Schlüssels wird die Dimensionstabelle mit einer Faktentabelle verknüpft. Daten in der Faktentabelle lassen sich durch verschiedene Kombinationen von Attributen filtern und gruppieren (sogenanntes Slice-and-Dice-Verfahren).

So lässt sich etwa ein Faktenelement Login mit Dimensionen für Kunde, Website und Datum folgendermaßen abfragen: Anzahl der männlichen User zwischen 19 und 25 Jahren, die sich auf der Site beispielseite.com während der letzten Woche mehr als einmal angemeldet haben, gruppiert nach Tag.

Dimensionstabellen werden von Faktentabellen mittels Schlüsseln referenziert. Beim Erstellen einer Dimensionstabelle in einem Data Warehouse wird ein vom System erzeugter Schlüssel verwendet, um eine Zeile in der Dimension eindeutig zu identifizieren. Dieser Schlüssel wird auch als Surrogatschlüssel bezeichnet.

Der Surrogatschlüssel wird als Primärschlüssel in der Dimensionstabelle genutzt. Der Surrogatschlüssel wird in der Faktentabelle untergebracht und ein Fremdschlüssel zwischen den zwei Tabellen festgelegt. Wenn die Daten verknüpft werden, geschieht dies wie jede andere Verknüpfung innerhalb der Datenbank.

Dimensionstabellen sind wie Faktentabellen häufig hochgradig denormalisiert, da diese Strukturen nicht dazu gedacht sind, Transaktionen zu verwalten. Vielmehr sollen mit ihrer Hilfe Nutzer in der Lage sein, Daten so einfach wie möglich zu analysieren.

Diese Definition wurde zuletzt im Juli 2015 aktualisiert

Erfahren Sie mehr über Datenverwaltung