Online Analytical Processing (OLAP)
Was ist OLAP (Online Analytical Processing)?
Online Analytical Processing, kurz OLAP, ist eine Verarbeitungsmethode, die es Benutzern ermöglicht, Daten einfach und selektiv zu extrahieren und abzufragen, um sie unter verschiedenen Gesichtspunkten zu analysieren. Business-Intelligence-Abfragen (BI) mit OLAP unterstützen oft bei Trendanalysen, Finanzberichten, Umsatzprognosen, Budgetierung und anderen Planungszwecken.
Ein Benutzer kann beispielsweise eine Datenanalyse anfordern, um eine Tabelle anzuzeigen, die alle im Monat Juli in Deutschland verkauften Strandballprodukte eines Unternehmens enthält. Er kann die Umsatzzahlen mit denen für dieselben Produkte im September vergleichen und dann einen Vergleich der anderen Produktverkäufe im selben Zeitraum sehen.
Wie OLAP-Systeme funktionieren
Um diese Art von Analyse zu ermöglichen, werden Daten aus verschiedenen Quellen gesammelt und in Data Warehouses gespeichert, dann bereinigt und in Datenwürfeln organisiert. Jeder OLAP-Würfel enthält Daten, die nach Dimensionen (zum Beispiel Kunden, geografische Verkaufsregion und Zeitraum) kategorisiert sind, die von Dimensionstabellen in den Data Warehouses abgeleitet wurden. Die Dimensionen werden dann durch Kunden (wie Kundennamen, Länder und Monate) aufgefüllt, die hierarchisch organisiert sind. OLAP-Würfel werden häufig über Dimensionen hinweg vorverdichtet, um die Abfragezeit gegenüber relationalen Datenbanken drastisch zu verkürzen.
Analysten können dann fünf Arten von OLAP-Analyseoperationen mit diesen multidimensionalen Datenbanken durchführen:
- Roll-up. Dieser Vorgang wird auch als Konsolidierung oder Drill-up bezeichnet und fasst die Daten entlang der Dimension zusammen.
- Drill-down. Dies ermöglicht es Analysten, tiefer in den Dimensionen der Daten zu navigieren. Zum Beispiel kann man von Zeitraum auf Jahre und Monate heruntergehen, um das Umsatzwachstum für ein Produkt darzustellen.
- Slice. Dies ermöglicht es einem Analysten, eine Informationsebene zur Anzeige zu nehmen, wie zum Beispiel Umsatz im Jahr 2024.
- Dice. Damit kann ein Analyst Daten aus mehreren Dimensionen zur Analyse auswählen, zum Beispiel Verkäufe von blauen Strandbällen in Deutschland im Jahr 2024.
- Pivot. Analysten können eine neue Sicht auf die Daten gewinnen, indem sie die Datenachsen des Würfels drehen.
Die OLAP-Software sucht den Schnittpunkt der Dimensionen, zum Beispiel alle in der Region Nord verkauften Produkte über einem bestimmten Preis in einem bestimmten Zeitraum, und zeigt sie an. Das Ergebnis ist die Kennzahl; jeder OLAP-Würfel hat mindestens eine bis vielleicht Hunderte von Kennzahlen, die sich aus Informationen ableiten, die in Faktentabellen im Data Warehouse gespeichert sind.
Arten von OLAP-Systemen
OLAP-Systeme lassen sich in der Regel in eine von drei Arten einteilen:
- Multidimensionales OLAP (MOLAP) ist OLAP, das direkt in eine multidimensionale Datenbank indiziert.
- Relationales OLAP (ROLAP) ist OLAP, das eine dynamische multidimensionale Analyse von Daten durchführt, die in einer relationalen Datenbank gespeichert sind.
- Hybrid OLAP (HOLAP) ist eine Kombination aus ROLAP und MOLAP. HOLAP kombiniert die größere Datenkapazität von ROLAP mit der überlegenen Verarbeitungsfähigkeit von MOLAP.
OLTP versus OLAP
OLAP konzentriert sich auf die Datenanalyse zur Gewinnung von Geschäftserkenntnissen, während sich Online-Transaktionsverarbeitung (Online Transaction Processing, OLTP) auf die Echtzeitverarbeitung von Online-Transaktionen konzentriert. OLTP wird für die Ausführung von Online-Datenbanktransaktionen verwendet, die von Angestellten wie Kassierern und Bankangestellten erstellt werden. Kundenselbstbedienungsanwendungen wie Online-Banking, Reisen und E-Commerce erzeugen ebenfalls Datenbanktransaktionen und sind mit OLTP-Systemen verbunden. OLTP kann eine Datenquelle für OLAP-Systeme sein.
Verwendungszwecke von OLAP
OLAP kann für das Data Mining oder die Entdeckung von bisher unentdeckten Beziehungen zwischen Datenelementen verwendet werden. Eine OLAP-Datenbank muss nicht so groß sein wie ein Data Warehouse, da nicht alle Transaktionsdaten für die Trendanalyse benötigt werden. Mit Open Database Connectivity können Daten aus bestehenden relationalen Datenbanken importiert werden, um eine multidimensionale Datenbank für OLAP zu erstellen.
Zu den OLAP-Produkten gehören IBM Cognos, Microsoft Power BI, Oracle OLAP und Tableau. OLAP-Funktionen sind auch in Tools wie Microsoft Excel und den Analysis Services von Microsoft SQL Server enthalten. OLAP-Produkte sind in der Regel für Mehrbenutzerumgebungen konzipiert, wobei sich die Kosten für die Software nach der Anzahl der Benutzer richten.