Definition

Datenvisualisierung

Datenvisualisierung bezeichnet das Übertragen von Informationen in einen visuellen Kontext, wie zum Beispiel eine Karte oder ein Diagramm, um Daten für das menschliche Gehirn leichter verständlich zu machen und daraus Erkenntnisse zu gewinnen. Das Hauptziel der Datenvisualisierung ist es, das Erkennen von Mustern, Trends und Ausreißern in großen Datensätzen zu erleichtern. Der Begriff wird oft austauschbar mit anderen Begriffen verwendet, darunter Informationsgrafiken, Informationsvisualisierung und statistische Grafiken.

Die Datenvisualisierung ist einer der Schritte in der Arbeit von Data Scientists. Sie sammeln, verarbeiten und modellieren Daten nicht nur, sondern müssen sie auch visualisier, damit Schlussfolgerungen gezogen werden können. Die Datenvisualisierung ist auch ein Element der breiteren Disziplin der Datenpräsentationsarchitektur (DPA), bei der es darum geht, Daten auf möglichst effiziente Weise zu identifizieren, lokalisieren, behandeln, formatieren und zu vermitteln.

Datenvisualisierung ist für fast jeden Beruf wichtig. Sie kann von Lehrern verwendet werden, um Testergebnisse von Studenten anzuzeigen, von Informatikern, die Fortschritte in der künstlichen Intelligenz (KI) erforschen, oder von Führungskräften, die in Präsentationen schnell viele Daten vermitteln wollen. Sie spielt auch eine wichtige Rolle bei Big-Data-Projekten. Da die Unternehmen in den ersten Jahren des Trends zu Big Data massive Datensammlungen anhäuften, benötigten sie eine Möglichkeit, schnell und einfach einen Überblick über diese zu erhalten. Visualisierungstools waren eine natürliche Ergänzung.

Aus ähnlichen Gründen ist die Visualisierung für fortgeschrittene Analysen von zentraler Bedeutung. Wenn ein Data Scientist fortgeschrittene Predictive Alanytics einsetzt oder Algorithmen für maschinelles Lernen schreibt, wird es wichtig, die Ausgaben zu visualisieren, um die Ergebnisse zu überwachen und sicherzustellen, dass die Modelle wie beabsichtigt funktionieren. Visualisierungen komplexer Algorithmen sind im Allgemeinen leichter zu interpretieren als numerische Ausgaben.

Warum ist die Datenvisualisierung wichtig?

Datenvisualisierung bietet eine schnelle und effektive Möglichkeit, Informationen auf eine auch Nicht-Experten zugängliche Weise mit Hilfe visueller Informationen zu vermitteln. Sie kann Unternehmen auch dabei helfen, zu erkennen, welche Faktoren das Kundenverhalten beeinflussen oder Bereiche zu identifizieren, die verbessert werden müssen oder mehr Aufmerksamkeit benötigen, Daten für die Beteiligten einprägsamer zu machen, zu verstehen, wann und wo bestimmte Produkte platziert werden müssen, und Verkaufsvolumen vorherzusagen.

Weitere Vorteile der Datenvisualisierung sind

  • schnelles und verbessertes Aufnehmen von Informationen und dadurch schnellere Entscheidungen;
  • ein genaueres Verständnis von den nächsten Schritten, die zur Verbesserung der Organisation unternommen werden müssen;
  • eine verbesserte Fähigkeit, das Interesse des Publikums durch leicht verständliche Informationen aufrechtzuerhalten;
  • eine Vereinfachung des Teilens von Informationen, so dass möglichst alle Beteiligten Zugang zu diesen haben;
  • weniger Data Scientists müssen beschäftigt werden, da die Daten leichter zugänglich und verständlicher sind; und

Datenvisualisierung und Big Data

Die zunehmende Popularität von Big Data und deren Analyse hat die Visualisierung wichtiger denn je gemacht. Unternehmen setzen zunehmend maschinelles Lernen ein, da es langwierig und schwierig sein kann, Big Data, zu sortieren, zu verstehen und auszuwerten. Die Visualisierung bietet eine Möglichkeit, dies zu beschleunigen und Informationen für Geschäftsinhaber und Interessenvertreter verständlich zu präsentieren.

Die Visualisierung großer Datenmengen geht oft über die typischen Techniken hinaus, die bei der normalen Visualisierung verwendet werden, wie zum Beispiel Torten- und Balkendiagramme oder Liniendiagramme. Stattdessen werden komplexere Darstellungen verwendet, wie zum Beispiel Heat Maps und Fieberdiagramme. Für die Visualisierung großer Datenmengen sind leistungsfähige Computersysteme erforderlich, um Rohdaten zu sammeln, zu verarbeiten und in grafische Darstellungen zu verwandeln, mit denen Menschen schnell Erkenntnisse gewinnen können.

Während die Visualisierung großer Daten vorteilhaft sein kann, kann sie für Organisationen mehrere Nachteile mit sich bringen:

  • Um das Beste aus großen Datenvisualisierungstools herauszuholen, muss ein Visualisierungsspezialist eingestellt werden. Dieser Spezialist muss in der Lage sein, die besten Datensätze und Visualisierungsstile zu identifizieren, um zu gewährleisten, dass Organisationen die Nutzung ihrer Daten optimieren.
  • Große Datenvisualisierungsprojekte erfordern oft eine Beteiligung der IT-Abteilung und des Managements, da die Visualisierung großer Daten leistungsstarke Computerhardware, effiziente Speichersysteme oder sogar einen Umzug in die Cloud
  • Die Erkenntnisse, die durch die Visualisierung großer Datenmengen gewonnen werden, sind nur so genau wie die Informationen, die visualisiert werden. Daher ist es unerlässlich, dass Mitarbeiter und Prozesse vorhanden sind, um die Qualität von Unternehmensdaten, Metadaten und Datenquellen zu gewährleisten und zu kontrollieren.

Beispiele für Datenvisualisierung

In den frühen Tagen der Visualisierung war die gebräuchlichste Visualisierungstechnik die Verwendung einer Microsoft-Excel-Tabelle, um Informationen aus einer Tabelle in ein Balken- oder Tortendiagramm umzuwandeln. Diese Visualisierungsmethoden werden zwar immer noch häufig verwendet, aber inzwischen stehen auch kompliziertere Techniken zur Verfügung:

  • Infografiken
  • Blasendiagramme
  • Bullet Graphs
  • Heatmaps
  • Fieber-Diagramme

Einige andere beliebte Visualisierungsformen sind:

Liniendiagramme: Dies ist eine der grundlegendsten und am häufigsten verwendeten Visualisierungsformen. Liniendiagramme zeigen, wie sich Variablen im Laufe der Zeit verändern können.

Flächendiagramme: Diese Visualisierungsmethode ist eine Variation eines Liniendiagramms; sie zeigt mehrere Werte in einer Zeitreihe an – oder eine Folge von Daten, die zu aufeinander folgenden Zeitpunkten mit gleichem Abstand gesammelt wurden.

Diagramm-Beispiel
Abbildung 1: Beispiel für ein Balkendiagramm

Streudiagramme: Diese Technik zeigt die Beziehung zwischen zwei Variablen an. Ein Streudiagramm hat die Form einer x- und y-Achse mit Punkten zur Darstellung von Datenpunkten.

Baumdiagramme: Diese Methode zeigt hierarchische Daten in einem verschachtelten Format. Die Größe der für jede Kategorie verwendeten Rechtecke ist proportional zu ihrem prozentualen Anteil am Ganzen. Baumdiagramme werden am besten verwendet, wenn mehrere Kategorien vorhanden sind und das Ziel darin besteht, verschiedene Teile eines Ganzen zu vergleichen.

Anwendungsfälle für die allgemeine Datenvisualisierung

Häufige Anwendungsbereiche für die Datenvisualisierung sind unter anderem:

Vertrieb und Marketing. Online-Marketing ist auch weiterhin ein wachsender Markt. Infolgedessen müssen Marketing-Teams genau darauf achten, aus welchen Quellen Traffic kommt und wie ihre Assets im Netz Einnahmen generieren. Die Datenvisualisierung macht es leicht, Trends und deren Korrelation zu verschiedenen Marketingaktionen zu erkennen.

Politik. In der Politik kommen gerade im Zusammenhang mit Wahlen allerlei Diagramme zum Einsatz. Sitzverteilungen in Parlamenten werden mit Tortendiagrammen dargestellt, Gewinne und Verluste mit Balkendiagrammen, geographische Wählerverteilung mit eingefärbten Bereichen in Karten und Wählerwanderungen mit Flowcharts.

Gesundheitswesen. Fachleute im Gesundheitswesen verwenden häufig Choroplethenkarten, um wichtige Gesundheitsdaten zu visualisieren. Eine Choroplethenkarte zeigt unterteilte geographische Gebiete oder Regionen an, denen in Bezug auf eine numerische Variable eine bestimmte Farbe zugeordnet ist. Choroplethenkarten ermöglichen es Fachleuten, zu sehen, wie sich eine Variable, wie zum Beispiel die Sterblichkeitsrate bei Herzkrankheiten, in bestimmten Gebieten verändert.

Wissenschaft. Auch außerhalb der Informatik sammeln Wissenschaftler oft große Datenmengen, die in ihrer visualisierten Form oft auf den ersten Blick erlauben, Besonderheiten und Korrelationen zu erkennen.

Finanzwesen. Finanzexperten müssen die Performance ihrer Investitionen verfolgen, um sich für den Kauf oder Verkauf eines Vermögenswerts zu entscheiden. Sogenannte Candlestick-Charts (wörtlich: Kerzenständerdiagramme) werden verwendet, um für die Finanzexperten Preisbewegungen und Trends sichtbar zu machen, indem sie wichtige Informationen wie Wertpapiere, Währungen, Aktien, Anleihen und Rohstoffe anzeigen.

Logistik. Reedereien können Visualisierungstools verwenden, um die besten globalen Versandrouten zu ermitteln.

Data Science. Die von Data Scientists erstellten Visualisierungen sind in der Regel für den eigenen Gebrauch des Wissenschaftlers oder zur Präsentation der Informationen für ein ausgewähltes Publikum bestimmt. Die visuellen Darstellungen werden mit Visualisierungsbibliotheken der gewählten Programmiersprachen und Werkzeuge erstellt. Data Scientists verwenden sowohl Open-Source-Programmiersprachen – wie Python – als auch proprietäre Werkzeuge, die für komplexe Datenanalysen entwickelt wurden. Die von diesen Datenwissenschaftlern und Forschern durchgeführte Datenvisualisierung hilft ihnen, Datensätze zu verstehen und Muster und Trends zu erkennen, die sonst unbemerkt geblieben wären.

Zeitstrahl: Geschichte der Datenvisualisierung
Abbildung 2: Die Geschichte der Datenvisualisierung – visualisiert.

Die Wissenschaft der Datenvisualisierung

Die wissenschaftliche Beschäftigung mit Datenvisualisierung verlangt ein Verständnis davon, wie Menschen Informationen sammeln und verarbeiten. Daniel Kahn und Amos Tversky haben mit ihrem Mitarbeitern Modelle von den zwei Arten entwickelt, wie Menschen Informationen erfassen und verarbeiten.

System 1 konzentriert sich auf die Gedankenverarbeitung, die schnell, automatisch und unbewusst erfolgt. Diese Methode wird im täglichen Leben häufig angewendet und hilft dabei:

  • bekannte Texte (zum Beispiel auf einem Schild) schnell zu erfassen;
  • einfache mathematischer Probleme, wie 1+1 zu lösen;
  • Geräusche zu orten;
  • Fahrrad zu fahren; und
  • den Unterschied zwischen Farben zu bestimmen.

System 2 konzentriert sich auf langsame, logische, berechnende und seltenere Verarbeitungsvorgänge. Diese Methode wird verwendet beim

  • Aufsagen einer Telefonnummer;
  • Lösen komplexer mathematischer Probleme, wie 132 x 154;
  • Bestimmen des Bedeutungsunterschieds zwischen mehreren nebeneinander stehenden Zeichen; und
  • Verstehen komplexer sozialer Zusammenhänge.

Datenvisualisierungstools

Datenvisualisierungstools können auf verschiedene Weise verwendet werden. Oft kommen sie in Business-Intelligence-Anwendung für die Auswertung vor. Benutzer können Visualisierungstools einrichten, um automatische Dashboards zu generieren, die die Unternehmensleistung über Key Performance Indicators (KPIs) verfolgen und die Ergebnisse visuell interpretieren.

Die generierten Bilder können auch interaktive Funktionen enthalten, die es den Benutzern ermöglichen, sie zu manipulieren oder die Daten zur Befragung und Analyse genauer zu betrachten. Oft lassen sich für diese Daten auch Warnungen bei der Überschreitung bestimmter Schwellwerte einstellen.

Viele IT-Teams implementieren Datenvisualisierungssoftware, um ihre eigenen Projekte zu verfolgen. Oder ein Marketing-Team könnte so eine Software verwenden, um die Leistung einer E-Mail-Kampagne zu überwachen und Metriken wie Öffnungsrate, Klickrate und Konversionsrate zu verfolgen.

Da die Anbieter von Datenvisualisierung die Funktionalität dieser Tools erweitern, werden sie zunehmend als Front-End für anspruchsvollere große Datenumgebungen eingesetzt. In dieser Umgebung hilft Datenvisualisierungssoftware Dateningenieuren und Wissenschaftlern, Datenquellen zu verfolgen und grundlegende explorative Analysen von Datensätzen vor oder nach detaillierteren fortgeschrittenen Analysen durchzuführen.

Viele bekannte große Softwarehersteller wie IBM und Microsoft bieten Visualisierungswerkzeuge – es gibt aber auch zahlreiche kleinere, hochspezialisierte Anbieter auf dem Markt.

Diese Definition wurde zuletzt im Mai 2020 aktualisiert

Erfahren Sie mehr über Datenanalyse