vege - stock.adobe.com

Drei Anwendungsfälle für Graphdatenbanken

Graphdatenbanken stellen Beziehungen zwischen Daten her. Die Datenbanken können in vielen Anwendungsfällen von Vorteil sein. Hier sind die drei wichtigsten davon.

Das typische Bild, das einem in den Sinn kommt, wenn man das Wort Datenbank hört, ist wahrscheinlich eine Tabelle. In einer Datenbanktabelle wird in jeder Zeile ein separater Datensatz abgelegt und in den Spaltenüberschriften stehen die Feldnamen – im Grunde das, was jeder aus Excel kennt.

Sobald die Daten aber zu kompliziert sind, um in eine einzige Tabelle zu passen, geht man zu relationalen Datenbanken über. Solche Datenbanken bestehen aus mehreren Tabellen, die miteinander durch verknüpfte Felder verbunden sind.

Für das Einrichten einer relationalen Datenbank ist eine Person notwendig, die sich mit Datenstrukturen auskennt. Müssen neue Informationen hinzugefügt werden oder sind neue Beziehungen wichtig, muss ein Datenbank-Administrator die Struktur der Datenbank ändern und höchstwahrscheinlich auch die Benutzeroberfläche aktualisieren.

Was macht man aber, wenn man einen Datensatz hat, bei dem die Beziehungen nicht im Voraus bekannt sind und abgebildet werden können? Vielleicht sind zwei Menschen in derselben Fußballmannschaft oder mögen die gleiche Art von Büchern oder leben in der gleichen Stadt. Jedes dieser Elemente als separates Feld hinzuzufügen und neue Beziehungen für sie zu erstellen, kann für einen Datenbank-Administrator eine extrem zeitaufwendige und nie endende Aufgabe sein.

Die Lösung ist eine Graphdatenbank. In einer Graphdatenbank kann jeder Datenpunkt mit jedem anderen Datenpunkt verbunden werden. Die Verbindungen können jederzeit von den Business-Anwendern festgelegt werden, ohne dass Datenbank-Administratoren das gesamte Schema neu schreiben müssen.

Graphdatenbanken sind skalierbar und eignen sich daher gut für Big-Data-Anwendungen. Außerdem sind sie schnell und ermöglichen es Benutzern, sich schnell entlang einer Kette von Verbindungen zu bewegen. Auf diese Weise können Unternehmen schneller und effizienter Einblick in ihre Daten gewinnen.

„Wenn ich in einer relationalen Datenbank etwas hinzufügen oder eine Beziehung ändern möchte, muss ich viel planen“, sagt Karen Panetta, IEEE-Fellow und Dekanin für Hochschulbildung an der Tufts University in Massachusetts, USA. „Mit einer Graphdatenbank hingegen können Sie im Laufe der Zeit ganz einfach neue Beziehungen hinzufügen.“

Hier sind drei Anwendungsfälle für Graphdatenbanken.

Betrug und Anomalien

Laut Panetta ist die Betrugserkennung derzeit einer der leistungsstärksten Anwendungsfälle für Graphdatenbanken.

Traditionelle Ansätze zur Betrugserkennung basieren auf einfachen Checklisten. Eine Transaktion ist verdächtig, wenn sie eine bestimmte Anzahl kritischer Punkte überschreitet. Oder wenn der Absender beispielsweise auf einer Überwachungsliste steht. Dieser ziemlich simple Ansatz kann subtilere Betrugsversuche übersehen. Aber eine Datenbank, die ungewöhnliche Verbindungen zwischen Transaktionen erkennt, kann diese Betrugsversuche möglicherweise aufspüren.

Verdächtig ist es zum Beispiel, wenn viele E-Commerce-Käufe von verschiedenen Konten kommen – aber alle von derselben IP-Adresse oder einem Cluster von IP-Adressen. Oder wenn es mehrere Abhebungen des gleichen Geldbetrags aus der gleichen Gegend gibt, gefolgt von Bareinzahlungen am gleichen Tag auf verschiedene Konten.

Jede dieser einzelnen Transaktionen löst wahrscheinlich keinen Alarm aus, aber mehrere zusammenhängende Transaktionen können ein Indiz für Betrug sein.

„Bei einem großen Geldwäschesystem werden möglicherweise der Name einer Person, die Sozialversicherungsnummer einer anderen Person und die Adresse einer dritten Person verwendet“, erklärt Panetta. „Was machen Sie mit dieser ‚Anomalie‘? Die Struktur des Diagramms ermöglicht es Ihnen, diese Dinge tatsächlich als Anomalie anzuzeigen. So können wir Beziehungen untersuchen, die keinen Sinn machen.“

Und es sind nicht nur kriminelle Einkäufe oder Bankbetrug, die auf diese Weise aufgedeckt werden können. Im Bereich Cybersicherheit suchen Unternehmen, die sich gegen Hacker verteidigen möchten, nach Ereignisclustern, die auf ungewöhnliche Weise miteinander verbunden sind.

Der Cybersecurity-Anbieter Brinqa wechselte zum Beispiel auf das Graphdatenbanksystem Neo4j, als die vom Unternehmen verwendeten relationalen Datenbanken an die Grenzen ihrer Flexibilität stießen.

„Unsere Plattform war zwar dynamisch. Aber nicht dynamisch genug, um alle möglichen Situationen zu bewältigen“, sagt Syed Abdur Rahman, Director of Products bei Brinqa. „Mit Graphdatenbanken können Sie das Schema im laufenden Betrieb definieren. Sie können die Knoten und Beziehungen on the fly festlegen und müssen sie nicht im Voraus definieren. Sie können dies sogar tun, während Sie die Daten einlesen.“

Empfehlungsmaschinen

Ungewöhnliche Verbindungen können auch eine positive Sache sein. Die heute eingesetzten erweiterten Empfehlungsmaschinen (RecommendationEngines) – wie sie jeder von Amazon kennt – schlagen Musik, Bücher, Filme, Kleidung und andere Produkte und Dienstleistungen vor. Diese basieren auf Verbindungen zu anderen Transaktionen und können über einfache, direkte Verbindungen hinausblicken.

Ein Beispiel: Menschen, die Hundefutter kaufen, kaufen möglicherweise auch Hundehalsbänder. Aber vielleicht interessieren sie sich auch für – auf den ersten Blick wenig relevante Artikel wie – bequeme Wanderschuhe oder Sofabezüge.

Empfehlungsmaschinen tauchen an vielen verschiedenen Orten auf, nicht nur in Streaming-Apps und auf E-Commerce-Websites. Fabric, ein Marktplatz für Verbraucherdaten, der Marken mit Kunden verbindet, verwendet Graphdatenbanken, um die Entwicklungszeit für neue Funktionen, Schnittstellen und Analysen zu verkürzen.

„Graphdatenbanken sind für 90 Prozent der aufstrebenden Unternehmensprojekte besser als relationale Datenbanken“, sagt Paul Taylor, Gründer und CEO von Fabric. „Der Austausch einer herkömmlichen relationalen Datenbank durch eine Graphdatenbank kann auch den Bedarf an Middleware verringern. Graphen sind starke Grundlagen.“

Das heißt aber nicht, dass sie für jeden Anwendungsfall funktionieren. „Graphen sind weniger geeignet für Anwendungen, die viele Daten in die Datenbank eintragen und bei denen die Daten während ihres gesamten Lebenszyklus nur wenige Male abgefragt werden müssen“, erläutert Taylor.

Datensynchronisation

Datenschutzbestimmungen wie die EU-Datenschutz-Grundverordnung (EU-DSGVO) und der California Consumer Privacy Act (CCPA) setzen ein entsprechendes Datenmanagement durch Unternehmen voraus. Zum Beispiel müssen Firmen in der Lage sein, alle personenbezogene Daten, die sie gesammelt haben, zusammenzuführen und auf Anfrage löschen. Da Unternehmen diese Informationen oft in verschiedenen Datensilos speichern, kann dies eine schwierige Aufgabe sein.

Es sind aber nicht nur die Compliance-Anforderungen, die Unternehmen dazu veranlassen, unterschiedliche Datensätze miteinander zu verknüpfen. „Unternehmen, die Mobilgeräte verwenden, IoT-Anbieter, Unternehmen im Gesundheitswesen und Finanzunternehmen haben alle einen Bedarf an dieser Technologie“, ist Justin Richie, Data Science Director bei Nerdery, einem Beratungsunternehmen für digitale Dienstleistungen, überzeugt. „Die meisten Graphendatenbanken werden für die Echtzeit-Datensynchronisation verwendet.“

„Graphdatenbanken sind noch relativ neu, aber weitere Anwendungen werden hinzukommen“, sagt Panetta von der Tufts University. „Zukünftige Anwendungsfälle für Graphendatenbanken werden künstliche Intelligenz auf die nächste Stufe heben. Derzeit versorgen wir KI mit Daten aus altmodischen relationalen Datenbanken. Aber die KI basiert auf Beziehungen. Graphdatenbanken werden dabei helfen, bessere KI-Systeme zu bauen.“ 

Erfahren Sie mehr über Datenbanken