88studio - stock.adobe.com

Wie Betrugserkennung mit maschinellem Lernen funktioniert

Bei Online-Shops oder anderen Online-Transaktionen spielen die Themen Betrugserkennung und Identitätskontrolle eine wichtige Rolle. Maschinelles Lernen leistet da wichtige Dienste.

Online-Geschäfte boomen. Das gilt für Online-Shops ebenso wie für Geldgeschäfte und Versicherungen. Die Pandemie hat diesen Trend noch verstärkt. Mit der Zahl der Online-Transaktionen wächst auch die Anzahl der Betrugsversuche. Zudem werden Cyberkriminelle zunehmend raffinierter. Deshalb setzen viele Organisationen auf künstliche Intelligenz (KI) beziehungsweise maschinelles Lernen (ML), um Betrugsversuche zu erkennen und zu verhindern.

Wichtig dabei ist, dass der Einsatz in Echtzeit abläuft und er das Serviceerlebnis des Kunden nicht beeinträchtigt. Transaktionsabbrüche gilt es zu vermeiden. Letztlich ist es entscheidend, nicht allein die betrügerischen Transaktionen zu blockieren, sondern vor allem die maximale Anzahl valider Transaktionen sicherzustellen.

Betrugsabwehr mit Daten

Die automatische Auswertung von Daten in Echtzeit spielt naturgemäß bei Online-Transaktionen eine große Rolle. So setzen viele Online-Shops Systeme zur Betrugsabwehr ein, die den gesamten Kaufprozess der Kunden begleiten und nicht erst beim Bezahlen beziehungsweise Check-out ansetzen. Diese kontrollieren beispielsweise, ob der Aufenthaltsort des Kunden zu seiner registrierten Lieferanschrift passt und ob er ein bekanntes Gerät zum Besuch des Webshops nutzt.

Natürlich tätigen Kunden auch auf Geschäftsreisen oder an ihrem Urlaubsort Einkäufe. Wird aber beispielsweise ein nicht bereits im Shop bekanntes Smartphone, sondern ein PC mit exotischer IP-Adresse genutzt, ist erhöhte Vorsicht geboten.

Auch ein Blick in den Einkaufskorb kann sich lohnen: Bestellt ein Kunde, der für gewöhnlich wenige Kleidungsstücke in Größe S ordert, 50 T-Shirts in Größe XL, ist auch dies ein Indiz für einen möglichen Betrugsversuch oder zum Beispiel eine gestohlene Identität. Gleiches gilt im Falle eines Kunden, der für gewöhnlich 30 Euro pro Einkauf ausgibt, und plötzlich einen Warenkorb im Wert von 1.000 Euro abrechnen will.

Ausweitung der Datenbasis mit maschinellem Lernen

Diese Art Kontrollsystem nutzt strukturierte Daten, die auf „traditionelle“ Weise verarbeitet werden. Die Menge der zu verarbeitenden Daten kann bei entsprechender Größe des Online-Shops beträchtlich sein, stellt aber an sich kein Problem für herkömmliche Rechenprozesse dar. Die fundamentale Stärke von ML besteht in der Ausweitung der Datenbasis, die sich in automatisierte Prozesse integrieren lässt. Dabei spielt die Art der Daten die entscheidende Rolle für den Übergang von herkömmlicher Datenverarbeitung zum Einsatz von ML.

Mit maschinellem Lernen lassen sich auch unstrukturierte Daten einbeziehen. Das gilt zum Beispiel für die Kontrolle der Tippgewohnheiten eines Users, um dessen Identität zu überprüfen. Grundsätzlich kann ein ML-System analysieren, ob die Dateneingaben zum Beispiel in einem Online-Shop von einer Person oder einer Software vorgenommen werden. Darüber hinaus kann es etwa feststellen, ob die Dateneingabe auf einem bekannten Gerät des zugeordneten Kunden stammen oder eher von einem potenziellen Betrüger.

Eine Frage der Identität

Bei der Identitätskontrolle spielt maschinelles Lernen generell eine wichtige Rolle. Abhängig von den Produkten, der Bestellhöhe und den rechtlichen Auflagen entscheiden die meisten Online-Shops, ohne aufwendige Identitätskontrolle auszukommen. Bei einer Bankkonto-Eröffnung oder der Vergabe von Online-Krediten sieht das aber ganz anders aus. ML kommt hierbei vor allem in Form avancierter Text- und Gesichtserkennungssoftware zum Einsatz.

Entsprechend trainierte ML-Algorithmen können beispielsweise die Authentizität der vom Antragsteller fotografierten Identitätsdokumente überprüfen. Mit ML-Algorithmen zur Gesichtserkennung lässt sich zudem das Foto auf dem Ausweisdokument mit einem aktuellen Selfie des Antragstellers abgleichen und zum Beispiel auch verifizieren, dass es sich um eine Live-Selfie-Übertragung eines echten Gesichts handelt.

Risikomodelle und menschliche Intelligenz

ML-Anwendungsbeispiele sind in den vergangenen Jahren stark gewachsen und befinden sich bereits in sehr vielen Bereichen im Einsatz. An einem weiteren Beispiel aus der Finanzwelt lässt sich dabei verdeutlichen, dass maschinelles Lernen keineswegs alle Herausforderungen allein bewältigen kann und mit menschlicher Intelligenz zusammenspielen muss, um zu optimalen Ergebnissen zu gelangen.

So setzen Finanzinstitute bei der Kreditvergabe Risikomodelle ein, die die finanzielle Lage des Antragstellers genauso berücksichtigen wie zum Beispiel die makroökonomischen Entwicklungen insgesamt. Durch den ML-Einsatz sind die analytischen Prozesse und Prognosemodelle für die Risikosteuerung in den letzten Jahren stets mächtiger geworden. In der aktuellen Pandemiesituation aber müssen alle Modelle überprüft werden, weil sich häufig die Ausgangsvoraussetzungen geändert haben. Wie gut das gelingt, hängt wesentlich von den Feedbackzyklen ab, also den Zeiträumen, die vergehen, bis Änderungen an den Modellen messbare Resultate zeitigen, die als Input für mögliche weitere Änderungen dienen können.

Hier zeigen sich deutliche Unterschiede zwischen der Bankenwelt und dem E-Commerce. Die Feedbackzyklen sind im E-Commerce wesentlich kürzer als im Bankenwesen. Während also die ML-Systeme im E-Commerce schnell genug Feedback erhalten, um die zugrundeliegenden Modelle kurzfristig anzupassen, ist dies bei Banken nicht möglich.

Die durchschnittliche Zeit, bis es zu einem Zahlungsausfall kommt, ist erheblich länger, nicht selten rund ein Jahr. Den ML-Modellen fehlen also aktuelle Daten, vor allem in Zusammenhang mit Ereignissen, die kurzfristige Zyklen oder Handlungen betreffen, um entsprechend kurzfristige Anpassungen durchführen zu können. Diesem Mangel an aktuellen Daten werden die Organisationen nur schwer Herr.

Der Einsatz von Experten, die aufwendig und peu à peu relevante Daten-Puzzlestücke zusammensuchen müssen oder „intuitiv“ auf Basis ihrer Erfahrungen Entscheidungen treffen können, sind grundsätzlich keine tragbare Lösung, in marktwirtschaftlichen Notlagen oder einer Pandemiesituation aber durchaus das beste und weiterhin einzige Mittel für die Risiko-Steuerung oder relevante Einzelfallentscheidungen. Auch die direkte Kommunikation mit dem Kunden ist noch immer ein gangbarer Weg.

Erklärbarkeit, Nachvollziehbarkeit, Fairness

Die menschliche Expertise ist aber nicht nur in Ausnahmesituationen unverzichtbar. Ihr kommt auch eine wichtige Rolle bei der Kontrolle der ML-Systeme zu. ML-Systeme können Prozesse zur Risikomodellierung und Betrugsbekämpfung optimieren. Menschliche Experten müssen allerdings verstehen und erklären können, wie die ML-Systeme diese Verbesserungen erzielt haben. Schließlich müssen sie entscheiden, ob man entsprechende Anpassungen auch in anderen Bereichen anwenden kann und ob die ML-Systeme nicht bei veränderten Rahmenbedingungen mit derselben Präzision in die Irre führen.

Martina Neumayr, Experian

„Die menschliche Expertise ist nicht nur in Ausnahmesituationen unverzichtbar. Ihr kommt auch eine wichtige Rolle bei der Kontrolle der ML-Systeme zu.“

Martina Neumayr, Experian

Nicht zuletzt pochen die Aufsichtsbehörden auf die Erklärbarkeit von Entscheidungen, die ML-System automatisiert fällen. Die Erklärbarkeit maschineller Modelle und Entscheidungen ist eines der aktuell spannendsten Forschungsfelder und es stehen bereits verschiedene Ansätze zur Verfügung.

So hat sich beispielsweise die Anwendung sogenannter „Surrogatmodelle“ bewährt, oder auch der aus der Spieltheorie stammende SHAP (Shapley Additive exPlanations) Ansatz. Über die Erklärbarkeit wird auch die Fairness der verwendeten Modelle gewährleistet.

In der Spieltheorie wird mit SHAP beispielsweise die Vorhersage eines bestimmten Wertes erklärt, indem der Beitrag jedes Merkmals zur Vorhersage berechnet wird, insbesondere um eine gerechte Verteilung zu gewährleisten. Analog dazu soll SHAP in der Erklärung von ML-Modellen und -Entscheidungen kontrollieren, ob die Resultate ausgewogen und fair sind.

Fazit

Maschinelles Lernen wird eine zunehmend wichtigere Rolle innerhalb des umfassenderen Trends der digitalen Transformation spielen. Mancher Außenstehende begegnet den Entwicklungen mit Skepsis. Dazu besteht allerdings kein Grund. Die beschriebenen Beispiele zeigen zwar das Potenzial, das in der neuen Technologie steckt. Wir haben aber auch gesehen, dass maschinelles Lernen menschliche Expertise keineswegs überflüssig macht und dass bei der weiteren Entwicklung sowohl von ML-Anbietern als auch von den Aufsichtsbehörden großes Augenmerk auf Erklärbarkeit, Nachvollziehbarkeit und Fairness gelegt wird. Das wird einer Akzeptanz, neuen Anwendungsfeldern und schließlich dem erfolgreichen Einsatz der neuen Technologien in der Zukunft sehr helfen.

Über die Autorin:
Martina Neumayr ist Senior Vice President Credit Risk & Fraud Services bei Experian DACH.

Die Autoren sind für den Inhalt und die Richtigkeit ihrer Beiträge selbst verantwortlich. Die dargelegten Meinungen geben die Ansichten der Autoren wieder.

Erfahren Sie mehr über IT-Sicherheits-Management