Alexander - stock.adobe.com

Wie sich Firmen auf ethisches Data Mining konzentrieren

Da die Datenanalyse zunehmend zu einem Kernbestandteil der Unternehmensstrategie geworden ist, gibt es auch Bedenken über die Art der Datengewinnung.

Angesichts der Skandale um Datenschutzverletzungen bei Facebook, Equifax und anderen Firmen diskutieren immer mehr Unternehmen über ethisches Data Mining. Während ein Großteil dieser Diskussionen auf hohem Niveau geführt werden, müssen Unternehmen das Thema in der Praxis hart und konsequent angehen. Schließlich müssen sie in Bezug auf datengetriebene Geschäftsabläufe auf der richtigen – ethisch integren – Seite bleiben. Dafür müssen sie Benutzer schulen und Best Practices formulieren.

Da die Zahl der Datenschutzverletzungen in den letzten Jahren zugenommen hat, haben Unternehmen ihre Bemühungen um Datensicherheit deutlich verstärkt. Sie möchten damit die finanziellen Risiken und Reputationsrisiken, die mit hochriskanten Verletzungen verbunden sind, mindern. Auf die ethischen Aspekte dieser Vorfälle haben sie jedoch weniger geachtet. Außen vor blieb etwa oft die unbefugte Weitergabe von Daten, der Weiterverkauf von Kundendaten oder die Entwicklung von Algorithmen, die eine gewisse Verzerrung aufweisen.

„Wenn Sie nicht in Zeit und Geld investieren, die notwendig sind, um ethisch korrekt zu handeln, können Sie einen schrecklichen PR-Albtraum erleben“, sagt Lucy C. Erickson, Policy Fellow der American Association for the Advancement of Science.

Da Daten und Datenanalysen zu einer zentralen Geschäftsgrundlage für jedes Unternehmen geworden sind, haben Best Practices im Bereich des ethischen Data Mining zugenommen.

Laut einer TDWI-Studie priorisieren 82 Prozent der Unternehmen Business Analytics und Business Intelligence als Teil ihrer Technologiebudgets. Untersuchungen von NewVantage Partners (PDF) zeigen, dass 91,6 Prozent der Fortune-1000-Unternehmen ihre Investitionen in Big Data und künstliche Intelligenz (KI) erhöhen, um agil und wettbewerbsfähig zu bleiben.

Die Fähigkeit, nahezu unbegrenzte Datenmengen zu speichern, gepaart mit der Tatsache, dass Unternehmen Daten heute als Vermögenswert betrachten und die Entscheidungsfindung zunehmend Algorithmen überlassen, treibt die aktuellen Bedenken bezüglich des ethischen Data Mining voran.

„Traditionell sorgt man sich vor allem im medizinischen und rechtlichen Bereich um Ethik. Da aber auch die Informatik zunehmend das Leben der Menschen in ähnlicher Weise beeinflusst, sehen wir auch in diesem Bereich eine stärkere Betonung der Ethik“, sagt Erickson. „Es wächst die Erkenntnis, dass auch Programmierer sich mit den Folgen ihrer Produkte für Menschen auseinandersetzen müssen – insbesondere in Bereichen wie Datenschutz und algorithmische Entscheidungsfindung.“

Geist des Gesetzes

Ethische Standards sind nicht gleichbedeutende mit der Einhaltung von Gesetzen: „Unternehmen können dem Gesetz folgen und dennoch mit ihren Data-Mining-Projekten ethische Grenzen überschreiten“, warnt David Thomas, CEO des Online-Verifikationsservices Evident ID.

In den USA gibt es keine einheitliche rechtliche Definition von personenbezogenen Daten. Das bedeutet, dass es viel Spielraum für den Umgang mit diesen Daten gibt. Im Vergleich dazu hat die Europäische Union mit der Datenschutz-Grundverordnung (DSGVO) einige Lücken geschlossen, sagt Thomas. Dennoch gibt es nur so viel Klarheit, wie die Regulierung bieten kann – was wiederum die ethische Last auf das Unternehmen verlagert.

„Die Sorgfaltspflicht von Unternehmen gegenüber ihren Daten ist viel umfassender. Es genügt nicht, jedes Gesetz perfekt einzuhalten“, erklärt Thomas. „Zwischen der theoretischen Befolgung der Verordnung und der Befolgung der Gesetze dem Wortlaut nach gibt es einen Unterschied. Es existieren so viele Möglichkeiten, wie Daten missbraucht werden können. Unternehmen müssen deshalb anfangen, sorgfältig über ihre Pflicht nachzudenken und sich um dieses Gut zu kümmern, mit dem sie betraut sind.“

Zunächst einmal, so Thomas, sollten Unternehmen davon Abstand nehmen, möglichst viele persönliche Kundendaten zu sammeln. Vielmehr sollten sie eine Roadmap entwickeln, aus der hervorgeht, warum sie welche Daten sammeln und was diese Daten mit ihrer spezifischen Geschäftsagenda zu tun haben.

Darüber hinaus sollte die Aufmerksamkeit auf die Governance-Praktiken gelegt werden, wie zum Beispiel die Durchsetzung von Datenschutzrichtlinien und die Entscheidung darüber, wie Daten genutzt werden dürfen. Diese Praktiken sollten ebenfalls kodifiziert und für das gesamte Unternehmen transparent sein. Das Bedürfnis nach Transparenz führt auch dazu, dass die Kunden genau wissen, wie ihre Daten verwendet werden.

„Jedes Unternehmen versucht, seinen Kunden eine reibungslose Benutzererfahrung zu bieten. Das Letzte, was es tun will, ist, den Benutzern ein detailliertes Protokoll über die Verwendung ihrer Daten zu präsentieren“, erklärt der Evident ID CEO. „Unternehmen fassen ihre Nutzungsrichtlinien auf einem hohen Niveau zusammen, da sie den Benutzern grundsätzlich schaden. Aber in diesem Fall haben die Kunden dann keine Ahnung, wofür sie sich anmelden.“

Abbildung 1: Wie die EU-DSGVO personenbezogene Daten definiert.
Abbildung 1: Wie die EU-DSGVO personenbezogene Daten definiert.

Eine Möglichkeit, die Debatte über ethisches Data Mining in Schwung zu bringen, besteht darin, die Diskussion noch vor dem Berufsleben bereits an der Universität zu beginnen. Vandana Janeja, Professorin am Information Systems Department an der University of Maryland, hat genau das in ihrem Informatikunterricht eingeführt.

Janeja integriert ethikbezogene Unterweisungen, während die Studenten mehr über Datenmanagementpraktiken erfahren, die auf jede Phase des Datenlebenszyklus abgestimmt sind. „Jedes Mal, wenn Studenten Fragen zu Daten oder zur Manipulation von Daten stellen, setzen wir die Ethikbrille auf und fördern ethisch-kritisches Denken“, sagt sie.

Die größte Hürde für solide ethische Data-Mining-Verfahren kann am Ende das rasante Tempo der Technologie sein. Um es richtig zu machen, müssen Unternehmen von Anfang an ethische Aspekte beim Datendesign und dem Datenschutz berücksichtigen. Dazu gehören auch die Untergruppen, die berücksichtigt werden sollten: Diejenigen, die von der Datennutzung betroffen sein könnten. Und es muss gefragt werden, ob potenzielle Trainingsdaten möglicherweise zu verzerrten oder fehlerhaften Algorithmen führen.

„Alle etablierten Ansätze möchten die Dinge beschleunigen und mit einer schnellen Geschwindigkeit vorankommen“, sagt Erickson. „Doch oft erfordern ethische Fragen eine Verlangsamung des Prozesses.“

Nächste Schritte

Wie Analytics-Teams ethische Grundsätze befolgen.

Kostenloser E-Guide: Big Data Analytics mit Data Mining.

Marktüberblick Predictive Analytics und Data Mining Software.

Erfahren Sie mehr über Data Governance