Kzenon - stock.adobe.com

COVID-19-App: Wichtig ist die Anonymisierung aller Daten

Der Einsatz einer App zum Nachverfolgen von COVID-19-Ansteckungen wird aktuell diskutiert. Steffen Schneider von Couchbase erläutert im Interview die mögliche Umsetzung.

Eine Smartphone-App soll in Deutschland und anderen Ländern helfen, die Coronavirus-/COVID-19-Pandemie einzudämmen. An ihrer Entwicklung wird daher fieberhaft gearbeitet. Allerdings ist die App in Deutschland noch nicht im Einsatz. Andere europäische Länder sind bereits weiter: In 9 von 19 europäischen Staaten, die entsprechende Apps entwickeln, sind die sogenannten Tracing-Apps bereits im Einsatz (siehe Abbildung 1).

Der Hauptgrund: Sicherheitsexperten verweisen in Deutschland auf die Bedeutung einer verschlüsselten Datenübertragung und einer dezentraler Speicherung der erfassten Daten. Die technischen Hürden für die Umsetzung der App sind hoch.

Steffen Schneider, Senior Solutions Engineer Central Europe bei Couchbase, skizziert im Interview, wie sich durch den Einsatz von Bluetooth, Edge Computing, Machine Learning und Realtime Processing eine entsprechende Anwendung realisieren lässt. Dabei verweist Schneider auch auf die technischen und sicherheitsrelevanten Voraussetzungen, um eine breite Akzeptanz der App zu gewährleisten.

Wo Corona-Apps im Einsatz sind (Statista)
Abbildung 1: In Norwegen, Österreich und Polen werden COVID-19-Apps bereits eingesetzt.

Herr Schneider, aktuell wird viel über die Entwicklung einer App diskutiert, die Nutzer warnen soll, wenn sie eventuell mit einer COVID-19-infizierten Person in Kontakt gekommen sind. Wie funktioniert eine solche App?

Steffen Schneider: Eine solche App muss auf einer Vielzahl von mobilen Geräten einsetzbar sein. Typische Devices wären Smartphones oder Smartwatches. Es gibt drei technische Kernvoraussetzungen, die erfüllt sein müssen: Sie verfügen erstens über Bluetooth- und zweitens Wi-Fi-Technologie und besitzen drittens Sensoren zur Erfassung der Standortdaten. Diese werden dann in einer in die App integrierten lokalen Datenbank gespeichert. So können die Personen gewarnt werden, die sich in der Nähe von Corona-positiven Menschen befunden haben.

Die Daten werden also nicht direkt übertragen, sondern in einer lokalen Datenbank gespeichert. Was für Daten werden dabei erfasst und gespeichert?

Schneider: GPS wird natürlich zur Standorterfassung und deren Genauigkeit benötigt – ohne geht es nicht oder es wäre sehr ungenau. Bei der Registrierung jedoch gibt der Handy-Nutzer lediglich einen frei zu wählenden User- oder Alias-Namen an. Vor Ort werden dann ausschließlich die standortbezogenen Sensordaten anonymisiert erfasst, an eine zentrale Datenbank weitergegeben und dort ebenfalls verschlüsselt gespeichert. Im Falle einer diagnostizierten Coronainfektion erfolgt die anonymisierte Benachrichtigung aller App-Nutzer, die sich in einem definierten Radius in der Nähe des Betroffenen befunden haben.

Welcher Datenbanktyp eignet sich hierfür?

Schneider: Prädestiniert dafür sind NoSQL-Datenbanken, denn sie sind geeignet für die Speicherung und Verarbeitung der anfallenden Datenmengen und -formate. Wir haben ja kein stetiges Datenaufkommen, sondern müssen mit hohen temporären Spitzenlasten rechnen. Außerdem wollen wir die Vorteile von Edge Computing nutzen. Dafür ist eine Kombination von mobiler Datenbank als Teil der App für das Mobilgerät – also sozusagen eine Lite-Version einer NoSQL-Datenbank – und zentraler Datenbank für die Konsolidierung und Analyse der eingehenden Daten an zentraler Stelle erforderlich. Wir reden also über einen integrierten End to End Mobile Stack, wie ihn Couchbase mit seinen Komponenten Couchbase Lite für die Mobilseite, Sync Gateway für die Datensynchronisierung der Mobilseite hin zum Couchbase Server im Backend und wieder zurück, zur Verfügung stellt.

Kritiker verweisen darauf, dass eine entsprechende App und die damit verbundenen Technologien nur auf neueren Smartphone-Modellen laufen, ältere Geräte und deren Besitzer die App also nicht verwenden können. Wie lässt sich dieses Problem lösen?

Schneider: Das ist in erster Linie eine Frage der Hardwareanforderungen. Couchbase Lite kann generell auf jedem Gerät genutzt werden. Der einzige limitierende Faktor ist die Größe des internen Device-Speichers, um die in die App integrierte Datenbank aufnehmen zu können. Doch die Anforderungen auf Datenbankebene sind sehr gering. Couchbase Lite benötigt lediglich eine Speicherkapazität bis zu einem unteren dreistelligen Megabyte-Bereich. Also etwa soviel wie rund zehn MP3-Songs. Notfalls kann zudem eine Speichererweiterung per SD-Karte in Betracht kommen. Bezüglich der Betriebssystem-Releases läuft die jüngste Couchbase Lite Version 2.7 ab Android API 22, iOS 10.0 und macOS 10.11.

Was ist für den Erfolg und die Funktionsweise einer solchen App entscheidend?

Schneider: Wichtig für die Akzeptanz und Nutzungshäufigkeit einer solchen App ist die durchgängige Anonymisierung aller Daten. Auf der technischen Ebene muss deshalb End-to-end-Security durch Verschlüsselung auf der mobilen Datenbank, bei der Datenübertragung und in der zentralen Datenbank im Backend gewährleistet sein. Außerdem müssen wir neben Edge Computing auch Machine Learning und Realtime Processing sowie Peer-to-Peer-Konnektivität einsetzen. Die integrierte Edge-Datenbank befähigt die App, lokale Daten in Echtzeit zu erfassen, zu speichern und an andere mobile Endgeräte direkt zu senden, ohne notwendigerweise über die zentralen Server gehen zu müssen. Letzteres entlastet die zentrale Stelle und ihre Server und reduziert zudem die Menge der zu übertragenden Daten in das Backend.

Steffen Schneider, Couchbase

„Wichtig für die Akzeptanz und Nutzungshäufigkeit einer solchen App ist die durchgängige Anonymisierung aller Daten.“ 

Steffen Schneider, Couchbase

Wie lassen sich die erfassten Daten auswerten?

Schneider: In unserem Konzept geschieht das auf zwei Ebenen, die sich gegenseitig verstärken. Eine erste Verarbeitung und Datenkonsolidierung findet auf dem Mobilgerät selbst statt. Durch die Predictive Query API von Couchbase Lite können dazu vorausschauende Abfragen direkt auf den Endgeräten ausgeführt werden. Parallel dazu können diese Daten an die zentrale Datenbank der Gesundheitsbehörden gesendet werden. Dort, auf den zentralen Servern findet dann wiederum die Aggregation der eingehenden Daten aller Geräte statt, deren Ergebnisse auf die Mobilgeräte mit aggregierten Analyseergebnissen angereichert, zurückgespielt werden. Das geschieht vollständig verschlüsselt und anonymisiert. In einem fortlaufenden Prozess werden die Daten dadurch auf eine immer höheren Aggregationsebene konsolidiert und die App wird immer schneller und treffsicherer – sie lernt also.

Erfahren Sie mehr über Datenanalyse