Covid-19Erste Auswertung der Datenspende-App veröffentlicht

Kein offener Code und Datenschutzmängel: Die Datenspende-App des Robert Koch-Instituts ist umstritten, gerade wegen mangelnder Transparenz. Jetzt veröffentlichen die Forscher:innen erste Zwischenergebnisse. Die wichtigste Frage bleibt aber noch unbeantwortet.

Screenshot der Datenspende-App
Vielen Dank für Ihre Spende. Doch was fangen die Forscher:innen des RKI nun mit den Daten an? CC-BY-NC-SA 4.0 Screenshot Corona-Datenspende-App

Die Datenspende-App selbst war nicht quelloffen und hatte Sicherheitsprobleme. Bei der Auswertung der gesammelten Daten setzt das Robert Koch-Institut (RKI) dafür nun auf möglichst viel Transparenz. Die ersten Auswertungsergebnisse sind online und zeigen vor allem, wie viele bislang ihre Daten zur Verfügung gestellt haben – und wie sie auf Deutschland verteilt sind.

Mehr als 500.000 Spender:innen nutzen laut Angaben des RKI inzwischen die App – ungeachtet des schlechten Abschneidens beim Datenschutz. Sie messen ohnehin schon ihren Puls oder ihren Schlafrhythmus mit Hilfe von tragbaren Sensoren, sogenannten Fitness-Trackern, und teilen diese Informationen nun täglich mit den Forscher:innen.

Interessant ist für die Auswertung vor allem der mittlere Ruhepuls, denn daraus lässt sich Studien zufolge auf eine erhöhte Körpertemperatur schließen – so lassen sich Infektionsherde in der Pandemie womöglich schneller erkennen als mit den herkömmlichen Daten des Gesundheitsbehörden. Die Datenspende „ermöglicht uns, die Ausbreitung des Coronavirus besser zu erfassen und die Dunkelziffer der Infizierten drastisch zu verringern“, sagt Dirk Brockmann von der Berliner Humboldt-Universität, der das Projekt leitet. „Diese Informationen sind für Epidemiologen unglaublich wertvoll und helfen, bessere Maßnahmen abzuleiten.“

Wo schlägt das Herz der Bevölkerung?

Bislang ist davon im Blog allerdings noch nichts zu sehen. Die ersten Auswertungen zeigen stattdessen die regionale Verteilung der Spender:innen auf Landkreise in Deutschland. Hier zeigen sich keine großen Überraschungen: In größeren Städten beteiligen sich mehrere Tausende, an der Spitze stehen derzeit Berlin, München und Hamburg. Die Datenernte auf dem Land fällt dagegen eher spärlich aus. Im dünn besiedelten Landkreis Lüchow-Dannenberg spendeten etwa nur rund 160 Menschen ihre Gesundheitsdaten. Ob das ausreicht, um daraus einen statistisch bedeutsamen Mittelwert abzuleiten? Brockmann hatte ursprünglich geschätzt, dies sei ab etwa 100 Spender:innen möglich.

Eine weitere Karte zeigt die durchschnittlichen Ruhepuls-Werte pro Landkreis. Hier fallen die Ergebnisse durchaus überraschend aus, der Ruhepuls in Städten liegt nämlich im Schnitt niedriger als vielerorts auf dem Land. Worauf sich das zurückführen lässt, darauf gehen die Forscher:innen nicht weiter ein. Für sie ist es auch gar nicht so wichtig. Sie verwenden diese Karte lediglich als Referenz, denn wer statistische Abweichungen feststellen will, muss zunächst wissen, wovon sie abweichen.

Karte der Ruhepulsdaten in Deutschland

Danken und erklären

Bislang leistet das Blog vor allem zwei Dinge: Es spricht die Spender:innen direkt an, um ihnen zu danken und sie als „Community“ in das Projekt einzubinden. Und es erklärt Schritt für Schritt anhand der Zwischenergebnisse, wie die Forscher:innen mit den Daten umgehen und was sie daraus ablesen. Dieser Anspruch ist erst mal hoch und ungewöhnlich in der Wissenschaftsgemeinschaft, in der Ergebnisse vor allem für andere Wissenschaftler:innen publiziert werden – und nicht so, dass ein durchschnittlicher interessierter Laie sie versteht. Doch die Kommunikation mit der „Community“ der freiwilligen Spender:innen lief nicht immer so gut.

Bereits zum Start der App am 7. April hatte es viel Kritik gegeben. Der Quellcode der App war nicht öffentlich zugänglich, weil ein Berliner Start-up die Software entwickelt hatte und dem RKI zur Verfügung stellte. So mussten sich Nutzer:innen auf die Versprechen der Beteiligten verlassen, dass ihre Daten gut geschützt seien.

Eine unabhängige Untersuchung von drei IT-Experten des Chaos Computer Clubs hatte kurz darauf ergeben, dass die App „zahlreiche technische und organisatorische Mängel“ aufweist und der Zugriff auf die hochsensiblen Daten keineswegs so begrenzt ist, wie das RKI – und die Datenschutzerklärung der App – dies darstellten. So holte sich das RKI die Daten der meisten Nutzer:innen nicht wie versprochen vom Smartphone, sondern direkt von den Anbietern der Fitnesstracker, wodurch auch Klarnamen und weitere Daten der Spender:innen auf den Servern des RKI landeten. Dieser Zugriff wäre auch nach Deinstallation der App bestehen geblieben. Auch wurden die Daten nicht bereits auf dem Telefon pseudonymisiert, sondern erst auf den Servern des RKI. Einige dieser Probleme haben die Entwickler der App inzwischen behoben.

Verteilung der Spender:innen in Deutschland

Bisher keine Erkenntnisse über Dunkelziffern

Es ist also eine Menge Vertrauen verspielt worden in diesem Verfahren, dass nun zurück gewonnen werden muss. Und vor allem werden die Forscher:innen nun die Sinnhaftigkeit der Datenspende unter Beweis stellen müssen. Die bislang veröffentlichten Karten leisten das noch nicht.

Wirklich interessant wird es erst im nächsten Schritt. Dann wird sich nämlich zeigen müssen, ob die Daten tatsächlich dazu dienen können, Dunkelziffern der Infektion auszumachen und neue Infektionsherde früher auszumachen als mit den bisherigen Methoden der Erfassung. Kurz: Ob sich die Herausgabe der sehr persönlichen Daten der Spender:innen überhaupt gelohnt hat. Ob Ergebnisse in diese Richtung auch veröffentlicht werden? Das muss noch entschieden werden, sagt Brockmann. Erst mal müsse sich zeigen, ob die Prognosen überhaupt funktionieren.

12 Ergänzungen

  1. Die Ruhepuls-Karte will ja so gar nicht zu den Inzidenz-Karten des RKI passen.

    Interpretationshilfe bitte?

    1. Keine Ahnung was du meinst aber ich Tippe mal auf zu Wenige Daten = Nicht Aussage Kräftig

  2. Der Ruhepuls schwankt nur zwischen 60 und 65?
    10% Genaugikeit. Schon ganz gut ohne vernüftige Elektroden.
    Ist das irgendwie auf den Probanden „normiert“?
    Éin (Ausdauer-) Sportler mit einem riesen Herz wird ja immer einen niedrigeren Ruhe-Puls haben als ein adipöser, autofahrender Bürohengst. Selbst wenn er Fieber hat wird
    sein Puls vielleicht auf 65 steigen…der Bürohengst wird wohl schon bei 75 sein…
    Wie wurden die Werte alll dieser unterschiedlichen Menschen vergleichbar gemacht?

  3. Zitat „… Im dünn besiedelten Landkreis Lüchow-Dannenberg spendeten etwa nur rund 160 Menschen ihre Gesundheitsdaten. Ob das ausreicht, um daraus einen statistisch bedeutsamen Mittelwert abzuleiten? Brockmann hatte ursprünglich geschätzt, dies sei ab etwa 100 Spender:innen möglich.“

    Es kann doch nicht die absolute Zahl entscheident sein, sondern der prozentuale Anteil der Menschen, die an einem Ort leben.
    In einem „dünn besiedeltem Gebiet“ dürften es immer weniger sein.

    Aus
    https://netzpolitik.org/2020/ein-fieberthermometer-fuer-deutschland/
    lernen wir:
    „…Brockmann: Das weiß ich noch nicht. Mein Gefühl sagt, ab rund hundert Personen kann man etwas erkennen. “

    Also muss dieser prozentuale Anteil mindestens 100 Personen sein.
    Dann muss man eben mehrere „Landkreise“ (oder Postleitzahlen) zusammenfassen.

    1. Bei statistischen Auswertungen muss auch die absolute Zahl der Teilnehmer eine gewisse Groesse haben, um aussagekraeftige Ergebnisse zu erzielen. Bei zu wenig Teilnehmern mittelt sich das Rauschen der unvermeidbaren nicht-relevanten Abweichungen nicht hinreichend gut heraus, die Ergebnisse sind damit unzuverlaessiger.

  4. Hm! Die Karte mit dem Ruhepuls und der Aussage, dass ein höherer Ruhepuls eine Körpertemperatur hätte, also eher auf Erkrankungen schließen würde!

    Wenn ich sehe, dass in den neuen Bundesländern die Coronafallzahlen wesentlich geringer sind, kann da etwas nicht stimmen denn die neuen Bundesländer haben einen Höheren Ruhepuls. Also kann diese Auswertung nicht stimmen oder irre ich mich?

    1. Diese Karte zeigt zunächst die Basiswerte, wie die Forscher:innen im Blogpost auch schreiben: „Zunächst müssen wir diesen Ruhepuls für einige Tage ermitteln, damit wir daraus einen Basiswert ableiten können. Wir wollen ja später erkennen können, ob es systematische Abweichungen vom normalen Ruhepuls gibt.“ Die Zahlen deuten also noch nicht auf vermehrte Infektionen hin, nur darauf, dass der durchschnittliche Ruhepuls in diesen Regionen höher liegt. Das kann viele Ursachen haben, die nichts mit erhöhter Körpertemperatur zu tun haben. Erst wenn in einem dieser Landkreise ein auffälliger Anstieg des durchschnittlichen Ruhepulses gemessen würde, wäre das ein Alarmzeichen.

      1. Ich weiß nicht, ob Referenzwerte gemessen während einer Infektionswelle geeignet sind, um statistische Abweichungen festzustellen: erkranken 10 neu und genesen gleichzeitig 10 hat man letzlich ein Nullsummenspiel. Schließlich sind wohl 80-85% der Erkrankungen völlig unkritisch [1], viele bekommen nicht einmal Fieber [2], sind aber natürlich ansteckend.

        Die dadurch auftretenden Hotspots findet man nicht durch nachträgliche Statistik, sondern indem jemand den Arzt ruft ähnlich wie bei einem Masernfall in der Kita. Bei Covid-19 ist die Dunkelziffer einfach zu groß.

        Wirklich brauchbare Werte würden nur flächendeckend regelmässige Tests bringen.

  5. Es ist doch einfach. Der mittlere Ruhepuls kann Aufschluss über Fieber geben aber auch über tausend andere Sachen. So ist ein sicherer Schluss auf Fieber nicht möglich.

    Könnte man auf Fieber schließen, wäre auch das nicht aussagekräftig, weil Fieber von einer SARS CoV-2 Infektion herrühren kann oder durch tausend andere Infektionen.

    Das Ganze ist von Anfang an so konstruiert, dass es keine medizinische Aussagekraft haben kann. Das sieht man auch am Messbereich des Ruhepulses. 60-65 ist der Normbereich, abzgl. Messfehler der nicht genormten Messgeräte. Ich würde jeden Medizinstudenten persönlich erwürgen, der sowas auch nur zu konstruieren vorschlägt.

  6. Wenn angeblich so viel Vertrauen verspielt wurde, wieso nehmen dann so viele teil? Das passt doch nicht zusammen.

    1. – Viele wollen mithelfen.
      – Viele sind uninformiert oder naiv.
      – Viele lassen sich beschnacken.
      – 10 sind viele.
      – 100 sind viele.
      – (…)

      Welche jetzt?

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.