Big Data vs. Datenschutz: Forscher werten Handydaten von 15 Millionen Menschen über den Zeitraum von einem Jahr aus

Malaria in Kenia. Bild: Malaria Atlas Project. Lizenz: CC BY 3.0.
Malaria in Kenia. Bild: Malaria Atlas Project. Lizenz: CC BY 3.0.

Die Standortdaten aller Handy-Nutzer in Kenia sind für eine wissenschaftliche Studie verwendet worden – ohne deren Einwilligung. Forscher aus den USA haben die Bewegungsdaten der Kenianer mit einer Malaria-Karte korreliert, um die Ausbreitung der Tropenkrankheit zu erforschen. Diese Studie ist ein neues Beispiel für den Konflikt von Big Data und Datenschutz.

Funkzellenabfrage auf afrikanisch: Forscher der amerikanischen Harvard School of Public Health alle Anrufe oder Kurznachrichten der 14.816.521 Mobilfunkkunden in Kenia zwischen Juni 2008 bis Juni 2009 ausgewertet. Mittels der Funkzelle wurde von diesen Daten jeweils der Standort aufgezeichnet. Daraus berechneten sie, wo der Hauptstandort der jeweiligen Person ist. Jedes Mal, wenn jemand diesen Hauptstandort verlassen hat, wurden Dauer und Ziel dieser Reise berechnet.

Diese Reisedaten wurden dann mit Karten über die Ausbreitung von Malaria verglichen. Ziel war es, herauszufinden, wie das Reiseverhalten von Menschen zur Ausbreitung der Tropenkrankheit beiträgt.

Die Studie gibt’s bei Science, eine Pressemitteilung bei Harvard.

Dieses Projekt verdeutlicht den Konflikt von Big Data und Datenschutz. Wie netzpolitik.org berichtete, will Großbritannien die Krankenakten aller Einwohner zentral sammeln und verknüpfen, um diese ebenfalls Forschern zur Verfügung zu stellen.

Es ist durchaus möglich, aus großen Datenmengen interessante Fakten zu extrahieren, um die Wissenschaft voranzubringen. Die datenschutzrechtlichen Implikationen sind jedoch unübersehbar. Nach gängigen Definitionen sollte Open Data dort aufhören, wo personenbezogene Daten betroffen sind. Eine Verwendung solcher Daten ohne die Einwilligung der Betroffenen scheint zumindest in Deutschland datenschutzrechtlich nicht vorstellbar. Zudem greifen Konzepte wie Anonymisierung zunehmend nicht mehr, weil diese mehr und mehr rückgängig gemacht werden können.

Was haltet ihr von dieser Studie?

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

17 Ergänzungen

  1. Ich finde es bezeichnend, dass Menschen, die in Harvard forschen und bei Science veröffentlichen können, ungefragt die Daten solcher Menschen analysieren, die sehr arm, sehr ohnmächtig und fast alle PoC sind.

    1. Und sicher nichts dagegen haben, wenn ihre anonymisiertes Bewegungsmuster bei der Malariabekämpfung hilft weil sie andere Probleme haben als darüber zu heulen, dass Leute, die sie nie treffen werden, nachvollziehen können wo sie irgendwann mal waren.

      1. Es mag sein, dass sie nix dagegen haben, dass ihre Daten zur Malariaforschung verwendet werden. Allerdings können die Forscher nicht garantieren, dass nicht eine andere Behörde Zugang verschafft und die Daten nutzt, um irgendwen zu verfolgen (in den USA schon öfter geschehen).

  2. Ich bin ein großer Freund von Datenschutz, aber ich sehe hier das riesige Problem nicht. Hier wurden Massendaten anonymisiert verwendet, um Bewegungsdaten mit Malariaausbreitung zu verbinden. Daraus ist wohl kaum auf einzelne Personen ein Rückschluss möglich, daher sind keine personenbezogenen Daten betroffen.

    Das gleiche geschieht, ohne Bezug zu Malaria, tagtäglich auf deutschen Straßen und Autobahnen, oder was meint ihr, wie Google, Apple, Nokia, TomTom und wie sie alle heißen ihre schönen Verkehrsanzeigen bekommen, wo grade Stau ist und wo nicht? Das geht auch alles über anonymisierte Bewegungsdaten.

  3. „will Großbritannien die Krankenakten aller Einwohner zentral sammeln und verknüpfen,“ Und wer aus der falschen Gegend kommt bekommt nie mehr einen Job, große Unternehmen und der Staat lassen sich schon jetzt von Bewerbern Blutproben geben, man will ja keinen einstellen, der vielleicht krank ist oder entsprechende Anlagen hat ;)

  4. Na ja, ist alles eine Frage der Methodik. Wenn man sowas zulässt, aber nur dann, wenn die Echtschlüssel (IMSI, Telefonnummern, etc) durch Werte aus einer Sequence ersetzt und die Originaldaten vernichtet werden, wenn man den Zugang zu und die Vernichtung der Originaldaten nur unter unabhängiger Aufsicht macht, wenn … ja, wenn!

    Das Problem ist, das passiert halt nicht. „Man könnte die Daten ja noch brauchen!“, oder so. Gar nicht mal bösartig.

    Ausserdem: was heisst schon unabhängig. Mit Geld kann man aus jemand Unabhängigen sehr schnell jemand Abhängigen machen.

    Andererseits fallen die Daten nun mal sowieso an. Wenn ich den Forschern und ihrer Methodik misstraue, warum sollte mein Misstrauen dort aufhören? Wenn die Daten da sind (und das sind sie, wenn auch vielleicht nur kurz, immer), dann lässt sich stets wer finden, der Interesse daran und die finanziellen Mittel dafür hat, die Daten abzuschnorcheln. Das sind dann z.B. die Regierungen und Geheimdienste. Die haben’s auch nicht nötig, Daten so einer Studie zu verwenden.

    Wie gesagt, prinzipiell ist an der Studie nichts Böses. Ganz im Gegenteil. Ich meine, man sollte zumindest den Versuch einer Regelung wie am Anfang angeführt unternehmen. Die meisten Forscher werden sich dran halten (warum auch nicht) und die Bösen haben ohnehin bessere Möglichkeiten.

  5. Wurden die Daten anonymisert, d.h. ohne Rückschluss auf Handy-Nutzer verwendet/an Forscher überreicht? Wenn ja, sehe ich kein Problem damit. Leider wird dieser entscheidene Faktor im Bezug auf diese konkrete Studie und Vorgehensweise im Text des Artikels nicht erwähnt. Das wäre das erste, wonach ich als Journalist bei dieser Studie schauen würde.

    1. Der vorletzte Satz nochmal:

      Zudem greifen Konzepte wie Anonymisierung zunehmend nicht mehr, weil diese mehr und mehr rückgängig gemacht werden können.

  6. tl;dr: mir ging es nicht um Aluhutdiskussionen, sondern um postkolonialen Techniktransfer.

    Ich bezweifle gar nicht den Sinn.
    Ich finde es nur schwierig, so etwas ohne jede Autorisierung mal eben auszurollen. Es wäre ja nicht das erste Mal, das neue Technologien (Hochhaussiedlungen bspw.) in Kolonien oder ehemaligen Kolonien ausprobiert werden.
    Man hätte sich das ja auch vom kenianischen Parlament genehmigen lassen können. Sicherlich hätte niemand „auf gar keinen Fall!“ gesagt.
    Das hätte sicherlich auch eine Debatte über die Möglichkeiten von Big Data in Kenia ausgelöst. Und vermutlich einiges angestoßen. So kommt alles zu dem Thema aus dem globalen Norden und die Menschen in Kenia sind sehr passive Empfänger. Selbständigkeit und Souveränität fördert das nicht.

    1. Gut auf den Punkt gebracht, danke.

      Das Mißbrauchspotential ist leider immer groß – und alle Skepsis nur allzu berechtigt, wie „die Geschichte lehrt“. Afrika ist halt immer noch eine große Schatulle, in die man greift, wenn man braucht. Was für Malariastudien und -bekämpfung sinnvoll sein könnte, kann adaptiert zu einer großen Gefahr nicht nur für Menschen in Kenia sein und/oder werden.

      Der Abstraktionsgrad bei vielen, die sich mit Überwachungstechnik – um nichts anderes handelt es sich hier – beschäftigen, ist doch auch höher, als er in den Kommentieren hier anzutreffen ist? Allein der Zusatz „ohne deren Einwilligung“ wäre, zu ähnlich gelagerten Zwecken, bei einem Einsatzgebiet innerhalb eines Gebietes der „westlichen Wertegemeinschaft“ sicher einen Aufschrei in „der Szene“ wert gewesen.

      Wenn man für Afrikaner was tun wollte, könnte man vielleicht mit Bewässerungsanlagen anfangen, Drohnenterror einstellen, die Teilhabe am Weltmarkt ermöglichen, Autonomie fördern, Landraub einstellen, IWF-Knechtschaft zurückfahren, Unterstützung für brutale Dikatoren und Militärs zurückfahren, Regimewechsel den Menschen überlassen – und so vieles mehr. Pointiert gesagt: Mit viel perversem Neusprech und unerbittlicher Aggression (nicht nur militärisch) läßt man, wie zu (nie abgebrochenen) Kolonialzeiten, auch weiterhin „den Neger verrecken“.

      1. So schön der letzte Absatz ideologisch auch ist, aber Malaria ist eines der zentralen Problem in den ärmsten gebieten der Welt. Jährlich sterben daran über eine Millionen Menschen. Es ist also viel effizienter für ein paar läppische Millionen Euro ein Mittel gegen Malarian zu finden, als irgendwo ein Regime zu stürzen oder riesige Summen in kaum nützliche Dinge zu pumpen. Außerdem: wer sagt denn, dass man nicht an einer Sache forschen kann und gleichzeitig andere sinnvolle Hilfsmaßnahmen fahren kann. Hier gibt es doch überhaupt kein Entweder-Oder.

  7. Bald schon werden wir künstliche Intelligenzen haben (Siehe IBM Watson) welche in der Lage sind alle Datenströme der Welt zu verarbeiten und entsprechende Schlüsse daraus zu ziehen.

  8. Was ich davon halte? Die Wissenschaft wurde immer für destruktive Ziele missbraucht. Warum sollte das hier anders sein?

  9. Kompliment für diesen Blog-Eintrag, das zeigt warum es so schwer ist sich bei diesem Thema eine feste Meinung zu machen, es gibt immer die Vor- und Nachteile.

  10. Wie schon von anderen Kommentatoren angedeutet wurde, ist Malaria durchaus ein großes Problem in afrikanischen (und anderen) Ländern, und daher sind diese Daten sicherlich sehr hilfreich. Weiterhin wurden in dieser Studie keine Personen identifiziert, sondern nur Mobilfunkteilnehmer (und zwar mit einer gehashten ID, eine Identifizierung ist daher also schwierig). Die Autoren geben auch eindeutig an, daß diese Daten nicht frei verfügbar sind: „Mobile phone data were provided by an anonymous service provider in Kenya and are not available for distribution.“

    Für einen Epidemiologen sind solche Daten – ebenso wie Daten des britischen Gesundheitssystem – natürlich ein wunderbares Werkzeug, denn sie erlauben den Ausbruch und die Verbreitung von Krankheiten schnell und relative objektiv zu verfolgen. Mit klassischen Mitteln – gar mit einer direkte Erhebung – wäre das nicht möglich. Dadurch, daß die Daten anonym (aber auch ohne Einwilligung der betroffenen) gesammelt werden, verhindert man, daß durch die Beobachtung eine Verhaltensänderung eintritt (was oft passiert), bzw. daß nur eine bestimmte Gruppe der Beobachtung zustimmt (was die Ergebnisse oft erheblich verfälscht).

    Generell bin ich der Ansicht, daß man anfallende Daten auch für solche Zwecke nutzen sollte, solange sichergestellt ist, daß sie ausreichend anonymisiert werden (und hier ist mein Vertrauen in Harvard größer als in eine kleine oder unbekannte Einrichtung). Zum einen bietet das die Möglichkeit, schnell neue Gefahren zu erkennen (also z.B. Krankheitsausbrüche), die Verbreitung zu untersuchen und vielleicht auch im Nachhinein Ursachenforschung zu betreiben. Durch die große Zahl von Datensätzen, die dadurch zur Verfügung stehen, kann man deutlich bessere Modelle erstellen und Vorhersagen machen. Andererseits verstehe ich natürlich auch die Bedenken, daß Daten mißbraucht werden können, und ich sehe hier keine einfache Lösung.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.