Einzigartig in der Masse: Aus Mobilfunk-Bewegungsdaten können ganz einfach Einzelpersonen identifiziert werden

Die Art und Weise, wie sich Menschen bewegen, ist sehr einzigartig. Einem Forscherteam ist es gelungen, Einzelpersonen in großen Datensätzen von Bewegungsdaten zu identifizieren, wie diese von Mobilfunk-Anbietern gespeichert werden. Statt immer weitere Datenberge anzuhäufen, plädieren sie für weitere Forschung, da Bewegungsdaten nur noch wichtiger und aussagekräftiger werden.

unique-in-the-crowd-590

Gestern wurde im Open Access Journal Scientific Reports die Studie Unique in the Crowd: The privacy bounds of human mobility (PDF) veröffentlicht. Vier Forscher vom MIT Media Lab und der Katholischen Universität Löwen untersuchen darin einen großen Datensatz an Bewegungsdaten und de-anonymisieren Einzelpersonen aus dem Datenhaufen.

Bewegungsdaten fallen beispielsweise für jedes einzelne Mobilfunk-Gerät bei den Mobilfunk-Betreibern an. Smartphones übertragen ihren Standort aber auch an Internet-Dienste, so verarbeitet allein der Anbieter Skyhook mehr als 400 Millionen Anfragen nach Ortsdaten pro Tag und Werbe-Netzwerke bekommen Ortsdaten von der Hälfte aller Smartphones. Mal ganz abgesehen von Diensten, denen man den eigenen Standort ganz freiwillig mitteilt, wie Foursquare oder Ingress.

Die Forscher haben jetzt einen Datensatz erhalten, der die Bewegungsdaten von 1,5 Millionen Menschen über 15 Monate enthielt. Das ist ein „bedeutender und repräsentativer Teile der Bevölkerung eines kleinen europäischen Landes“. Diese Daten kamen von einem Mobilfunk-Anbieter, der Zeitraum umfasste April 2006 bis Juni 2007. Mit diesem „Big Data“ Datensatz konnten sie zeigen, dass die räumliche Bewegung einzelner Menschen „sehr einzigartig“ ist.

In einem Datensatz, wie er bei jedem Mobilfunk-Anbieter anfällt (also relativer Abstand der Funkzellen-Antennen und ein Orts-Eintrag etwa alle Stunde), kann man mit nur vier bekannten Datenpunkten Zeit/Ort circa 95 Prozent aller Menschen identifizieren. Das könnten beispielsweise die Adresse von Privatwohnung, Arbeitsplatz und Geo-Tags von Tweets oder Bildern sein. Mit nur vier solcher Daten kann man in einem riesigen Datensatz die Bewegungen einer Person zuordnen über mehrere Monate nachvollziehen, genau wie das Malte Spitz demonstriert hat.

Das Fazit der Forscher:

These results should inform future thinking in the collection, use, and protection of mobility data. Going forward, the importance of location data will only increase and knowing the bounds of individual’s privacy will be crucial in the design of both future policies and information technologies.

Diese neue Studie reiht sich nahtlos in weitere Forschung zum Thema Geodaten ein:

Auch Polizeibehörden nutzen solche Datenberge, wie die Enthüllungen zur Funkzellenabfrage gezeigt haben. Und spätestens nach der Bundestagswahl wird es auch in Deutschland wieder Forderungen geben, diese Daten anlasslos monatelang zu speichern.

20 Ergänzungen

  1. Der Link zum PDF funktioniert nicht. Und es wäre vielleicht schön, auch die Autoren zu nennen.

    1. Danke für den Hinweis, der Link ist gefixt.

      Die vier Namen habe ich erstmalig nicht mit ausgeschrieben, da der Mehrwehrt eher gering ist und das Original-Paper doppelt verlinkt ist, wo natürlich alle Namen stehen.


      1. da der Mehrwehrt eher gering ist

        Vielleicht ist das an euch –netzpolitik.org-Autoren– vorbeigegangen, aber wir hatten in letzter Zeit in Deutschland ein Paar Rücktritte in der derzeitigen Regierung, die im Endeffekt darauf beruhten, das Autoren dachten, der Mehrwert andere Autoren zu nennen, wäre eher gering…

        Um hier auch noch inhaltliche Kritik zu leisten: Deine Überschrift stimmt nicht.

  2. Was heißt denn hier, nach der Wahl. Wurde nicht gerade erst ein Gesetz durchgeboxt, dass Ordnungswidrigkeiten den Datenschutz außer Kraft setzen?!
    Und ab morgen gibt es die seit ‚1984‘ beliebte Anbetung unserer ‚geliebten FührerInnen‘ oder doch lieber a’la Korea – wer die Wahl hat, hat die Qual. In diesem Sinne noch eine schöne Demokratie.

  3. Interessant finde ich, dass die Forscher jetzt Bewegungsdaten von 2006/2007 von „einem Telefoniebetreiber“ bekamen, wo diese doch laut Datenschutz solche Daten gar nicht speichern dürften… Hmm…

    1. Laut Vorratsdatenspeicherungs-Richtlinie müssen die sogar gespeichert werden. Leider habe ich nicht rausfinden können, in welchem Land das war.

    2. 1) Lies mal TKG98, da steht, wenn speichern (aus welchem Grund auch immer) dann anonymisiert.
      2) 1.5Mio Leute, representativ, aus einem kleineren, europäischen Land bedeutet nicht automatisch DE.

  4. Leute, wo ist euer Problem???
    Weg mit diesem ganzen Handy, Smartphone, Tablet und Co. Mist.
    Hat bis vor ein paar Jahren auch keiner gebraucht und dient eh nur der Massenverblödung. Ich habe seit Jahren keines mehr und vermisse es nicht im geringsten.

  5. Das gibt es doch schon in anderer Form ewig. Das Handy war doch schon immer ein Instrument, mit dem man den Standort ausfindig machen konnte und einen evtll. Besitzer.

  6. Wir werden doch in allen Lebenslagen belogen und betrogen, also Datenschutz vergiss es, wir sind seit dem die Merkeln an der Macht ist, dem ganzen ausgesetzt, was die frühere DDR hatte, Stasi lässt grüßen!!!

  7. Der größte Fehler in dem Bericht beginnt schon in der Überschrift:
    Aus Mobilfunk-Bewegungsdaten können ganz einfach Einzelpersonen identifiziert werden

    Es können nämlich nicht Einzelpersonen identifiziert werden, sondern die Standort des Telefons, bzw. genauer gesagt der SIM-Karte.

    Übrigens könnte auch die Bäckereifachverkäuferin ein Protokoll führen, wann ich wie viele Semmel oder Brezen bei ihr einkaufe.

    1. Es kann auch sonst nie jemand zu 100% identifiziert werden, könnte ja eine Maske auf haben, oder der Zwilling sein. Und die Bäckerreifachverkäuferin ist weder ein Staat mit Gewaltmonopol und nahezu unendlichen Resourcen, noch haben sich die Bäckereifachverkäuferinnen zentral zusammengeschlossen um zentral alle Daten auswerten zu können.

  8. Ich wills doch noch mal erklären *seufz*. Zusammen mit den Verbindungsdaten (Anruf bei der Tochter, Anruf beim Frauenarzt, Anruf beim Arbeitgeber, Anruf durch jemanden aus der Peergroup, Aufenthaltsort am Arbeitsplatz …) ist eine Zuordung zu _einer_ Person mit sehr hoher Wahrscheinlichkeit möglich, automatisch durch Algorithmen ;)

  9. Und zum guten Schluss. Eines der Hauptprobleme ist der Fehler, also die Möglichkeit, dass man zu den 5% gehört, die das Smartphone nicht dabei hatten, wodurch man schnell in falschen Verdacht gerät bzw. (ohne es zu wissen) auf irgendwelchen Listen geführt wird, vielleicht sogar vorsätzlich gesteuert. Fehlende Intelligenz ist auf Dauer der größte Feind der Sicherheit.

  10. Wie genau ist ein Handy ortbar OHNE GPS-Modul (z.B. altes Handy) und nach welchem Prinzip gehen sie vor, bzw. wie funktioniert es?

    1. Ergänzung … Über die Funkmasten, die Abstrahlrichtung und mithilfe von Algorithmen (Wahrscheinlichkeitsrechnung etc) über deine Bewegung, je häufiger, um so genauer wirds, und wenn man dann noch weiß, wo du wohnst, in welchem Verein du bist, welche Bekannte du in der Funkmastumgebung hast, bei welchem Arzt du bist usw kann mans schon ziemlich sicher sagen, wo du bist. Die Genauigkeit grundsätzlich liegt zZ so zwischen 50 und 200m, kann aber etwa dadurch deutlich erhöht werden, wenn man die Topografie mitberücksichtigt, in einer Einkaufstraße könnte man auch Referenzdaten mit verschiedenen Handymodellen aufnehmen, dann wirds nochmal genauer.

    2. Bis auf die Funkzelle in der es angemeldet ist .. Hängt bissl davon ab, wo du bist und in welcher Entfernung um dich rum Funkmasten sind.

      http://de.wikipedia.org/wiki/GSM-Ortung

      Die Signallaufzeiten kann man auch noch einbeziehen, dann wird´s genauer. Aber richtig gut ist nur GPS Ortung.

      Alle anderen Sache werden nur dann vor Gericht bestehen, wenn der Verdacht schon erdrückend war. Besonders ist stark frequenterten Regionen.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.