Der Aufenthaltsort und die Wege aller Geräte, die das W-LAN auf der re:publica 2013 verwendet haben, sind jetzt auf einer interaktiven Karte nachvollziehbar. Eine Web-Anwendung visualisiert die Besucherströme der Konferenz, die anonymen Rohdaten gibt es zum Download. Die Visualisierung zeigt, dass Mobilfunkgeräte mobile Tracking-Devices sind – und was die beliebtesten Veranstaltungen waren.
Da das W-LAN und das Internet auf der diesjährigen re:publica funktionierte, wurde es auch fleißig genutzt. Mehr als 6.700 Geräte haben sich eingebucht. Der Datensatz, wann welches Gerät (identifiziert anhand der Hardware-Adresse des jeweiligen WLAN-Adapters) welchen Wireless Access Point verwendet hat, ist jetzt anonymisiert (also ohne die MAC-Adressen) zum Download erhältlich: republica13-wlan-data.csv.zip (1,5 MB) Dank dafür geht an die Netzwerk-Techniker von picocell und newthinking. Die Daten sehen so aus:
Zeit | Accesspoint | Raum | x (ungefähr) | y (ungefähr) | fortlaufende Gerätenummer |
---|---|---|---|---|---|
2013-05-05 T11:46:00.000Z | ap-r1-m2-001 | lounge | 1.48162 | 0.19452 | 0 |
2013-05-05 T11:46:00.000Z | ap-r1-m2-001 | lounge | 1.48162 | 0.19452 | 1 |
2013-05-05 T11:46:00.000Z | ap-r1-m2-002 | garderobe | 1.27946 | 0.11638 | 2 |
Die Daten-Spezialexperten von OpenDataCity haben daraus einen interaktiven Plan erstellt. Hier ein kurzes Interview mit den Machern:
netzpolitik.org: Coole Visualisierung! Wie lange habt ihr dafür gebraucht?
OpenDataCity: Vor knapp 10 Tagen haben wir die Daten bekommen. Seitdem hat bei uns vor allem Michael Kreil viel Zeit damit verbracht, die App zum Laufen zu bringen.
netzpolitik.org: Was war die interessanteste Erkenntnis?
OpenDataCity: Das es geht. Theoretisch war uns das klar. Es auszuprobieren, zu sehen und dann noch für alle sichtbar zu machen, ist was ganz anderes.
netzpolitik.org: Was können wir aus der Visualisierung lernen?
OpenDataCity: Einerseits zeigt re:log, wie viele Datenspuren wir oft hinterlassen. Insofern wäre gut, wenn die Anwendung dazu beiträgt, dass Leute erst einmal kurz nachdenken, warum jemand ein „Free Wifi“ anbietet. Anderseits ist re:log aber auch ein interessantes Tool, zu Dokumentation und Analyse von solchen Großveranstaltungen.
Weitere Hintergründe gibt’s auch im Blog von Lorenz Matzat auf datenjournalist.de:
Da die Macher einen detailliertes Mitschneiden des W-LAN nicht angekündigt hatten – etwa die Aufzeichnung der gesamten Hardware/MAC-Adressen oder des Traffics auf einem Gerät – kann aus Datenschutzgründen nur der Aspekt Verbindungsdauer und -ort ausgewertet werden.
Fürs kommende Jahr, so wird angekündigt, wolle man aber “gerne vom ‘Aluhut-’ in den ‘Spackeria-Modus’ wechseln” und eine tiefergehende Analyse ermöglichen.
Ich finde die Idee gut, hätte es aber noch besser gefunden, wenn auf der Konferenz darüber aufgeklärt worden wäre, dass die Daten aufgezeichent werden. Auch wenn jetzt der Lerneffekt größer ist.
Aber das heist doch trotzdem, ihr habt eine Vorratsdatenspeicherung inklusive MAC vorgenommen und publiziert die Daten nun annonymisiert.
Könnt ihr nachweisen, das ihr die Roh-daten ordnungsgemäß vernichtet habt?
Wie soll ich Dir das bitteschön nachweisen?
rm -f unter notarieller Aufsicht?
Na aber wenn dann erst nach nem shred. Außerdem hätte es nen Code-Audit gewesen sein müssen.
Ja, und dann muss der Notar glauben, dass es nur auch nur diese Version vom Skript durchweg angewendet wird / es keinen anderen Bestand gab. Ja, das macht jurisitisch wahrscheinlich Sinn, aber technisch bringt das keinen Unterschied.
Also: Nein.
Alles klar.
Wow, coole Visualisierung.
Und jetzt stelle ich mir das Ganze grad vor, visualisiert mit Mobiltelefonen im GSM-Netz für ganz Deutschland…
Der feuchte Traum (bzw. schon Realität bei NSA & Co.) von überwachungsgei.. äh sicherheitsgeprägten Beamten.
Ob die Funkzellenüberwachung in Dresden (Handygate mit 35.000 Betroffenen) auch so „schön“ bei den Polizeibehörden dargestellt wird?
Ich finde es einen absoluten Skandal!
Wie kann man sich als Portal gegen Datenspeicherung einsetzen, sich als die Retter des Internets aufspielen und gegen alle staatlichen Überwachungen kämpfen und selbst bei den Veranstaltungen alles aufzeichnen?
Damit habt Ihr endgültig mein Vertrauen und vor allem für mich auch die Glaubwürdigkeit verloren.
Mein Abo der Blogs habe ich soeben gelöscht und weiterempfehlen kann ich euch auch nicht mehr. Das macht mich sehr traurig, denn ich sah in Netzpolitik.org einen der wenigen letzten Hoffnungsschimmer. Offenbar habe ich mich getäuscht :-(
Bereits mit Beginn der Kommerzialiserung des Blogs habe ich begonnen, am Projekt zu zweifeln, aber diese Dreistigkeit war einfach zu viel :-(
Es zeigt eindrucksvoll wie schnell man dem Reiz der Datensammlung erliegt. Da haben selbst die Verfechter des Datenschutzes und der Datensparsamkeit nicht ablehnen können, aber es zeigt natürlich auch, wie wichtig es ist für strenge Regeln mit dem Umgang mit Daten zu kämpfen.
Kriegt euch wieder ein. Stehen an den huschenden Pixeln etwa Namen dran? Steht doch da, dass die Daten schon bei der Erfassung sicher anonymisiert wurden. Ich finds cool. Stellt euch mal vor, die Technik hätte es vor 3 Jahren auf der Loveparade gegeben, das hätte Leben retten können.
Genau. alles nur zur Sicherheit. Sagen Friedrich und Co auch. Dann ist ja alles supi dupi.
Gibts nicht auch einen Fall von KiPo? Irgendwas, was sonst auch immer kommt? Na komm…
Stehen an den huschenden Pixeln etwa Namen dran?
bislang nicht.
Es wäre durchaus aber denkbar, mal durch zB twitter zu gehen und sich eine Teilnehmerkandidatenliste zu erstellen
usw.
Oben: Daten auf Vorrat und ohne Einwilligung gespeichert und daraus Bewegungsproflile erstellt. Unten drunter:
„Wir wollen netzpolitik.org weiter ausbauen. Dafür brauchen wir finanzielle Unterstützung, auch um weiterhin einen Full- RSS-Feed anbieten zu können.
Investiere in digitale Bürgerrechte.“
Merkt ihr selber oder braucht ihr eine ausführliche Erklärung? #fail
netzpolitik.org hat weder das WLAN betrieben, die Daten gespeichert oder die Visualisierung gemacht.
Ach so, und wenn man die von anderen gesammelten Daten nur weiterverwendet ist alles gut?
Merkt Ihr eigentlich noch was?
Der Artikel präsentiert ein Beispiel dafür, dass auch anonymisierte Daten viel wert sein könnten – „viel wert“ im Sinne der Überwachung. Denn die Visualisierung der WLAN-Daten stellt sehr eindrucksvoll dar, dass selbst mit anonymisierten Daten viel Schindluder getrieben werden kann.
Mann stelle sich vor, eine „Zielperson“ wurde bei drei verschiedenen Vorträgen gesichtet (real oder in den Videoaufzeichnungen, die manchmal auch das Publikum zeigen). Es wäre nun ein leichtes, aus den Daten die weiteren Aufenthaltsorte der Person zu jedem Zeitpunkt herauszufiltern!
Ein Fall wie „Funkzellenabfrage in Dresden“ mit nackten Zahlen („zwei Tage lang 35.000 Geräte“) ohne Visualisierung ist für viele Leser viel zu abstrakt. Viele fragen sich: „Na und? Wenn’s denn der Sicherheit dient!“
In der Visualisierung dagegen kann sich jeder wiederfinden, der persönlich mi einem eingeschalteten WLAN-Gerät vor Ort war. Und auch der interessierte Leser, der nicht vor Ort war, kann ganz einfach bestimmte Personen/“Punkte“ durch den Tag verfolgen.
netzpolitik.org hat hier genau das geschafft, was sie vermutlich(?) erreichen wollten: Ein perfekt visualisiertes, eindrucksvolles Beispiel als Argument gegen eine Vorratsdatenspeicherung!
Und die Ankündigung für nächstes Jahr soll dafür sorgen, dass die Veranstaltung nicht so überlaufen ist?
Geld für Netzpolitik einsammeln ist voll okay.
Diese Aktion nicht.
Es wurden nicht nur Positionsdaten gespeichert, sondern auch der Gerätehersteller : http://www.picocell.de/rp13/rpDevices.php
Finde es schon etwas komisch wenn eine Seite, welche gegen Überwachung (Funkzellenabfrage, etc.) protestiert, nun selbst die Wlanverbindungen/Bewegungsprofile ihrer Konferenzbesucher veröffentlicht.
Definitiv ein Fehlgriff in Sachen Netzpolitik. xD
Schließe mich den Lesern an, die ein ungutes Bauchgefühl bei diesem Artikel bekommen…zumal der O-Ton bei mir nicht nach: „Leute guckt euch den Kack an!“ sondern eher nach „Gail, das geht ja voll gut!“ klingt.
@alper hat sehr anschaulich dazu gebloggt: http://alper.nl/dingen/2013/05/dont-release-anonymized-datasets/