In den USA ist am Donnerstag eine Klage gegen den Online-Videoverleiher Netflix eingereicht worden. Die Kläger fordern 2.500 Dollar Schadensersatz für jeden der 2 Millionen Kunden des Unternehmens, berichtet Wired: Threat Level.
Anlass ist ein Wettbewerb, den Netflix ausgeschrieben hatte, um seinen Empfehlungsalgorithmus zu verbessern. Der DVD-Verleiher stellte mehr als 50.000 Teilnehmern zwei Datensätze zur Verfügung. Der erste enthielt 100 Millionen Film-Bewertungen, zusammen mit dem Zeitpunkt der Bewertung, einer eindeutigen ID-Nummer für den Kunden und Informationen über den Film. Auf der Basis dieser Daten von 480.000 Kunden sollten die Wettbewerbsteilnehmer einen Empfehlungsalgorithmus erstellen, der 10% besser als Netflix eigener vorhersagen würde, wie diese Kunden andere Filme bewerten würden.
Die Daten waren derart schlecht anonymisiert, dass bereits nach wenigen Wochen zwei Wissenschaftler der University of Texas diverse Netflix-Kunden identifizierten. Sie verglichen dafür deren „anonyme“ Reviews in dem Datenset von Netflix mit solchen, die in der Internet Movie Database veröffentlicht wurden. Dadurch ließen sich Aufschlüsse u.a. über die sexuelle Orientierung und politische Einstellung der Betroffenen gewinnen. Threat Value schreibt dazu:
The complaint calls that the Brokeback Mountain factor, arguing that marketers will suck up the data, combine it with other data sets and start pigeon-holing people into marketing categories, based on assumptions about the movies they rated.
Ausgeliehene Filme und Bewertungen enthielten „Informationen von höchst persönlicher und sensibler Natur“, heißt es ist der Klageschrift. Die Daten würden die persönlichen Interessen und Kämpfe mit bestimmten Themen sichtbar machen. Threat Level führt dazu eine nicht offen lesbisch lebende Mutter an, die sich der Klage angeschlossen habe, weil sie befürchte, durch die Daten geoutet zu werden.
Informationen über ausgeliehene Videos gehören aus gutem Grund zu den „am stärksten datenschutzrechtlich geschützten Aufzeichnungen in den U.S.A.“, wie Threat Level schreibt. Der Hauptanwalt in der Kläger, Joseph Malley, hat dementsprechend erst kürzlich eine mehrere Millionen Dollar schwere Einigung mit Facebook erzielt. Das Social Network hatte über sein Werbeprogramm Beacon auch von Nutzern bei Blockbuster geliehene Videos gegenüber deren Freunden öffentlich gemacht.
Die jetzige Klage soll Netflix auch davon abhalten, einen weiteren Wettbewerb zur Verbesserung der Empfehlungen zu starten. Diesmal sollen Nutzerdaten herausgegeben werden, die Postleitzahlen, Alter und Geschlecht enthalten, dazu kommen Filmbewertungen und ID-Nummern anstelle von Benutzernamen.
Das sei eine „dumme Idee“ von Netflix, schreibt Threat Level und zitiert den Rechtsprofessor Paul Ohm. Der Wettbewerb sei „ein grober Datenschutzfehler, der Millionen Dollar an Strafen und Schadensersatzzahlungen kosten könnte“. Mit Postleitzahl, Geburtsdatum und Geschlecht gebe es eine 87%ige Chance, eine Person eindeutig zu identifizieren.
Eine Klage gegen Netflix wegen des ersten Wettbewerbs hält Ohm dagegen nicht für gerechtfertigt. Das Unternehmen habe nach „gutem Glauben“ („good faith“) gehandelt, indem es die Daten mittels einer Technik namens „Perturbation“ veschleiert habe.
„Sie verglichen dafür deren “anonyme” Reviews (…) mit solchen, die in der Internet Movie Database veröffentlicht wurden.“
Deswegen bauen wir in D.land mehrere Datenbanken auf.
Hier das Paper zur De-Anonymisierung der Netflix-Daten: http://www.cs.utexas.edu/~shmat/shmat_oak08netflix.pdf
Darauf sollte man mobilkom austria hinweisen: http://www.netzpolitik.org/2009/mobilfunkanbieter-gibt-bewegungsdaten-fuer-marketing-frei/
Da sieht man es mal wieder, man sollte besser keine legalen Mediendienste nutzen. Datenschutzmängel und DRM sorgen wirksam dafür das das niemand mehr nutzen will.