Millionen Nutzerdaten von Facebook vor Veröffentlichung

ReadWriteWeb berichtet in einem ausführlichen, aber ausgesprochen unkritischen Artikel über die Pläne von Pete Warden, große Mengen an Nutzerdaten „für wissenschaftliche Arbeiten“ zugänglich zu machen:

This Wednesday, Warden will make Friend, Fan page and name data from hundreds of millions of Facebook users available to the academic research community. It’s a move that Facebook has to have seen coming, a move that many in the data-centric community have been calling on the company itself to do for years, and an event that’s been complicated by Facebook’s recent privacy policy changes, which have muddied the waters of right and wrong but rendered even more data available for outside analysis.

Wardens Projekt erinnert stark an den Skandal um SchülerVZ, bei dem ebenfalls massiv Nutzerdaten gecrawlt wurden, was eigentlich nicht hätte passieren dürfen. Dem wissenschaftlichen Interesse müssen hier starke Datenschutzbedenken entgegengebracht werden.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

22 Ergänzungen

  1. Dem wissenschaftlichen Interesse müssen hier starke Datenschutzbedenken entgegengebracht werden.

    Datenschutz gibt es in sozialen Netzwerken nicht – das müssen viele Benutzer offensichtlich noch lernen.

  2. Warum soll man sich auch Gedanken um Datenschutz machen, wenn noch nicht einmal das eigene Geschäftsmodell konkretisiert werden kann?

  3. Hmmm, nein, das ist nicht das Gleiche wie der StudiVZ Skandal. Hier werden keine Nutzerdaten illegal von Aussenstehenden abgegriffen, hier werden die Nutzerdaten vom Betreiber gezielt weiter gegeben.

    Allerdings hoffe ich mal, dass die Daten anonymisiert weiter gegeben werden. Und sie werden immerhin nicht an kommerziell Interessierte weiter gegeben, sondern zu wissenschaftlichen Auswertungen. Anstatt pauschal und unreflektiert einen Datenschutzskandal zu vermuten, sollte man diese Dinge vielleicht vorher abklären.

    Wenn allerdings die Daten nicht anonymisiert weiter gegeben werden, dann handelt es sich um einen ganz massiven Skandal, und um einen Vertrauensbruch. Aber, wie gesagt, erst mal checken, dann ausrasten. Oder eben auch nicht.

  4. @Siegfried

    Die Daten werden nicht von Facebook selbst herausgegeben, wie Warden im verlinkten Artikel ja selbst beklagt.
    Dazu kommt, dass die Daten auch nicht anonymisiert werden. Gerade die Analyse der Namen hält Warden ja für besonders interessant.

  5. @Siegfried:

    Die „Illegalität“ im Fall SVZ ist doch bisher keinesfalls erwießen, div. Vorverurteilungen mal außen vor ;-)

  6. Also wenn die Userdaten nicht von Facebook herausgegeben wurden, dann können sie eigentlich nicht völlig legal beschafft worden sein.

    Und somit hätten die Betreiber von Facebook quasi die Pflicht, Juristisch dagegen vor zu gehen. Alleine schon, um nicht das Vertrauen der Mitglieder zu verspielen.

  7. @Siegfried: Anonymisierung bringt bei so hochkarätig vernetzten Daten auch nicht viel. Man nennt das Entropie und man kommt da mit recht wenigen Daten schon auf den genauen Nutzer. Man geht da übrigens von „33 bits of entropy“ aus (gestern bei der EFF gelesen) und dann gibt es eben statistische Verfahren, mit denen man auch ermitteln kann, welche Daten zu was für einer Eingrenzung reichen.

    Gibt auch einen Artikel dazu, wie man anonymisierte Daten wieder aufschlüsselt, den ich aber immer noch nicht gelesen habe. Der heißt „de-anonymizing social networks“ (Arvid Narayanan und Vitaly Shmatikov). Wurde mir mal von einem Studenten geschickt.

  8. Das die Daten von Facebook gespeichert werden und das sogar nach Löschung des eigenen Accounts war schon vorher bekannt. Wer sich also in sozialen Netzwerken anmeldet, muss sich bewusst sein, dass die Daten nicht wirklich sicher sind, auch wenn das immer gesagt wird (meine Meinung!). Jeder muss selbst wissen, was er mit seinen persönlichen Daten macht!

  9. @Mark: Facebook sammelt auch Daten über Nicht-Registrierte (also Freunde von Registrierten etc.). Ich habe das jetzt nicht so genau verfolgt, wie das passiert, aber Möglichkeiten gibt es ja genug: Suchanfragen der Freunde und die automatische eMail-Kontendurchsuchung sind zwei, die mir gerade einfallen.

    Aber das sind ja wenigstens mal keine „Nutzerdaten“.

  10. Ich habe mal bei Twitter nach anonymisierten „Social Graph“-Daten nachgefragt (also „a folgt b“, wobei a & b keine Usernamen oder IDs sein sollen), da erklärten sie mir, das würden sie nicht herausgeben, aber ich könnte es ja gerne spidern. (Dabei würde natürlich deutlich mehr persönliche Info abfallen, aber halt nicht der komplette Graph. Den möchte Twitter wohl beschützen, massenhaft Userdaten spidern ist aber OK, solange es innerhalb der Bandbreitengrenzen bleibt.)
    Andererseits ist Twitter natürlich weniger schlimm, da man sämtliche Information selbst kontrolliert

  11. Hmmm ja, de-Anonymisierung ist im Prinzip bekannt. Ob oder in wie weit das hier gelingt, mal sehen. Aber eine Anonymisierung wäre wenigstens eine klitzekleine Datenschutzmaßnahme gewesen. So sieht das ja aus, als wäre der Datenschutz endgültig über Bord gegangen. Und kein Hahn kräht danach. Das wird vermutlich wieder als Argument herhalten, warum es zur Terrorbekämpfung gar nicht notwendig ist, Datenschutz überhaupt zu berücksichtigen: Die Leute interessiert das doch nicht.

    Ich selbst habe keinen Facebook Account. Eben aus diesem Grund. Es ist mir nicht wohl dabei, dass meine Daten überall bei kommerziell interessierten Firmen rumliegen. Aber indirekte Daten gibt es natürlich, von Freunden, die mich zu Facebook eingeladen haben.

    Andererseits ist ja auch jeder Kommentar zu einem Blogartikel eine Art Offenbarung der eigenen Person. Aber soll ich deswegen mit dem Kommentieren aufhören? Das kann es auch nicht sein.

    Heute Abend kriege ich Besuch von Planetopia wegen des Funk-Kamera „Skandälchens“. Ich werde den Reporter mal fragen, woher er meine Daten hat. Ich vermute mal, von meiner Webseite. Aber ich wüsste es eben gerne. Die Idee, Werbetreibende zu einer Bekanntgabe ihrer Adressquellen zu verpflichten, ist daher schon gut und richtig. So hat Jeder es wenigstens zu einem kleinen Teil selbst in der Hand, was er draus macht. Man kann die Daten z.B. zum persönlichen reputation management einsetzen. Oder man kann sich aktiv dagegen wehren.

    Wir werden das Rad der Zeit nicht zurückdrehen können (und wohl auch nicht wollen), aber vielleicht ist es ja möglich, den einen oder anderen richtigen Schritt zu tun.

    Was Facebook (und auch Twitter) angeht, bestätigt mich das in meiner Verweigerungshaltung :)

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.