Big Data vs. Privacy: Großbritannien zentralisiert 52 Millionen Krankenakten für Forschung, Anonymisierung fraglich

In Großbritannien sollen die Krankenakten aller Einwohner zentral gesammelt und mit anderen Datenbanken verknüpft werden. Wissenschaftler sollen damit neue Erkenntnisse finden können. Die Regierung verspricht eine Anonymisierung der Daten – die immer schwieriger zu leisten ist.

Der Nationale Gesundheitsdienst und die medizinische Zulassungs- und Aufsichtsbehörde für Arzneimittel in Großbritannien haben das Projekt Clinical Practice Research Datalink (CPRD) gestartet. Der große Datenpool wird als „Revolution der medizinischen Forschung“ gefeiert. Ian Sample berichtet im Guardian:

Das CPRD wird Patientenakten in nie zuvor gesehenem Ausmaß verknüpfen und Patienteninformationen von Ärzten und Krankenhäusern mit anderen Datensätzen kombinieren, darunter Register über Krankheiten und psychische Gesundheit oder Gen-Datenbanken. Die kombinierten Datensätze können durchsucht werden, um Fragen der medizinischen Forschung zu beantworten. Die Ergebnisse werden mit Wissenschaftlern geteilt, sobald sie anonymisiert sind, um die Privatsphäre der Patienten zu schützen. Im Laufe der Zeit wird CPRD weitere Aufzeichnungen einbeziehen, darunter Daten über Umweltverschmutzung, Sozialfürsorge und Daten der UK Biobank, die DNA-, Blut- oder Gewebeproben von 500.000 Menschen besitzt. Schließlich werden ähnliche Systeme von kleineren Bevölkerungen wie Schottland und Wales angebunden.

Premierminister David Cameron verspricht: „Lassen Sie es mich deutlich sagen: Dies ist keine Gefährdung der Privatsphäre.“ Die Daten werden nämlich anonymisiert.

Eine nicht umkehrbare Anonymisierung wird im Zeitalter von „Big Data“ immer schwieriger. Bereits in den Neunziger Jahren gelang es Forschern, aus einem „anonymisierten“ Datensatz mit Krankendaten die Krankenakte des Gouverneurs von Massachusetts herauszufinden, der vorher Anonymität versicherte. Vor fünf Jahren haben Forscher der Universität Texas die Anonymisierung eines ganzen Datensatzes von Netflix gebrochen und rückgängig gemacht. Die Studien zum Thema De-Anomisierung häufen sich:

Informatiker haben unseren Glauben in den Schutz des Datenschutzes durch Anonymisierung, also den Schutz der Privatsphäre durch das Entfernen von persönlichen Informationen wie Namen oder Sozialversicherungsnummer in großen Datensätzen, zerstört. Diese Wissenschaftler haben gezeigt, dass sie Einzelpersonen oft mit erstaunlicher Leichtigkeit aus anonymen Datensätzen „re-identifizieren“ oder „de-anonymisieren“ können.

Auch die Königliche Gesellschaft Großbritanniens kam kürzlich in einem Bericht Science as an open enterprise zum Schluss:

In der Vergangenheit wurde davon ausgegangen, dass die Privatsphäre von Menschen in Datensätzen durch Prozesse der Anonymisierung, wie der Entfernung von Namen oder Anschrift, geschützt werden könnte. Allerdings haben eine beträchtliche Menge an Studien in der Informatik nun gezeigt, dass die Sicherheit von persönlichen Daten in Datenbanken durch Anonymisierung nicht garantiert werden kann, wenn aktiv nach Identitäten gesucht wird.

Die Auseinandersetzung von Big Data und Privacy hat gerade erst begonnen. Mal sehen, wie lange die britischen Krankenakten anonym bleiben.

Deine Spende für digitale Freiheitsrechte

Wir berichten über aktuelle netzpolitische Entwicklungen, decken Skandale auf und stoßen Debatten an. Dabei sind wir vollkommen unabhängig. Denn unser Kampf für digitale Freiheitsrechte finanziert sich zu fast 100 Prozent aus den Spenden unserer Leser:innen.

5 Ergänzungen

  1. Medizinische Forschung und Patientendaten ist ein *ganz* heikles Thema. Hier treffen die beiden Grundrechte der Forschungsfreiheit (bzw. nachgelagert das Urheberrecht) und dem Recht auf informationelle Selbstbestimmung aufeinander. Typischerweise ist dies ein Rechteungleichgewicht, da der Patient nur sehr allgemein aufgeklärt und es eigentlich nur darum geht, ihm schnellstmöglich eine Unterschrift unter die Patienteneinwilligung aufzuquatschen (ja „aufquatschen“, denn bei dem Prozess, der dadurch dann losgetreten wird, kann man das nur als solches bezeichnen). Der Patient soll altruistisch bereit sein, seine Patientendaten/-proben/-sequenzen herzugeben, nur damit irgendwelche Forscher vernetzt damit Wissenschaft betreiben können, sich die Köpfe darüber einschlagen, wer an welcher Stelle der Autorenliste stehen darf, bevor die Papers an die Elseviers dieser Welt verschenkt werden, welche sie im Anschluss daran an die Forscher zurückverkaufen. Von dem Zurückkaufen sind die Pharmaunternehmen natürich ausgeschlossen, da diese ja die klinischen Studien betreiben, an denen die Wissenschaftler zuvor forschen.

  2. Ist es nicht inzwischen egal?
    Es wird immer mit Orwells Welt verglichen. Der Unterschied ist aber, das Orwell davon ausging das der große Bruder alle gesammelten Informationen sinnvoll strukturieren und auswerten kann.

    Die Realität zeigt aber, das die Behörden zwar immer mehr Daten sammeln, die Masse der Daten aber eine sinnvolle Auswertung verhindern.

    Beispiel:
    Früher hielt man die Kameraüberwachung für ein Alheilmittel. Bis sich herausstellte das es unmöglich ist alle diese Bildschirme zu überwachen.
    Die Vorratsdatenspeicherung ist angeblich ein Dammbruch. Doch die Masse der Daten macht es unmöglich Relevantes herauszufiltern.
    Behörden kommen mit der Rastefahndung nicht mehr klar, sie speichern Daten von Millionen von Menschen und am Schluss wird das Verfahren eingestellt weil keiner mehr weiss was relevant ist.

    In Unternehmen das gleiche Problem. Der Internetzugang wird überwacht, aber standardmäßig wird das Ganze gar nicht ausgewertet weil keiner weiss worauf er achten muss und ob er überhaupt auf etwas Sinnvolles stößt.

    Ich denke das ist der Grund warum man sich an die Überwachung gewöhnt hat. Wiel sie keine negativen alltäglichen Konsequenzen hat. Die treten erst auf wenn etwas Außergewöhnliches passiert. Und dann wieder interessieren sich die Behörden irgendwie nicht für die Details.

    1. richtig angesetzt, aber nicht bis zum Schluss durchdacht. Denn gerade hier entsteht ja das Hauptproblem. Wenn die individuell nützliche oder gewünschte Auswertung nicht zufriedenstellend funktioniert, werden grobe Raster angelegt und falsche Treffer als Ergebnis miterfasst. So bist Du dann z.b. terrorverdächtig, weil Du in der falschen Funkzelle zur falschen Zeit eingeloggt warst oder bekommst eine teurere Versicherung oder schlechteren Kredit, weil Deine Nachbarn krank sind.

      Man muss nicht mal einem bösartigen Innenminister besondere Absichten unterstellen. Es zeigen sich auch bisher im Alltag die fatalen Konsequenzen (erklär mal Deinem Arbeitgeber, dass Du die letzten Tage nicht zur Arbeit erschienen bist, weil man Dich irrtümlicherweise als Kinderschänder/Terrorist/Raubnazikopiermörder festgehalten hat.

  3. Eine ausgewogenere Debatte über die Chancen und Risiken des gemeinschaftlichen Wissens über die faktischen Gesundheitszustände und Krankheitsentwicklungen in der Gesellschaft wäre auch durch Netzpolitik-Engagierte wünschenswert.

    Die übliche ausschliesslich warnende Mentalität mit den gewohnten Ausreissern in den Kommentaren Richtung Verschwörung und Verachtungstirade (s. die beiden ersten Kommentare auch bei diesem Post) ist einfach nicht mehr zielbringend.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.