Müssen wir mit allem rechnen? Dataismus #3 Krankheiten, Gene und ewiges Leben

Große Daten – bitte was? Der Begriff „Big Data“ geistert seit Monaten durch Artikel, TV-Sendungen  und Radiobeiträge. Die weitaus meisten von uns haben dennoch, zumindest laut mancher Studie, keinen blassen Schimmer, was damit gemeint sein könnte. Mit einer Artikelreihe wollen wir deshalb ein paar Scheinwerfer in den Datenanalyse-Wald richten. Denn die enthüllte Überwachungs-, ist eigentlich eine „Berechnungsgesellschaft“. Darin sind die Geheimdienste nur einige Akteure unter vielen. 

Die Vorgeschichte steht hier und hier.

Wo verbrachten Sergey Brin, Mark Zuckerberg, Lana del Ray und David Petraeus eigentlich den Abend des 12. Dezember 2013? Dass sich zwei der wichtigsten Internetlenker, ein Ex-CIA-Chef und eine Hollywood-Sängerin zu einem gemeinsamen Dinner treffen, wäre wohl für sich stehend schon eine erzählenswerte Anekdote. Besonders wenn – wie an diesem Abend – noch der Schauspieler Kevin Spacey und der Medien-Großherrscher Rupert Murdoch dazukommen. Aber natürlich trafen sich die tech elite, military, and Hollywood starsnicht ohne Anlass.

Im Gegenteil – Brin, Zuckerberg und die anderen versammelten sich knapp zwei Wochen vor Weihnachten in den prunkvollen Hallen des NASA Ames Research Center um Wissen zu feiern. Ausnahmsweise nicht ihr eigenes, sondern bahnbrechende“ – aber von der Öffentlichkeit wenig wahrgenommene – Entdeckungen von Genetikern, Neurobiologen und Biochemikern, wie Michael Hall, Mahlon DeLong und Alexander Varshavsky. Jeweils drei Millionen US-Dollar erhielten die Wissenschaftler für ihre Erkenntnisse über die sogenannte tiefe Hirnstimulation (mit Elektroden-Implantaten im Gehirn sollen Krankheiten wie Parkinson oder auch Depressionen abgeschwächt werden) oder über den Proteinstoffwechsel im Inneren von Körperzellen (ein Vorgang, der Alterungsprozesse beeinflussen soll). Sieben Preise – sechs im Bereich Life Science, einer für Physik – stifteten Mark Zuckerberg und seine Frau Priscilla Chan, Sergey Brin und Ex-Partnerin Anne Wojcicki (die Gründerin von 23andme, ein US-Unternehmen, das billige und schnelle Gen-Tests anbietet), der chinesische Internetunternehmer Jack Ma und der russische Ex-Weltbanker und Investor Yuri Milner, mitsamt ihren Frauen Cathy Zhang und Julia Milner.

Der Breakthrough Prize in Life Science ist die weltweit höchstdotierte Auszeichnung im Bereich Wissenschaft –  Nobelpreisgewinner bekommen nur rund ein Drittel der Summe. An diesem Abend wechselten insgesamt 21 Millionen US-Dollar ihre Besitzer. Und so wenig nachvollziehbar es aussehen mag: Dass einige der momentan wichtigsten Personen des Silicon Valley horrende Summen in Humanbiologen stecken, geschieht absolut nicht zufällig.

Zuckerberg bezeichnete die Forscher als amazing heroes und their work in physics and genetics, cosmology, neurology and mathematics will change lives for generations. Die Biologie, die Medizin, Forschung an Medikamenten, die Entschlüsselung individueller DNA-Sequenzen – das alles ist zur information technology geworden, betonten die Stifter des Preises. Vor rund zehn Jahren entschlüsselten Wissenschaftler das erste menschliche Genom. Damit waren die Forscher damals 15 Jahre lang beschäftigt. Unser Bauplan ist darstellbar durch riesige Informationsabfolgen. Da die Rechenleistung, besonders der leistungsstärksten Computer, rapide zunimmt, lassen sich auch die Daten über die persönliche Veranlagung und Gesundheit immer schneller auswerten. Erst vor wenigen Tagen teilte der Chiphersteller Intel mit, dass es dem Unternehmen nun möglich sei, ein vollständiges Genom innerhalb eines Tages auszuwerten. Bis die US-Arzneimittelzulassungsbehörde FDA die Anwendung vor wenigen Monaten verbot, war die schnelle Datenauswertung das Erwerbsmodell von 23andme. Für knapp 100 US-Dollar konnten Kunden ihre Anlagen auf Alzheimer, Krebs und andere Krankheiten prüfen lassen. Die FDA hielt diese Analysen allerdings für wenig aussagekräftig. Denn bei medizinischen Fragen sind die Experten mittlerweile dazu übergegangen, unzählige und schwer zu fassende Abläufe im Körper, sowie die persönlichen Gewohnheiten und Lebensumstände einzubeziehen. Wie alt werde ich? Werde ich an Demenz, Krebs oder Bluthochdruck leiden? Aber auch: Warum altern wir? Welche Personengruppen mit welchen Gewohnheiten werden mit einer hohen Wahrscheinlichkeit zu langjährigen und kostenintensiven Pflegefällen?

Alle diese Fragen schreien förmlich nach einer Auswertung mit Big Data-Technologien, die es ermöglichen große, verschiedenartige Datenmengen möglichst in real time auszulesen und daraus Muster und  Vorhersagen abzuleiten. Wer einen Hammer besitzt, sieht überall Nägel: Google und Facebook verfügen über Soft- und Hardware, mit der Fähigkeit, in Sekundenbruchteilen komplexe Nutzerprofile mit der passenden Werbung abzugleichen oder versuchen, die Qualität von Texten durch Analyse von Wort-Häufungen und Kontext zu ermitteln. Aber die Big Data können auch vielschichtige Mechanismen von Krankheiten oder Arzneimitteln identifizieren. Dafür benötigt die Technik aber ihren Rohstoff: Daten.

Stufe 1 – Big Data im Gesundheitssystem

Sollten Blutwerte mit Gen-Datenbanken verknüpft und Risikokennzahlen oder Rohdaten an Krankenkassen, Pharmaunternehmen, Universitäten oder auch die Polizei gesendet werden? Bei diesen Fragen ist Deutschland noch in der Aushandlungsphase. Seit Anfang des Jahres ist die elektronische Gesundheitskarte (eGK) in Deutschland eigentlich Pflicht. Heute befinden sich allerdings wesentlich weniger Daten auf den Chipkarten der Krankenkassen als ursprünglich geplant. Sogenannte Basisdaten wie Name, Geburtsdatum und Versicherungsstatus sind gespeichert. Der freie Speicherplatz für Zusatzdaten wie verordnete oder rezeptfrei in der Apotheke gekaufte Medikamente, Diagnosen, Laborbefunde und Röntgenbilder (elektronische Patientenakte) bleibt bislang leer.

Ein Zustand, den auch deutsche Krankenkassen bedauern und als vorübergehend einstufen. Denn die Versicherten sollen bei sensiblen Daten selbst bestimmen können, wer zugreifen darf, was gespeichert und was wieder gelöscht werden soll. Deshalb kann die eGK in ihrer jetzigen Form nicht ihre geplante Funktionsfähigkeit entfalten. Die Zugangsschranken verhindern (momentan), dass Daten vieler Patienten zusammengeführt, Muster darin erkannt oder Risikogruppen für Krankheiten bestimmt werden können. Aus Big Data-Perspektive ist die elektronische Gesundheitskarte ein absoluter Rohrkrepierer. Die Zugeständnisse und die verspätete Einführung der Karte (der ursprünglich geplante Start war Januar 2006) zeugen davon, wie umstritten das Projekt war und ist. Etwa Datenschützer aber auch Ärzte-Vertreter haben die zentrale Speicherung von Gesundheitsdaten über Jahre hinweg wiederholt abgelehnt.

Worüber heute nur noch wenig gesprochen wird: Gesundheits-Big-Data, also zentral gespeicherte und zusammengerechnete Arztbesuche, Blutwerte und Medikamentenkonsum aller Patienten waren und sind das eigentliche Ziel des ganzen Projekts.

Die Idee einer eGK entstand vor 13 Jahren, ausgelöst durch den sogenannten Lipobay-Skandal. Der Arzneimittelhersteller Bayer musste damals sein cholesterinsenkendes Medikament Cerivastatin (Handelsname: Lipobay) vom Markt nehmen, nachdem weltweit rund 50 Todesfälle auf die Substanz zurückgeführt werden konnten. Die damalige Gesundheitsministerin Ulla Schmidt wollte solche Unfälle durch mehr Wissen verhindern, durch die erstmalige Zusammenfassung aller Patientendaten auf den Karten der Patienten. Mit Big Data hatte das – rein technisch betrachtet – nichts zu tun. Google veröffentlichte MapReduce erst 2004, die auf dem Algorithmus basierende Hadoop-Infrastruktur für große Datenmengen entstand im Folgejahr. Beide Ideen gelten als die zündenden Big Data-Innovationen. Aber die Denkweise, zumindest jene von bestimmten Interessengruppen, war auch schon zur Zeit der ersten Ideen für einen Arzneimittelpass eine ähnliche. Nur mit einer engen elektronischen Vernetzung zwischen Krankenkassen, Ärzten und Apothekern ist es möglich, Fehlentwicklungen und Gefahren der Medikamenteneinnahme schnell aufzuspüren und zu verhindern, sagte der damalige AOK-Bundesvorsitzende Rolf Hoberg 2001 der Berliner Zeitung.

Über ein Jahrzehnt später benutzen die gleichen Interessengruppen dieselbe Rhetorik um die Ziele von damals voran zu bringen. „Vor zehn Jahren wurden die Krankenkassen gesetzlich verpflichtet, die Karte einzuführen – ein Mehrwert ist weder für die Versicherten noch für die Kassen vorhanden, sagte beispielsweise der Vorstandsvorsitzende des Vereins der Innungskrankenkassen (IKK) Hans Peter Wollseifer im Februar. Die Botschaft dahinter: 800 Millionen Euro Beitragsgeld haben die Kassen in die Karten investiert. Bekommen haben sie ein kleines Foto, ohne jeden finanziellen Nutzen.

Dabei könnten die Einsparungen so groß sein. Weil die deutsche Gesellschaft beständig altere und ältere Menschen, Zivilisationskrankheiten und sogar der technische Fortschritt mit seiner lebensverlängernden Wirkung höhere Behandlungskosten verursache, sei zu befürchten, dass „die Gesundheitsausgaben in Deutschland einen immer größeren Teil des Bruttosozialproduktes verschlingen werden“, steht in einem sogenannten Trendpapier der Unternehmensberatung Lünendonk. Das Positionspapier beschäftigt sich mit dem Mehrwert von Big Data für Krankenversicherungen. Diese gingen dazu über, immer mehr Informationen über ihre Kunden zu sammeln und die Daten für Echtzeit-Analysen, Betrugserkennung, Kundenbindung, Stornoprävention, Langfristprognosen und die Segmentierung von Risikogruppen einzusetzen. Wenn es den einzelnen Versicherten auch nicht besser stellt, so ist es doch ein Beitrag zu mehr Gerechtigkeit für die Gesellschaft. Natürlich befürwortet das Trendpapier sämtliche Datenschleudern wie die elektronische Patientenakte, ein einheitliches Krebsregister und personalisierte Medizin auf Basis von Genomdaten. Das Dokument ist aber in seinen Bewertungen keinesfalls neutral. Die Broschüre entstand in Zusammenarbeit mit SAS – eines der Unternehmen, das sich durch mehr Big Data im Gesundheitssystem mehr Einnahmen versprechen dürfte. Denn SAS gehört neben IBM, Oracle, SAP und Microsoft zu den fünf größten Softwareproduzenten in diesem Bereich.

In den USA könnte der konsequente Einsatz von Big Data im Gesundheitssystem zu Einsparungen von 300 Milliarden Dollar führen. Jährlich würde so ein gutes Zehntel der Gesamtkosten gespart, behaupten zumindest Analysten von McKinsey. Den Ist-Zustand der amerikanischen Patientenakte stellt der US-Think Tank Rand Corporation in einer Studie genau gegenteilig und aus wirtschaftlicher Sicht ziemlich düster dar: Die Daten seien zu schlecht verknüpft. Momentan explodierten die Kosten anstatt zu sinken.

Mit dem Wort düster lässt sich auch der Datenschutz in den USA ganz gut beschreiben. Und hier geht es nicht um die NSA. „Der umfassende Gebrauch von Health IT in der Gesundheitsindustrie wird die Qualität der Gesundheitsversorgung verbessern, Behandlungsfehlern vorbeugen, Kosten reduzieren“ – schreibt das US-Gesundheitsministerium auf der eigenen Internetseite. Bis 2015 müssen alle Ärzte und Krankenhäuser ihren Betrieb auf die elektronische Patientenakte (EHR, electronic health record) umstellen. Symptome, Diagnosen, Labortests, Medikamente – in den USA wird das alles legal an Forscher, Strafverfolger, den Staat (Serious Threat to Health or Safety, conducting Intelligence and national security activities, …), an Geschäftspartner von Ärzten und Krankenkassen oder auch an das National Instant Criminal Background Check System“ weitergegeben. Letzteres sortiert potentielle Käufer von Waffen nach deren psychologischer Vorgeschichte. Alle Daten werden miteinander verknüpft, Data Mining-Programme suchen nach Betrug, Arzneimittelwirkungen , Genvarianten. Das eMerge-Konsortium, ein durch das US-Gesundheitsministerium geschaffenes Netzwerk für Gen-Forscher, hat durch Daten-Analyse über 100 Genvarianten gefunden, die mit Hautkrebs in Verbindung stehen sollen.

Es mag an dieser Stelle kaum mehr verwundern, dass der US-Rüstungskonzern Lockheed Martin die Speicher-Infrastruktur des amerikanischen Gesundheitssystems stellt. Big Data ist so universell einsetzbar, die Technik befähigt sogar Kampfflugzeug-Experten zur Gesundheits-Analyse. Jene Analyse-Technik, die Lockheed Martin entwickelt hat, um Flugkörper aufzuspüren, kann in abgewandelter Form auch eine Blutvergiftung vorhersagen.

Stufe 2 – Calico, Gene und politische Großprojekte

Rüstungskonzerne, die sich mit Gesundheitsanalyse beschäftigen – das passt zur grundlegenden These dieser Artikelreihe:  Überall wo Daten, wo maschinenlesbares Wissen anfällt, werden die Algorithmen und die Speichertechnik (das Know-how über Big Data) mehr und mehr zur Grundlage aller empirischen Erkenntnis. Das schafft Allianzen, von Wissenschaftlern, Politikern und Unternehmen, deren Analyse das Verstehen vieler Zusammenhänge möglich macht. Big Data erklärt, warum Sergey Brin teure Preise für Biologen stiftet.

Und auch, warum Arthur Levinson der Chairman jener Stiftung ist, die die Preise vergibt. Nur wenige dürften die Schnittstelle zwischen Humanbiologie und den Big Playern des Internets besser verkörpern als der Molekularbiologe. Als Google-Chef Larry Page im September vergangenen Jahres ein neues Langzeitprojekt des Konzerns – Google Calico – präsentierte, ernannte er Levinson zum Vorstandsvorsitzenden. Levinson war bis 2009 schon im Verwaltungsrat von Google.  Er legte diesen Posten nieder, nachdem die US-Kartellbehörde FTC Bedenken geäußert hatte, weil Levinson damals wie heute auch den Posten des Verwaltungsratschefs bei Apple besetzte. Viele Jahre war der frühere Wissenschaftler und heutige Manager außerdem der Vorstandsvorsitzende von Genentech – einer erfolgreichen Biotechnologie-Tochter des Schweizer Pharma-Konzerns Hoffmann-La Roche. Mittlerweile ist er der Verwaltungsratschef des Kalifornischen Unternehmens, das besonders für seine Krebspräparate bekannt ist.

Google gründet, übernimmt und verkündet eigentlich permanent irgendetwas. Calico schaffte es sogar auf die Titelseite des Time-Magazin. Obwohl über das Unternehmen wenig mehr bekannt ist als sein ambitionierte Ziel, das menschliche Leben zu verlängern und jener Einschränkung von Page, dass es wohl zehn oder 20 Jahre dauern würde, bis in dieser Hinsicht echte Ergebnisse zu erwarten seien.

Interessant ist, was hinter und neben Calico steht. Denn das Unternehmen teilt sich das Forschungsfeld Alter und Tod mit der Sens research Foundation, Genescient oder Human Longevity, einem Projekt von Craig Venter, jenem Biochemiker, dem die erste vollständige Entzifferung des menschlichen Genoms zugeschrieben wird. Über Human Longevity Inc. schrieb die New York Times kurz nach der Vorstellung des Unternehmens vor etwa einem Monat: The huge amount of DNA data will be combined with huge amounts of other data on the health and body composition of the people whose DNA is sequenced. Alles mit dem Ziel, die typischen und oftmals tödlichen Alterskrankheiten wie Krebs oder Kreislauf-Krankheiten zu begreifen. Die Vision von einem langen, vielleicht sogar ewigen Leben, ist zu einer datengetriebenen Wissenschaft geworden. Entsprechend oft sind es Informatiker oder Mathematiker, die die medizinische Forschung voranbringen. 20th Century biology was good at focusing on one or a few biochemical pathways, genes, or cell types, heißt es auf der Internetseite von Genescient. But with the advent of micro-robotics, information technologies, and high-speed sequencing, it is no longer necessary to focus an experimental flashlight on single components of the apparatus of life. Instead, genomic technologies allow us to turn on floodlights that provide extensive illumination of the complex biochemical networks that sustain life.

Eine blumige Umschreibung von Big Data. Nach Genescient sind wir im Zeitalter von Genomics 2.0 angekommen, in dem auf künstlicher Intelligenz basierende Datenanalyse versucht, Gene und Gesundheit wirklich zu verstehen. Früher hatten Forscher Ideen, Fragen oder Hypothesen und orientierten sich bei der Umsetzung ihrer Experimente an den jeweiligen Vorüberlegungen. Heute gehen viele Gen- und Life Science Forscher davon aus, dass die richtige Software den Schlüssel zum ewigen Leben irgendwann selbstständig findet. Wenn wir alt werden, laufen in unseren Zellen komplexe Vorgänge ab. Wissenschaftler glauben heute, dass die Wechselwirkungen zwischen Genen, Lebensweise, Ernährung und anderen Faktoren so vielschichtig sind, dass Frage und Antwort, Hypothese und Versuchsanordnung die Realität nicht ausreichend erfassen. Der Datenhaufen hingegen soll die ihm innewohnenden Muster offenbaren. Je mehr Daten, je größer dieser Haufen, umso wahrscheinlicher ist es, dass Algorithmen irgendwann die entscheidenden  Nadeln“  im Kampf gegen das Alter aufspüren.

Deshalb passt Calico gut ins Portfolio von Google. Und Arthur Levinson wechselte nur vom Vorstand der einen Datenkrake in den Vorstand der nächsten. 2009 übernahm Roche Genentech vollständig. Die Roche Holding fällt besonders durch ihre hohen Investitionen bei Forschung und Entwicklung auf. Gemessen an den Umsätzen verzeichnete Roche 2013 weltweit die höchsten Ausgaben in diesem Bereich. Kein Wunder also, dass Roche konkret daran interessiert ist seine Innovationsausgaben durch mehr Daten zu senken.

Und dabei hilft die EU. Die rechtlichen Situationen beim Thema Patientendaten sind in den Mitgliedsstaaten sehr unterschiedlich. Mit 16 Millionen Euro fördert die Europäische Kommission dennoch momentan eine länderübergreifende, technische Plattform für Informationen wie Blutwerte, Diagnosen und so ziemlich alles, was sonst noch anfällt beim Arztbesuch, im Krankenhaus oder in der Apotheke. Für den Datenaustausch soll eine europaweite Infrastruktur geschaffen werden. Das Projekt hört auf den etwas kryptischen Namen EHR4CR (Electronic Health Records for Clinical Research) und soll noch in diesem Jahr fertiggestellt werden. Durch die zusammengeführten Daten europäischer Praxen, Kliniken und Labore soll es etwa leichter werden, Studienteilnehmer für Medikamenten-Tests zu identifizieren. Entsprechend gehören zu den Projektpartnern und privaten Geldgebern die internationale Pharmaindustrie (Roche, Merck, Novartis, Bayer) sowie einige europäische Universitäten und die Schweizer Big-Data-Firma Data Mining International. Deren CEO, der Schweizer Mathematiker Ariel Beresniak, leitet außerdem das EU-Projekt ECHOUTCOME, das mithilfe von advanced statistics and modelling“  seit 2010 die Gesundheitssysteme aller EU-Länder miteinander vergleicht.

Nicht nur in den USA , auch diesseits des Atlantiks gibt es absolut abschreckende Beispiele. Etwa der National Health Service (NHS) in Großbritannien, dessen Datenskandale den Informations-Optimismus eigentlich bremsen sollten. Davon unbeeindruckt schafft EHR4CR“  vielleicht noch in diesem Jahr (europaweite?) technische Tatsachen. Aber gerade beim Thema Gesundheit sollten sich die Dataismus-Verfechter in Zurückhaltung üben. Obwohl es Zensur wäre: Handlungen lassen sich beeinflussen, vermeiden, anpassen. Aber über unsere Gene und Krankheitsrisiken haben wir keine Verfügungsgewalt.

4 Ergänzungen

  1. Jetzt mal naiv gefragt, ist es nicht gut für die Verbesserung der Behandlung, gerade bei seltenen Krankheiten, wenn viele Daten vorhanden sind? Nehmen wir an, jemand hat eine ganz seltene Krankheit, sagen wir Churg-Strauss Syndrom, das ist so etwa einer in 200 000. Wenn ein Spzialist alle bekannten Fälle untersuchen oder überblicken kann, dann ist das doch hilfreich. Oder allgemeine Gesundheitsdaten um zu sehen, welche Umweltbedingungen Krankheiten beeinflussen. Wie wirkt sich da AKW auf welche Krebsformen aus?

    Auch der Austausch von Röntgenbildern, dass man nicht nochmal geröntgt werden muss, weil der Austausch zwischen den Ärzten zu kompliziert ist, durchaus vorteilhaft für mich als Patienten.

    Oder wenn ich einen epileptischen Anfall erleide und meine Notfallversorger über eine Chipkarte sofort meine Krankenakte vorliegen haben und sehen können, dass ich eine Medikamentenunverträglichkeit habe usw.

    1. Natürlich hat es auch Vorteile, sonst ließe es sich wahrscheinlich nicht begründen (und damit durchsetzen). Aber gerade bei Gesundheitsdaten gibt es eine Menge Leute, die sie nicht zwischen die Finger bekommen dürfen aber jede Menge Interessen (und Möglichkeiten) haben es doch zu tun. Versicherungen und Arbeitgeber sind die beiden Top-Beispiele die auf jeden zutreffen, aber es gibt auch noch andere.
      Der einfachste Weg sicherzustellen dass das nicht passiert ist, die Daten gar nicht erst zu erheben. Der zweitbeste ist, sie nur beim Patienten (mit Backup beim Hausarzt) zu haben (verschlüsselten Speicherchip auf die Karte – die kosten heute eh fast nix mehr).
      Eventuell kann man einzelne Informationen anonymisiert teilen. Schon pseudonymisiert ist heutzutage oft leicht rekonstruierbar. Aber bei zentralen Datenbanken ist es nur eine Frage der Zeit, bis jeder Depp und sein Hund Zugriff hat (genug Geld und/oder Motivation vorausgesetzt).

  2. Die gebrachten Beispiele sind genau jene, die man anführt, um die positiven Seiten von Big-Data-Analysen vorzuführen. Aus gutem Grund. Datenschutz hier einfach als Selbstzweck vor Forschungen zu Gesundheit zu stellen, ist herablassend jenen gegenüber, die davon profitieren würden. Natürlich muss gesellschaftlich ausgehandelt werden, wo hier genau die Grenzen verlaufen, Gesundheitsforschung ist aber nicht der Markt für personalisierte Werbung.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.