OpenSCHUFA: Mehr als 15.000 Auskunftsanfragen in einem Monat

Scoring-Unternehmen wie die SCHUFA wissen viel über uns, arbeiten selbst aber intransparent. Mit einer Datenspende-Aktion will die Initiative OpenSCHUFA die Bewertungs-Blackbox knacken. Wir haben Mitinitiator Lorenz Matzat zum ersten Monat seit dem Projektstart, dem weiteren Vorgehen und grundsätzlichen Problemen des Scorings befragt.

Mehr als 15.000 Menschen haben seit Beginn der Kampagne OpenSCHUFA ihre Daten bei dem Scoring-Unternehmen angefordert. – Alle Rechte vorbehalten OpenSCHUFA

Ob Kredite, Handyverträge oder Wohnungsbewerbungen – bei wichtigen Verbraucherfragen spielt der SCHUFA-Score eine zentrale Rolle. Wer zu wenige Punkte hat, geht oft leer aus. Doch das zugrunde liegende Bewertungssystem des Scoring-Unternehmens ist intransparent, was das Projekt OpenSCHUFA nun ändern will. Die Open Knowledge Foundation Deutschland und AlgorithmWatch rufen dafür alle Menschen auf, kostenlos ihren SCHUFA-Score anzufragen – und anschließend die Daten zu spenden. Mit einer eigens entwickelten Software wollen die Organisationen das SCHUFA-Scoring rekonstruieren. Kurz vor Abschluss der Finanzierungsphase haben wir mit Lorenz Matzat von AlgorithmWatch über das Projekt gesprochen.

Die SCHUFA entzieht sich ihrer Verantwortung

netzpolitik.org: Vor einem knappen Monat habt ihr OpenSCHUFA gelauncht, Donnerstag geht das Fundraising zu Ende. Wie waren die Reaktionen auf die Initiative?

Lorenz Matzat: Wir haben viel Zuspruch erfahren. Es gibt viele Menschen, die schlechte Erfahrung mit Scoring gemacht haben. Über selbstauskunft.net wurden seit Beginn unserer Kampagne über 15.000 Auskunftsanfragen an die SCHUFA übermittelt. Beim Crowdfunding haben wir die erste Stufe, 30.000 Euro längst erreicht, aber noch nicht unser Gesamtziel. Wir freuen uns also auch jetzt noch über jede finanzielle Unterstützung.

netzpolitik.org: Ihr bekommt im Rahmen eurer Aktion sicher viele Erlebnisse mit der Auskunftei geschildert. Was habt ihr gelernt?

Lorenz Matzat: Viele Menschen sind empört, dass ein Unternehmen solche Macht hat und sie sich ihm völlig ausgeliefert fühlen. Bei Spiegel Online hat gerade ein Journalist berichtet, dass ihn die SCHUFA zweimal in der Kartei führte, er dadurch große Nachteile hatte, ihn die SCHUFA aber immer nur hat auflaufen lassen, wenn er versucht hat, die Daten zu korrigieren. Das ist noch fast harmlos. Doch man bekommt einen guten Eindruck, mit welchem Dünkel die SCHUFA mit Kritik an ihren Methoden umgeht. Wichtiger ist aber, dass wir bislang vermutlich noch kaum die Personen erreicht haben, um die es nicht zuletzt geht: Leute in prekären Lebenssituationen. Das wollen wir jetzt nach Abschluss des Crowdfundings angehen: Etwa durch Zusammenarbeit mit Mieterschutzvereinen, Sozialberatungen, aber auch Lokalzeitungen.

netzpolitik.org: Wo liegt eurer Meinung nach das Hauptproblem?

Lorenz Matzat: Die SCHUFA tut so, als ob sie eigentlich gar nichts mit all dem zu tun hätte. Die Daten liefern ja andere zu, und mit den von ihr errechneten Scores selbst fängt die SCHUFA nichts an. Ich persönlich finde es bemerkenswert, dass eine Aktiengesellschaft, die hauptsächlichen den großen Bankhäusern gehört, auf diese Weise Millionengewinne erwirtschaftet. Die SCHUFA beruft sich auf wissenschaftliche Prüfungen ihrer Rechenmodelle und auf Gesetzmäßigkeit. Doch welche sozialen Konsequenzen dieses Scoring hat, ob es Diskriminierung von bestimmten Gruppen und Lebensformen verstärkt, wird nicht überprüft. Unabhängig davon, was wir herausbekommen, denken wir jetzt schon, dass alle Scoring-Unternehmen deutlicher darlegen müssten, wie sie zu ihren Bewertungen kommen. Auch halten wir regelmäßige Audits, Überprüfungen von unabhängigen Stellen für unabdingbar, die auch die sozialen Effekte betrachten und nicht nur die statistischen Modelle, sondern auch die Qualität der Datenbanken und der verwendeten Software. Letztlich wollen wir die Diskussionsgrundlage verbessern, auf der wir uns als Gesellschaft fragen können, ob es nicht bessere Verfahren geben kann.

Bewertungsmustern auf die Spur kommen

Einer der Köpfe hinter OpenSCHUFA: Datenjournalist Lorenz Matzat. - CC-BY-SA 4.0 Privat

netzpolitik.org: Kritiker werfen euch einen Interessenkonflikt vor. AlgorithmWatch wird von der Bertelsmann-Stiftung gefördert. Bertelsmann wiederum gehört auch Arvato Infoscore – ein Konkurrenzunternehmen der SCHUFA. Was begegnet ihr diesem Vorwurf?

Lorenz Matzat: Die SCHUFA ist Marktführer und nahezu jedem Erwachsen bekannt, weil sie immer wieder ihren Alltag berührt. OpenInfoscore hätte wohl kaum funktioniert. Zudem enthält jede SCHUFA-Auskunft nach dem Bundesdatenschutzgesetz §34 eine standardisierte Score-Tabelle, die einen Vergleich über viele tausende Auskünfte überhaupt erst ermöglicht. Das waren unsere Beweggründe. Die SCHUFA hat uns in einer langen, auch öffentlichen Erklärung vorgeworfen, wir würden den Wirtschaftsstandort Deutschland gefährden und de facto kriminellen Elementen zuarbeiten. Wie ernst man solche Vorwürfe nehmen will, bleibt jedem überlassen. Wahr ist, dass wir als gemeinnützige Organisation von der Bertelsmann-Stiftung gefördert werden. Aber zum Beispiel auch von der gewerkschaftsnahen Böckler-Stiftung. Das kommunizieren wir offen auf unsere Website. In unserer Arbeit sind wir unabhängig.

netzpolitik.org: Ihr wählt bei OpenSCHUFA den kreativen Ansatz des datenschutzrechtlichen Auskunftsanspruchs, um die Scoring-Blackbox zu knacken. Dafür stellen euch viele Menschen tatsächlich sensible Informationen zur Verfügung. Wie sorgt ihr dafür, dass am Ende nichts veröffentlicht wird, das Rückschlüsse auf einzelne Personen zulässt?

Lorenz Matzat: Ja, Pseudonymisierung – also vermeintlich “anonymisierte” Daten, die durch Abgleichen mit anderen Daten dann doch wieder die Identität preisgeben – können ein Problem sein. Wir wollen dieses Risiko dadurch minimieren, dass wir beim Datensammeln keine Metadaten speichern, außer dem Zeitpunkt, an dem die Daten übermittelt werden. Namen, Geburtsdaten, Adressen interessieren uns nicht. Von der gesamten SCHUFA-Auskunft wollen wir nur eine Tabelle (II. Aktuelle Wahrscheinlichkeitswerte) – der Rest sollte vor der Übermittlung an uns geschwärzt werden. Die besagte Tabelle enthält keine Details zu Geldgeschäften, Konten, Krediten etc. Weiter bitten wir um Information wie Postleitzahl, Alter, Geschlecht, Einkommenssituation usw. Die Angaben sind freiwillig; wir hoffen allerdings, dass die Teilnehmenden uns Vertrauen schenken und möglichst genaue Angaben über sich machen, damit wir den Mustern in den Scores auf die Spur kommen können. Die Software, die wir zum Datensammeln verwenden, werden wir vorab als Open Source veröffentlichen.

netzpolitik.org: Wie viele Personen haben bei euch mit den Originaldaten zu tun?

Lorenz Matzat: Unmittelbar Zugang zu den Daten wird eine Handvoll Wissenschaftler sowie Datenjournalisten von Spiegel Online und dem Bayerischen Rundfunk haben, die wir persönlich kennen. Sie werden Zugang zu den Daten nur nach Einwilligung in strenge Datenschutz- und Datensicherheitsauflagen bekommen. Was wir am Ende veröffentlichen, wird vorher datenschutzrechtlich geprüft.

Mit offen Datenensammlungen gegen Informationsasymmetrien

netzpolitik.org: Mit eurer Kampagne macht ihr ja auf ein politisches Problem aufmerksam: Intransparente algorithmische Entscheidungen auf Basis persönlicher Daten spielen für die Lebenschancen von Menschen eine immer größere Rolle. Scoring-Unternehmen wie die SCHUFA und Arvato Infoscore sind ja nur die Spitze des Eisberges. Was müsste sich hier tun?

Lorenz Matzat: Uns, und da kann ich wohl auch für unsere Partner von der Open Knowledge Foundation sprechen, ist es wichtig, dass deutlich wird, dass es bei dem Thema nicht nur um Google und Facebook geht. Sondern dass an allen möglichen Stellen Daten über jeden von uns gesammelt werden – im Falle der SCHUFA und ihrer Vorgänger seit fast 100 Jahren. Oft wissen wir wenig davon. OpenSCHUFA ist ein Versuch, besser zu verstehen, was vor sich geht, bevor wir konkrete Forderungen stellen können. Es ist aber auch schon ein Gewinn, wenn mehr Leute erfahren, dass sie ein kostenfreies Selbstauskunftsrecht haben.

netzpolitik.org: Informationsasymmetrien gelten als eines der Hauptprobleme algorithmischer Blackboxen. Mit der Datenspende-Aktion verfolgt ihr einen kollektiven Ansatz gegen die Ohnmacht der Einzelnen. Ist das für euch ein Zukunftsmodell?

Lorenz Matzat: Wir denken schon. OpenSCHUFA ist insofern auch ein Versuch, zu verstehen, wie bereit Personen sind, für eine gemeinnützige Sache auch sensible Daten zu spenden. Um dieser Asymmetrie zu begegnen, müssen wir möglicherweise kollektive offene Datensammlungen anlegen. Dass das unter anderem aus Datenschutzgründen schwierig ist, ist schon klar. Mein persönlicher Standpunkt ist, dass diesbezüglich Offenheit wahrscheinlich der entscheidende Weg ist, um den privatisierten Datensilos etwas entgegenzusetzen.

netzpolitik.org: Ist Transparenz eurer Meinung nach denn ausreichend, um den gesellschaftlichen Herausforderungen algorithmischer Entscheidungssysteme zu begegnen?

Lorenz Matzat: Transparenz alleine hilft nicht. Wichtig ist unserer Meinung nach auch Nachvollziehbarkeit. Wenn zum Beispiel zukünftig eine Software auf Basis von Machine-Learning-Verfahren die Entscheidung umsetzt, ob jemand ein Visum für die EU erhält, hilft das Offenlegen der Software als Open Source alleine wenig. Denn wir brauchen auch die Trainingsdaten, mit der diese Software “lernt”, damit wir nachvollziehen können, wie die Software funktioniert. Die Datenauswahl kann eben dazu führen, dass Vorurteile und Diskriminierung, ein “bias”, mit in das System eingebacken werden. Allerdings ist es unserer Meinung nach noch zu früh, nach Regulierung zu rufen. Wir müssen zuerst die Problematik besser verstehen.

Erste Ergebnisse ab Juni

netzpolitik.org: Abschließend: Wie sehen für OpenSCHUFA jetzt die nächsten Schritte aus?

Lorenz Matzat: In diesem Mai soll die Website mit der Datenspende-Plattform starten. Über die können uns die Datenspender per Smartphone und dessen Kamera beziehungsweise Scan die Tabelle aus der SCHUFA-Auskunft sowie die freiwilligen persönlichen Angaben übermitteln. Ab Juni werden dann erste Ergebnisse veröffentlicht. Daten können bis September gespendet werden – es spricht aber nichts dagegen, dass jeder seine kostenfreie Selbstauskunft jetzt schon beantragt – für den Fall, dass sich mit der neuen Datenschutzgrundverordnung, die ab Ende Mai gilt, an der Auskunft der SCHUFA etwas ändert. Wir würden uns auch freuen, wenn sich Sozialberatungen, Mieterschutzvereine und andere an uns wenden, damit wir auch viele Auskünfte von denen bekommen, die problematische SCHUFA-Scores haben.

netzpolitik.org: Vielen Dank für deine Auskünfte.

Offenlegung: Lorenz ist gelegentlicher Autor bei netzpolitik.org. Wir haben dieses Interview schriftlich geführt.

7 Ergänzungen

  1. Arvato Inscore? Bertelsmann!

    Spiegel Online? NATO-Kriegstreiber. Oh, mein Gott.

    Was für Trolle. Das zieht einem echt die Schuhe aus.

    Wozu um Gottes Willen diese Böcke im Garten? So doof kann man doch gar nicht sein.

  2. Ich hätte das Projekt wirklich gerne unterstützt, aber leider gewann ich schon bei der Überprüfung der Webseite den Eindruck, dass man es da mit dem Datenschutz nicht so genau nimmt. Wen ich bereits dort z.B. von Googletrackern umgeben bin, werde ich ganz sicher keine personenbezogenen Daten da lassen. Wer selbst nachsehen möchte, unter https://webbkoll.dataskydd.net/en .

  3. Diese Gemeinnützigen und sonstigen Aktivisten von heute – alle leben von dem was sie gemeinnützig tun und keiner macht auch nur einen Finger krumm, BEVOR nicht alles durch Spenden finanziert ist und/oder durch von Verlagen gesponsorte Journalisten abgedeckt wird.

    Ich kann da nichts gemeinnütziges erkennen, eher schlecht versteckten Eigennutz. Aber offensichtlich wird der Mensch immer naiver und wirft immer weiter rein.

      1. 50000 Euro für eine gute Zeit? Dazu Aufmerksamkeit für die eigenen Firmen, die nebenher in derselben Branche tätig sind? Oder glaubst du das eingeworbene Geld wird für eine große Maschine gebraucht? Nein, damit finanziert sich der eine oder andere ein Jahr und am Ende kommt sehr wahrscheinlich genau nichts raus. Klar, man wird irgendwelche Erkenntnisse als total neu und wichtig verkaufen. Das wars dann, man hört nie wieder davon.

        Ich lasse mich gern eines Besseren belehren. Aber von den erwartbaren Eingangsparametern kann da eigentlich nicht mehr als heiße Luft von verbranntem Geld herauskommen.

    1. Siehe die letzte Frage: Die Plattform, über die man seine Daten hochladen kann, soll im Mai starten.

Dieser Artikel ist älter als ein Jahr, daher sind die Ergänzungen geschlossen.