Die Verhandlungen um die EU-Urheberrechtsreform gehen in die letzte Runde. Bisher dominieren drohende Uploadfilter und ein Leistungsschutzrecht für Presseverlage die Debatte. Wenig beleuchtet ist hingegen, wie geplante Regelungen zum Data-Mining die Entwicklung von Künstlicher Intelligenz in der EU gefährden.

Langsam aber sicher erwacht die Bundesregierung aus ihrem netzpolitischen Dornröschenschlaf. Nachdem die Berichte der letzten Enquete-Kommission (Internet und Digitale Gesellschaft) in den Schubladen verschwanden und eine weitere Legislaturperiode mit einer kraftlosen digitalen Agenda weitgehend verschwendet wurde, hat sie jetzt die Digitalisierung als Thema für sich entdeckt – oder zumindest akzeptiert, dass diese nicht mehr weggeht und man sich damit beschäftigen muss. Das führt erstmal zu einer Vielzahl an neuen Gremien: KI-Enquete, Datenethikkommission, Digitalrat, Kommission Wettbewerbsrecht 4.0, Arbeitswelt-Denkfabrik. Das Problem der fehlenden Koordinierung droht jedoch weiterhin.

Netzpolitisches Topthema: Irgendwas mit Künstlicher Intelligenz

Gegenstand ist zumeist die Frage, wie wir mit dem Themenkomplex Künstliche Intelligenz umgehen sollen. Gemeint sind damit vor allem die Arten von selbstlernenden Algorithmen und maschinellem Lernen, die in Verbindung mit großen Datenbeständen, Rechnerkapazitäten und steuerungsfähiger Hard- und Software viele Aufgaben übernehmen können, die bislang Menschen vorbehalten waren. Dazu gehört etwa die Analyse komplexer Sachverhalte (Erkennung von Krankheiten) oder ihre Steuerung (Sicherheit). Doch während die Bundesregierung und ihre Expertenkreise erst langsam mit den Beratungen beginnen, stehen in diesem Bereich bereits heute wichtige Entscheidungen an, die die Chancen und Risiken der KI-Entwicklung in Deutschland und Europa massiv beeinflussen.

Ein Beispiel ist die EU-Urheberrechtsreform (Ziel: Harmonisierung des Urheberrechts, Förderung des digitalen Binnenmarktes). Nachdem der Kommissionsvorschlag am 12. September in veränderter Form das Europäische Parlament passiert hat, liegt die Sache nun im so genannten Trilog. Im Trilog-Verfahren verhandeln Vertreter der Kommission mit Rat und Parlament hinter verschlossenen Türen einen Konsens aus. In der bisherigen Debatte um die EU-Urheberrechtsreform ging es vor allem um die Artikel 11 (Gefahr durch Uploadfilter) und 13 (Leistungsschutzrecht), manchmal noch um Artikel 12, der Urheber gegenüber Verwertern zu benachteiligen droht.

Aus netzpolitischer Sicht ist aber auch der bisher unterbeleuchtete Artikel 3 ziemlich interessant, weil hier Regelungen für Text- und Data-Mining geschaffen werden und den meisten beteiligten Politikern die Auswirkungen nicht bewusst sein dürften.

Artikel 3: Text- und Data-Mining

Die EU-Urheberrechtsreform betrifft das Thema Künstliche Intelligenz insofern, als dass sie den Zugriff auf Werke und sonstige Schutzgegenstände regeln soll. Das betrifft auch die Grundlage von Data- und Text-Mining, denn es geht mittelbar um die Rahmenbedingungen für die Entwicklung und Anwendung von Analysemethoden, die gemeinhin als Künstliche Intelligenz / Maschinelles Lernen bezeichnet werden. Also: Wer darf unter welchen Umständen auf welche öffentlichen Daten zugreifen, um selbstlernende Algorithmen zu entwickeln, zu erproben oder anzuwenden? Die Antwort der Urheberrechts-Richtlinie lautet erstmal: Eher wenige. Denn das mit den Daten beim Data- und Text-Mining ist gar nicht so einfach: Die müssen aufbereitet und mitunter auch aus ihrem Kontext (Datensätze) gerissen werden. Das alles könnte nach den geplanten Regeln unters Urheberrecht fallen und im Zweifelsfall die Analyse verhindern.

Der EU-Kommissionsvorschlag sieht im restriktiven Urheberrecht nur Ausnahmeregelungen für Wissenschaftseinrichtungen vor. Aber vielen ging das nicht weit genug. Denn die Wissenschaft und ihre Einrichtungen sind bekanntermaßen nicht die schnellsten. Treiber der KI-Entwicklung, allen voran kommerzielle Data Scientists und Start-Ups, wären von dieser Regelung ausgeschlossen und hätten weiter wahlweise schlechten Datenzugriff oder müssten sich die relevanten Daten weiter auf halblegalem Weg besorgen. Eine Verabschiedung dieser Normen aus dem Vorschlag der EU-Kommission würde also die parteiübergreifende Forderung nach einer schnellen und guten KI-Entwicklung in Deutschland und Europa massiv behindern, weil die Versorgung mit Daten erschwert würde.

Die Änderungen des Europäischen Parlaments ergänzen den Kommissionsvorschlag um spannende Details der Datennutzung. Er sieht hier Öffnungsklauseln für die Nationalstaaten vor. Jenseits der europäischen Regelungen würden Nationalstaaten die Möglichkeit bekommen, für ihre heimische Industrie, Wissenschaft oder einfach nur für die interessierte Öffentlichkeit weitere Ausnahmen vorzusehen. Das Ganze geht in die richtige Richtung. Nur: Wie lange noch sollen Wissenschaftler, Datenjournalisten, Start-Ups und Co. darauf warten, dass ihre nationale Regierung unter Umständen Regelungen erlässt, die ihnen die Entwicklung und Anwendung der ach so sehr gewünschten KI ermöglicht? Wäre es nicht sinnvoller, diese Ausnahmeregelungen gleich zum europäischen Standard zu machen – und zwar für alle? Um das Versprechen vom europäischen Binnenmarkt zu erfüllen?

Viel zu wenige Menschen beherrschen die Kunst des Programmierens, die Kunst der smarten Datenanalyse, die Kunst, künstliche Intelligenz mit gesellschaftlichen Problemen zusammen zu denken. Mit einem schlechten Artikel 3 in der EU-Urheberrechtsreform würden wir diesen wenigen Fachkräften und Innovatoren noch weitere Steine in den Weg legen, anstatt ihnen den Zugriff auf die erforderlichen Ressourcen zu geben. Wir brauchen also mindestens: eine Erweiterung des EP-Vorschlags, damit Öffnungsklauseln gleich für alle gelten müssen.

Herausforderung: Daten nutzen – und trotzdem Persönlichkeitsrechte wahren

Darüber hinaus müssen die Probleme bedacht werden, die sich beim Data-Mining in Hinblick auf Datenschutz ergeben. Wie kann man Data-Mining betreiben, wenn eine Vielzahl der Daten unter Umständen personenbezogen oder durch die Erhebungsmethoden tendenziell auf Personen zurückführbar sind? Um den gesellschaftlichen Mehrwert aus aggregierten Daten zu ziehen, bedürfte es neuartiger Formen der Anonymisierung oder Pseudonymisierung oder ein Datenmanagement, das den Einzelnen schützt, ohne die Analyse der Gesamtheit der Daten zu gefährden. Das Thema berührt die Frage, wie eigentlich die Qualität von Datensets für die Auswertung zu unterschiedlichen Zwecken gewährleistet werden kann (auch ob Daten korrekt, angemessen, repräsentativ usw. sind).

Der vermeintliche Konflikt zwischen Urhebern sowie Rechteinhabern (Verlegern) auf der einen Seite und den Konsumenten und dem Netz auf der anderen Seite ist technologisch überholt. Die Entwicklung von Plattformen im Netz und smarten Maschinen stellt neuartige Anforderungen an die Debatte: Gute Inhalte (Presseartikel, Daten, Werke) brauchen eine breite Verteilung, damit die KI-Entwicklung und Anwendung ebenso fruchtbar verlaufen kann wie der öffentliche, demokratische Diskurs. Es gilt, die Potentiale der digitalen Technologie zu nutzen, anstatt auf veraltete Geschäftsmodellen zu beharren. Gleichzeitig gilt es, die Risiken digitaler Technologien zu mindern – das heißt, keine restriktiven Softwaresysteme wie Uploadfilter zu installieren, deren negative Folgen für die Meinungsfreiheit absehbar sind.

Es gilt, das Urheberrecht in den Dienst der demokratischen Gesellschaft zu stellen. Eine offenere Regelung zur gemeinwohlorientierten Nutzung von Data-Mining wäre ein Fortschritt.