US-UrheberrechtKI darf weiter Bücher lesen

Darf KI mit Raubkopien trainieren? Zwei US-Gerichte haben erstmals dazu entschieden – zugunsten von Meta und Anthropic, aber mit überraschenden Unterschieden. Es ist ein juristischer Richtungsstreit mit Signalwirkung.

Statue von Justizia vor pinkem KI-Schriftzug
In den kommenden Monaten wird sich eine gängige Auslegung des Urheberrechts im Bereich KI herauskristallisieren. – Alle Rechte vorbehalten IMAGO / Bihlmayerfotografie

Um ein gut funktionierendes KI-Modell zu entwickeln, braucht dieses eine große Menge an hochwertigen Daten im Training. Dass große KI-Unternehmen dabei auch urheberrechtlich geschützte Inhalte nutzen, ist nicht neu. In den letzten Jahren haben deshalb bereits einige Urheber Klage eingereicht, so auch einige Autor:innen in den USA. Ende Juni 2025 fällten US-Gerichte gleich zwei Urteile, die wegweisend für zukünftige Verfahren sein könnten. Und beide richten sich gegen Urheber.

2024 zogen drei Autor:innen, Andrea Bartz, Charles Graeber und Kirk Wallace Johnson, gegen Anthropic vor ein Bundesgericht im Norden von Kalifornien. Die Firma, 2021 von ehemaligen OpenAI-Mitarbeitenden gegründet, baute eine zentrale, dauerhaft bestehende Bibliothek mit allen Büchern der Welt auf. Große Teile davon lud Anthropic im Internet herunter: aus piratisierten Schattenbibliotheken wie LibGen. Ihre eigens aufgebaute Bibliothek nutzte Anthropic auch als Datenquelle zum Training ihrer Large Language Models (LLMs) wie Claude.

Vor Gericht klagten Bartz, Graeber und Johnson, dass ihr Schaden nicht nur in der unerlaubten Nutzung ihrer Werke aus den Schattenbibliotheken bestünde. Es gehe auch darum, dass die KI von Anthropic nach dem Training in der Lage sei, ähnliche Werke wie ihre eigenen zu generieren. Dies würde ihren Werken Konkurrenz schaffen und ihren Profit beeinträchtigen.

Gerichtsprozess gegen Meta

Mit ähnlichen Vorwürfen zog bereits 2023 ein Zusammenschluss von Autor:innen gegen Meta vor Gericht in San Francisco. Der Konzern hat zwar nicht die Ansprüche, eine eigene Bibliothek aufzubauen, aber hat ebenfalls Bücher aus Schattenbibliotheken heruntergeladen und für das Training seiner LLMs, spezifisch Llama, verwendet.

Anthropic und Meta berufen sich zu ihrer Verteidigung in beiden Gerichtsverfahren auf Ausnahmen im US-Urheberrecht. Denn unter gewissen Umständen erlaubt dieses eine nicht-autorisierte Nutzung von geschütztem Material auf Grundlage der sogenannten Fair-Use-Doktrin.

Fair Use schützt nicht-genehmigte Nutzung

Seit 1976 erlaubt Fair Use (17 U.S.C. §107) das Nutzen von urheberrechtlich geschütztem Material zur Kritik, Stellungnahme, Berichterstattung, Bildung und Forschung. Im Einzelfall entscheiden Gerichte anhand von vier Faktoren: Zweck der Nutzung und wie stark das Ursprungswerk verändert wurde, die Art des Ursprungswerkes und wie viel Kreativität in der Erstellung nötig war, der verwendete Anteil des Ursprungswerkes und die Auswirkungen auf den Verkaufsmarkt des Ursprungswerkes. Weil diese Faktoren in der Doktrin nicht breit erläutert werden, orientiert sich eine Auslegung stark an bereits gefällten, aussagekräftigen Urteilen, sogenannten Präzedenzfällen.

Im Bereich des KI-Trainings sind jedoch noch nicht so viele Urteile gefallen, welche für die Auslegung von Fair Use zu Rate gezogen werden können. Entsprechend können die kürzlich verkündeten Urteile in Zukunft eine solche Rolle in der Rechtsprechung einnehmen.

Alles netzpolitisch Relevante

Drei Mal pro Woche als Newsletter in deiner Inbox.

Jetzt abonnieren

Wie bewerteten die Richter Fair Use

Im Fall gegen Anthropic urteilte Richter William Alsup nun am 23. Juni 2025, dass Anthropics Nutzung der Werke ein Fall von Fair Use war. Besonders eingeflossen ist in die Entscheidung, dass die Autor:innen keine konkreten Beispiele benennen konnten, dass und wo Claude ihre Texte reproduziert habe. Dies soll auch technisch sichergestellt sein durch eine einprogrammierte Sperre in den Modellen.

Obwohl die Nutzung der Bücher für den Trainingsprozess urheberrechtlich erlaubt war, entschied das Gericht, dass die Aufbewahrung der Bücher aus Schattenbibliotheken für zukünftige, undefinierte Zwecke in einer großen Bibliothek nicht rechtens war. In Zukunft könnte besonders die Einschätzung zu der Transformation zwischen den originalen Werken und dem „Werk“ von Anthropic wichtig werden. Wenn vor Gericht geprüft wird, ob es sich um einen Fall von Fair Use handelt, kann besonders diese Veränderung ausschlaggebend sein.

LLMs seien höchst transformativ, so die Einschätzung von Alsup. Zudem urteilte der Richter, dass Urheberrecht vor Replikation schütze, nicht aber vor Konkurrenz auf dem Markt. Somit hätte Anthropics Sprachmodell Claude nicht mehr Einfluss auf den Markt als andere Autor:innen.

Richter setzt Zeichen für stärkeren Schutz von Urhebern

Ganz gegenteilig sieht es Vince Chhabria, Richter im Prozess gegen Meta. Dieser widerspricht Alsups Einschätzung zur Auswirkung auf den Markt und erkennt das Potenzial von KI an, den Markt mit generierten Büchern zu überschwemmen. Dieser finanzielle Schaden sei noch größer bei kürzeren schriftlichen Werken, beispielsweise Nachrichtenartikeln.

Leider, so Richter Chhabria, hätten die Autor:innen ihre Argumente nicht stark genug belegt und konnten den Einfluss auf den Buchmarkt nicht gut genug zeigen. Deswegen fiel auch hier das Urteil am 25. Juni 2025 für Meta aus: Die Verwendung von urheberrechtlich geschützten Büchern sei erlaubt unter US-Urheberrecht.

US-Urheberrechtsbehörde liefert ähnliche Einschätzung

Diskussionen rund um KI erreichen nun also auch die Legislative in den USA und erste Urteile legen die Grundsteine für kommende gängige Rechtsprechung. Eine klare Tendenz für oder gegen Autor:innen kristallisiert sich aus gefallenen Urteilen noch nicht heraus. Momentan laufen über 30 Verfahren in den Staaten, welche sich mit Urheberrechtsverletzungen durch KI-Unternehmen beschäftigen.

Im Rahmen der sich häufenden Klagen veröffentlichte das United States Copyright Office (USCO) im Mai 2025 eine vorläufige Einschätzung zur Gesetzesauslegung von Urheberrecht bei KI-Trainingsprozessen. In dieser nicht-bindenden Einschätzung wird betont, dass besonders die Faktoren der Transformation des Ursprungswerkes und der Markteinfluss ausschlaggebend für oder gegen eine Fair-Use-Entscheidung seien. Es müsse aber von Fall zu Fall entschieden werden.

Eine klare Aussage trifft das USCO jedoch über das Nutzen von Schattenbibliotheken: Kreative Werke aus piratisierten Internetquellen zu nutzen, sei kein Fall von Fair Use – wenn auch die Möglichkeit besteht, eine Lizenz für diese Werke zu erwerben.

Deutschland benennt KI-Training im Urheberrecht

Ein breit auslegbares Konzept wie Fair Use gibt es im deutschen Urheberrecht nicht. Stattdessen sind konkretere Schrankenregelungen fest definiert für bestimmte Zwecke, die das Recht der Urheber beschränken.

Durch eine Umsetzung einer EU-Richtlinie wird maschinelles Lernen im deutschen Urheberrecht genauer als in den Vereinigten Staaten behandelt. Der §44b im Urheberrechtsgesetz (UrhG) beschränkt die Rechte der Urheber und erlaubt im Gegenzug, die Werke für eine automatisierte Analyse zu vervielfältigen, zum Beispiel bei KI-Trainingsprozessen.

Dabei müssen Vervielfältigungen nach Abschluss des KI-Trainings gelöscht werden. Nutzung von urheberrechtlich geschützten Werken für den KI-Trainingsprozess ist damit auch für den kommerziellen Gebrauch und nicht nur für die Forschung erlaubt.

Autor:innen können widersprechen

Autor:innen und andere Urheber können der Nutzung ihrer Werke im Voraus widersprechen („opt out“). Dazu sei es möglich, vor Gericht zu argumentieren, dass Schrankenregelungen wie §44b UrhG einigen Kriterien entsprechen müssen, sagt der Urheberrechtsanwalt Dr. Andreas Dustmann. Die Nutzung dürfe etwa die normale Verwertung des Werkes nicht beeinträchtigen und die berechtigten Interessen des Urhebers nicht verletzen.

Wenn eine KI also nach dem Training in der Lage sei, beispielsweise Fortsetzungen zu Büchern zu schreiben, dann entstünde eine Bedrohung für die Verwertungs- und Existenzgrundlagen der Urheber, die vor Gericht bewertet werden muss.

Genauere Auslegungen dieser Einsprüche werden sich in kommenden Urteilen zeigen. Bis jetzt gibt es noch kein aussagekräftiges Urteil, welches eine Einschätzung der zukünftigen Auslegung der Rechtslage möglich macht.

Uns fehlen dieses Jahr noch 307.427 Euro.

Bist Du auch Feuer und Flamme für Grundrechte? Dann unterstütze jetzt unsere Arbeit mit einer Spende.

11 Ergänzungen

  1. Fataler Mist. Fair ist daran garnichts. Bei Science-only o.ä. kann man diskutieren, aber da gibt es bereits mehr oder weniger üppige Ausnahmen. Das im Moment offensichtlich ein Raubzug.

    Statt das „unendliche Urheberrecht“ zu beschneiden, wird „alle sind gefickt“ und „von Facebook“ (plus minus…) umgesetzt. Tolle Wurst, Mensch!

  2. Früher war mit der Autorenschaft ein Stück weit der Gedanke verbunden, ein Teil der Literatur der Welt geworden zu sein.

    Heute scheinen sich zumindest einzelne Autoren lautstark dafür einzusetzen, explizit kein Teil dieses Literaturstamms zu werden.

    Das dahinterliegenden Profitinteressen kann ich nachvollziehen – jeder muss von irgendwas leben. .. aber es ist irgendwo auch jammerschade, wenn dadurch Kultur verloren geht oder insgesamt weniger zugänglich wird.

  3. „Fair Use“? Wäre wenn alles sich an Regeln und AGB halten. Wie kann man von „Fair Use“ sprechen, wenn Bots sich nicht als Bots zuerkennen geben. Wenn die „KI“ Betreiber Bots wissentlich wie Heuschrecken übers Land ziehen lassen? Diese Bots ein DoS auf Internetseiten schädigend ausüben, so dass deren eigentlicher Zweck, Dienst und Nutzen einbricht. Schaden bei den Internetbetreiber hängen bleibt.

    Gibt es seitens „KI“ Betreiber Entschädigungen oder Gewinnbeteiligung? NEIN
    Haben die „KI“ Betreiber die IP Listen der Bots öffentlich gemacht? NEIN
    Gibt es Regeln für diese Bots an diese sich Bots halten? NEIN

    Am Ende des Tages gleicht es einer Machtlosigkeit der Internetseitenbetreiber und einer „digitalen“ Vergewaltigung durch Bots.

  4. Internetseitenbetreiber müssen umdenken. Es gibt Techniken zum Schutz gegen Bots. Diese jedoch uns Benutzer das Nutzen von Internetseiten sehr erschweren wird.

  5. Trainiert ist trainiert. Man wird Meta usw. kaum dazu zwingen (können) ihre Modelle zu löschen und nochmal von Null nur mit legalen, lizenzierten Quellen zu trainieren. Das wäre wieder eine Bestätigung, dass man sich Rechtsbruch als Konzern mit Geld leisten kann, ja gerade dass dies ein Erfolgsrezept ist, ohne das man nicht „ganz vorne“ mitspielen kann (Wettbewerbsvorteil).
    Einzelpersonen und Projekte wie archive.org hingegen werden in Grund und Boden geklagt.

    Vielleicht ist die Urheberrecht/KI Debatte aber ja genau der Auslöser, den wir für eine echte Reform des Urheberrechts brauchen. Sollte der aktuelle Trend weiter gehen, wird das Urheberrecht ja ad absurdum geführt…

    1. Es gibt auch andere Prozesse, die anders ausgehen (können). Das ist alles noch nicht geklärt. Kann sein, dass wild inkonsistente Zustände erreicht werden (andere Plattformen mit Bildern/Videos, Filmstudios, Musiker, Zeitung, Authoren, usw. usf.).

      Allen gemein ist, dass die Konzerne versuchen ihr Recht einzusetzen. Will sagen, Konzerne haben Recht, alle anderen sind Fischfutter. Das ist hier bei KI absolut offensichtlich.

      1. Stimmt. Die Kleinen sind das Futter…
        Fragt sich nur, ob andere Konzerne wie z.B. Sony, die nicht gerade dafür bekannt sind, Prozesse wegen Urheberrechtsverletzungen zu vermeiden, aktiv werden. Falls es denen gelingt, irgendeinen „Werk“ zusammenzuprompten, dürften die Karten für die KI-Firmen eher in Erkärungsnot kommen als bei den „Kleinen“, die keine Umsatzzahlen und potentielle Gewinnausfälle nachweisen können.

      2. „Konzerne haben Recht, alle anderen sind Fischfutter“

        Wobei das Startups bzw. spezielle Ausgründungen auch versuchen. Inwiefern die von dem Club zu trennen sind, wie im Falle von OpenAI, weiß vermutlich nur der Gott der Datenwäsche.

    2. „Trainiert ist trainiert.“

      Genau, und es itst „die KI“ an der alle gleichzeitig bauen, oder nicht?

      Nein, die Daten sind gesaugt, und das Geschäftsmodell ist noch nicht liquidiert. Die Modelle müssen immer wieder neu trainiert werden, um aktuell zu bleiben. Dafür wollen die ALLE Daten.

      Der Kampf findet im Moment um die Daten statt, nicht um funktionierende KI.

Wir freuen uns auf Deine Anmerkungen, Fragen, Korrekturen und inhaltlichen Ergänzungen zum Artikel. Bitte keine reinen Meinungsbeiträge! Unsere Regeln zur Veröffentlichung von Ergänzungen findest Du unter netzpolitik.org/kommentare. Deine E-Mail-Adresse wird nicht veröffentlicht.