loader image

Zurück zur Content-Seite

KI | Urheberrecht

von | Nov. 2025

KI und Urheberrecht: Gericht erkennt Vervielfältigung in Sprachmodellen an

Ein Urteil mit Signalwirkung für den Umgang mit Trainingsdaten und Memorisierung

Dürfen Sprachmodelle urheberrechtlich geschützte Werke so verinnerlichen, dass sie auf Abruf wiedergegeben werden können? Oder anders gefragt: Wo endet die technische Analyse – und wo beginnt die urheberrechtlich relevante Nutzung eines Werkes?

Eine aktuelle Entscheidung der 42. Zivilkammer des Landgerichts München I bringt Bewegung in eine der zentralen Fragen des digitalen Urheberrechts – und könnte weitreichende Folgen für den Einsatz generativer KI-Systeme haben.

Der Fall: GEMA gegen OpenAI-Unternehmen

Mit Urteil vom 11. November 2025 hat die 42. Kammer des Landgerichts München I entschieden, dass der GEMA gegen zwei Unternehmen der OpenAI-Gruppe Ansprüche auf Unterlassung, Auskunft und Schadensersatz zustehen.

Gegenstand der Klage war die unlizenzierte Wiedergabe von Songtexten im Chatbot, die durch einfache Nutzereingaben („Prompts“) abgerufen werden konnten. Nach Auffassung der GEMA handelte es sich dabei um eine öffentliche Zugänglichmachung geschützter Werke (§ 19a UrhG), die ohne entsprechende Lizenz rechtswidrig sei.

Die GEMA argumentierte, dass die Liedtexte in den Sprachmodellen der Beklagten memorisiert seien und auf Eingaben der Nutzer hin in weiten Teilen originalgetreu ausgegeben würden.

Die Beklagten hielten dem entgegen, ihre Modelle speicherten keine konkreten Trainingsdaten, sondern „lernten“ lediglich Muster und Wahrscheinlichkeiten. Etwaige Rechtseingriffe seien zudem durch die Schranke für Text- und Data-Mining (§ 44b UrhG) gedeckt.

Memorisierung als Vervielfältigung – eine neue Form der Werkverkörperung?

Nach Überzeugung des Gerichts sind urheberrechtlich geschützte Liedtexte in den Sprachmodellen GPT-4 und GPT-4o der Beklagten reproduzierbar enthalten – und zwar in Form der sogenannten Memorisierung.

Diese liege vor, wenn ein Modell beim Training nicht nur Informationen für die Gewichtung seiner Parameter extrahiere, sondern Teile des Trainingsdatensatzes in den Parametern selbst festhalte. Der Abgleich zwischen Trainingsdaten und generierten Outputs habe gezeigt, dass die betreffenden Liedtexte tatsächlich im Modell hinterlegt seien. Aufgrund der Länge und Komplexität der Texte schloss die Kammer Zufall als Ursache aus.

Nach Auffassung des Gerichts stellt die Memorisierung eine Verkörperung des Werkes dar und somit eine Vervielfältigung im Sinne von Art. 2 InfoSoc-RL und § 16 UrhG.

Entscheidender Maßstab für die Beurteilung der Frage, ob eine Vervielfältigung vorliege, sei, dass eine Vervielfältigung „in jeder Form und auf jede Art und Weise“ vorliegen könne. Vor dem Hintergrund dieses Kriteriums könne auch die Funktionsweise eines Sprachmodells, das Informationen aus Trainingsdaten extrahiert und in Gewichtungen übersetzt, eine urheberrechtlich relevante Vervielfältigung begründen.

Zur Begründung verweist die Kammer auf die Rechtsprechung des Europäischen Gerichtshofs, wonach bereits eine mittelbare Wahrnehmbarkeit genügt, wenn ein Werk mithilfe technischer Hilfsmittel wieder erkennbar gemacht werden kann. Mit anderen Worten: Wenn ein Werk durch technische Verfahren rekonstruiert werden kann, liegt eine Vervielfältigung vor.

Keine Rechtfertigung durch Schrankenbestimmungen

Weder die Schranke des Text- und Data-Mining (§ 44b UrhG) noch die Regelung über die Nutzung als Beiwerk (§ 57 UrhG) fand nach Auffassung der Kammer Anwendung.

Die Vorschriften seien darauf ausgelegt, lediglich vorbereitende Vervielfältigungen zu gestatten – etwa beim Zusammenstellen eines Datenkorpus oder bei der temporären Speicherung von Werken im Arbeitsspeicher. Diese Handlungen dienten ausschließlich der Informationsgewinnung und berührten die Verwertungsinteressen der Urheber nicht.

Anders im vorliegenden Fall: Durch die Memorisierung würden die Werke selbst vervielfältigt und dauerhaft im Modell festgelegt. Damit gehe der Vorgang über bloße Analysehandlungen hinaus und greife unmittelbar in das Verwertungsrecht der Rechteinhaber ein. Eine technikfreundliche Auslegung der Schrankenbestimmung lehnte die Kammer aufgrund des ausdrücklichen Wortlauts der Norm ab.

Auch eine analoge Anwendung komme nicht in Betracht nach den Ausführungen der Kammer. Selbst wenn der Gesetzgeber die Problematik der Memorisierung beim Erlass der Schrankenregelung nicht erkannt habe, fehle es an einer vergleichbaren Interessenlage. Die Text-und-Data-Mining-Schranke solle lediglich solche Nutzungen privilegieren, bei denen das Werk als solches nicht vervielfältigt wird. Bei einer analogen Anwendung würde die Urheber im Fall der Memorisierung  jedoch gerade schutzlos gestellt.

Auch die Anwendbarkeit der Schranke aus § 57 UrhG als unwesentliche Beiwerk lehnte das Gericht ab. Die Liedtexte seien nicht bloß nebensächlicher Bestandteil eines größeren, urheberrechtlich geschützten Hauptwerks. Voraussetzung hierfür wäre gewesen, dass der  Trainingsdatensatz als solcher ein urherberrechtliches geschütztes Werk im Sinne des Urheberrechts darstellt. Dies lehnte die Kammer jedoch ab.

Zudem verwarf die Kammer auch das Argument, die Rechteinhaber hätten stillschweigend in die Nutzung eingewilligt. Das Training von Sprachmodellen sei keine „übliche und erwartbare Nutzungsart“, mit der Urheber oder Verlage rechnen müssten.

Outputs als erneute Urheberrechtsverletzung

Nicht nur die Memorisierung, auch die Ausgabe der Liedtexte durch den Chatbot wurde als unberechtigte Vervielfältigung eingestuft. In den generierten Outputs seien die originellen Elemente der Texte erkennbar wiedergegeben worden. Verantwortlich seien dabei die Betreiber der Modelle selbst, nicht die Nutzer.

Die Begründung: Die Beklagten hätten die Sprachmodelle entwickelt, trainiert und betrieben – und damit die Architektur geschaffen, die die Memorisierung überhaupt ermögliche. Sie bestimmten die Funktionsweise und seien somit für den Inhalt der Outputs mitverantwortlich.

Auch hier erkannte die Kammer keine einschlägige Schranke, die eine solche Wiedergabe rechtfertigen könnte.

Bedeutung der Entscheidung

Das Urteil, das noch nicht rechtskräftig ist, markiert einen entscheidenden Punkt in der rechtlichen Bewertung von KI-Trainingsprozessen. Es bekräftigt, dass die technische Struktur von Sprachmodellen urheberrechtlich relevante Vervielfältigungen enthalten kann – selbst dann, wenn die Werke nicht unmittelbar, sondern nur statistisch repräsentiert sind.

Damit stellt das Gericht klar: Der Schutzbereich des Urheberrechts endet nicht an der Grenze algorithmischer Komplexität. Auch wenn KI-Systeme in Wahrscheinlichkeiten und Parametern „denken“, bleibt das Recht am Werk bestehen.

Das Urteil wirft zugleich zentrale Fragen für die Zukunft auf:
Wie kann der Gesetzgeber die Schrankenbestimmungen an die Realität maschinellen Lernens anpassen? Reicht der bestehende Rechtsrahmen aus, um Innovation und Schutzinteressen in Einklang zu bringen? Und wie lässt sich technisch sicherstellen, dass urheberrechtlich geschützte Inhalte nicht dauerhaft im Gedächtnis der Maschinen verankert bleiben?

Fazit

Mit der Entscheidung zur Memorisierung in Sprachmodellen rückt das Urheberrecht weiter in das Zentrum der KI-Debatte. Sie zeigt, dass die rechtlichen Maßstäbe des digitalen Zeitalters neu austariert werden müssen – zwischen kreativer Freiheit, technischer Entwicklung und dem Schutz geistigen Eigentums.

Link zur Pressemitteilung.

nyr Law, Law of Tomorrow, Kanzlei für IP / Intellectual Property / Gewerblicher Rechtschutz, Media und IT, black

CLOSE

Intellectual Property

Media & Entertainment

Legal Design / Innovation