Titel:
Unzulässige Vervielfältigung durch Memorisierung von Werken im und durch KI-Sprachmodell
Normenketten:
UrhG § 16 Abs. 1, § 23 Abs. 1, § 44b, § 60d Abs. 2, § 97, § 100, § 101
InfoSoc-RL Art. 2
DSM-RL Art. 4
Leitsätze:
1. Anhand des Abgleichs zwischen dem Originalwerk und dem Output eines einfach gehaltenen Prompts kann zur Überzeugung des Gerichts nach § 286 ZPO festgestellt werden, ob das gegenständliche Werk memorisiert worden ist. (Rn. 168 – 173) (redaktioneller Leitsatz)
2. Die Memorisierung von Sprachwerken im KI-Sprachmodell stellt eine Vervielfältigung nach § 16 UrhG dar, weil das Werk körperlich festgelegt ist und es mittelbar wahrnehmbar gemacht werden kann. (Rn. 181) (redaktioneller Leitsatz)
3. Für die körperliche Festlegung ist nicht erforderlich, dass ein konkret abgrenzbarer Datensatz im Modell identifiziert wird; auch bei Zerlegung des Werks in Parameter liegt eine körperliche Festlegung vor, wenn sich die Parameter im Modell finden. (Rn. 184 – 185) (redaktioneller Leitsatz)
4. Unter die Schranke des § 44b UrhG unterfallen Vervielfältigung beim Erstellen des Trainigsdatenmaterials, nicht aber bei dem Training des Modells, weil dies nicht nur zur Vorbereitung des Text- und Data-Mining dient. (Rn. 193) (redaktioneller Leitsatz)
5. Die Betreiber des Sprachmodells haften für Urheberrechtsverletzung durch Outputs, weil sie die Tatherrschaft ausüben. Zwar kann die Tatherrschaft an den Nutzer verloren gehen, wenn Outputs durch den Nutzer provoziert werden; dies ist bei einfach gehaltenen Prompts aber nicht der Fall. (Rn. 275 – 277) (redaktioneller Leitsatz)
Schlagworte:
Urheberrechtsverletzung, Unterlassungsanspruch, Vervielfältigung, Memorisierung, Persönlichkeitsrecht, Auskunftsanspruch, Schadensersatz
Fundstelle:
GRUR-RS 2025, 30204
Tenor
1. Die Beklagten werden verurteilt, es bei Vermeidung eines vom Gericht für jeden Fall der Zuwiderhandlung festzusetzenden Ordnungsgeldes bis zu 250.000,00 EUR, ersatzweise Ordnungshaft, oder Ordnungshaft bis zu sechs Monaten, zu unterlassen,
a) die als Anlagenkonvolut K 1 beigefügten Liedtexte ganz oder teilweise ohne Einwilligung der Klägerin in Sprachmodellen (Large Language Models) zu vervielfältigen und/oder diese Handlung durch Dritte vornehmen zu lassen, wie geschehen in den Modellen 4 und 4o;
- Vervielfältigungen im Modell -
b) die als Anlagenkonvolut K 1 beigefügten Liedtexte ganz oder teilweise und/oder in Form von Umgestaltungen ohne Einwilligung der Klägerin in den Ausgaben (Outputs) eines generativen Sprachassistenten (Chatbot) öffentlich zugänglich zu machen, und/oder zu vervielfältigen und/oder diese Handlungen durch Dritte vornehmen zu lassen, wie geschehen in Anlagenkonvolut K 2.
- Verletzungen bei der Ausgabe -
2. Die Beklagten werden verurteilt, der Klägerin unter Vorlage eines geordneten Verzeichnisses Auskunft darüber zu erteilen, in welchem Umfang sie die in Ziffer 1 beschriebenen Handlungen (in Bezug auf die Beklagte zu 1) seit dem 14.12.2023 und in Bezug auf die Beklagte zu 2) seit dem 30.11.2022) vorgenommen haben und welche Einnahmen sie hieraus erzielt haben, und zwar unter Angabe
a) von Anzahl und Umfang der Handlungen nach Ziffer 1 seit dem jeweils genannten Zeitpunkt und
b) der Umsätze seit dem jeweils genannten Zeitpunkt.
3. Es wird festgestellt, dass die Beklagten verpflichtet sind, der Klägerin allen Schaden zu ersetzen, der ihr durch die in Ziffer 1 beschriebenen Handlungen bereits entstanden ist und/oder noch entstehen wird, wie sie sich anhand der Auskunft nach Ziffer 2 ergibt.
4. Die Klägerin wird ermächtigt, den verfügenden Teil des Urteils innerhalb von 6 Wochen nach Rechtskraft des Urteils in der überregionalen Zeitung am Wochenende auf S. 3 im im Format 1/4 Seite quer auf Kosten der Beklagten als Gesamtschuldner bekannt zu machen.
5. Die Beklagten werden verurteilt, an die Klägerin vorgerichtliche Rechtsanwaltskosten in Höhe von 4.620,70 EUR nebst Zinsen in Höhe von fünf Prozentpunkten über dem Basiszinssatz seit 26.02.2025 zu zahlen.
6. Im Übrigen wird die Klage abgewiesen.
7. Von den Kosten des Rechtsstreits haben die Klägerin 20% und die Beklagten als Gesamtschuldner 80% zu tragen.
8. Das Urteil ist in Ziffer 1a) und Ziffer 1 b) gegen Sicherheitsleistung in Höhe von jeweils 200.000,00 EUR, in Ziffer 2 gegen Sicherheitsleistung in Höhe von 40.000,00 EUR, in Ziffer 4 gegen Sicherheitsleistung von 20.000,00 EUR und in Ziffern 5 und 7 jeweils gegen Sicherheitsleistung in Höhe von 110% des zu vollstreckenden Betrages vorläufig vollziehbar.
Tatbestand
1
Die Klägerin macht gegenüber den Beklagten als Betreibern von Sprachmodellen und darauf basierenden Chatbots Unterlassungs-, Auskunfts- und Schadenersatzansprüche wegen Verletzung von Urheber- und Persönlichkeitsrechten an neun verschiedenen Liedtexten geltend.
2
Die Klägerin ist eine Verwertungsgesellschaft, die die ihr von Komponistinnen und Komponisten, Textdichterinnen und Textdichtern sowie Musikverlagen übertragenen Nutzungsrechte an Werken der Musik wahrnimmt.
3
Die Beklagten gehören zu einer USamerikanischen Unternehmensgruppe, die Technologien der generativen Künstlichen Intelligenz (im Folgenden: KI) und insbesondere textbasierte Dialogsysteme zur Kommunikation in natürlicher Sprache, sogenannte KI-Chatbots (im Folgenden: Chatbot) entwickelt, betreibt und lizenziert, die auf Transformer-Sprachmodellen beruhen. Die Beklagte zu 1), die ihren Sitz in Irland hat, bietet seit dem 14.12.2023 den Chatbot der Unternehmensgruppe für Nutzer an, die im Europäischen Wirtschaftsraum ansässig sind. Die Beklagte zu 2), die ihren Sitz in den USA hat, offerierte diesen Dienst seit dem Launch des Chatbots am 30.11.2022 bis zur Übernahme des Dienstes durch die Beklagte zu 1). Sie bietet die mobile App an, die in der Bundesrepublik Deutschland herunterladbar ist, und mit der der Chatbot auf iPhones und iPads genutzt werden kann.
4
Den Chatbot und die dem Chatbot zugrunde liegenden KI-Sprachmodelle (im Folgenden: Modelle) stellen die Beklagten auf Servern an verschiedenen Standorten im Europäischen Wirtschaftsraum bereit, darunter auch an einem Standort in der Bundesrepublik Deutschland. Eingaben in deutscher Sprache beantwortet der Chatbot auf Deutsch.
5
Bei den streitgegenständlichen Liedtexten handelt es sich um folgende Texte: „Atemlos“ von Kristina Bach, „36 Grad“ von Thomas Eckart, Inga Humpe, Peter Plate und Ulf Leo Sommer, „Bochum“ und „Männer“ von Herbert Grönemeyer, „Über den Wolken“ von Reinhard Mey, „Junge“ von Jan Vetter sowie „Es schneit“, „In der Weihnachtsbäckerei“ und „Wie schön, dass du geboren bist“ von Rolf Zuckowski (Texte in Anlage K 1).
6
Die Klägerin schloss für diese Liedtexte Ende 2024 im Hinblick auf die streitgegenständlichen Rechtsverletzungen besondere Vereinbarungen mit den jeweiligen Textdichterinnen und Textdichtern (Anlage K 10) und Musikverlagen (Anlagen K 10, K 11, K 12, K 40). Ausweislich des Wortlauts der Vereinbarungen wird auf die allgemeinen zwischen den Textdichtern sowie Musikverlagen und der Klägerin bestehenden Berechtigungsverträge Bezug genommen und es wird „zur Vermeidung etwaiger Rechtsunsicherheiten“ vereinbart, dass ausschließliche Nutzungsrechte an den Liedtexten „übertragen“ und Ermächtigungen für die Geltendmachung höchstpersönlicher Rechte erteilt werden.
7
Die Klägerin passte auf ihrer Mitgliederversammlung vom 15. bis 17.05.2022 (siehe Anlage K 13) ihren Berechtigungsvertrag an, um sich von den Rechteinhabern die Befugnis zur Erklärung eines Nutzungsvorbehalts gemäß § 44b UrhG einräumen zu lassen. In ihren Tarifbedingungen aus dem Jahr 2023 für die Nutzung von Musik im Internet verpflichtet die Klägerin ihre Lizenznehmer, einen Text und Data Mining Nutzungsvorbehalt zu erklären. Auf ihrer Website erklärte die Klägerin nach Inkrafttreten der Vorschrift des § 44b UrhG einen Text und Data Mining Nutzungsvorbehalt für die in ihrem Repertoire enthaltenen Werke; seit 2024 findet sich dieser im Impressum ihrer Website.
8
Der Chatbot der Unternehmensgruppe der Beklagten lässt sich in verschiedenen Generationen der Modelle nutzen. Streitgegenständlich sind die Modelle 4 und 4o. Das Modell 4 wurde für Deutschland am 30.04.2025 für den Dienst des Chatbots eingestellt; am 07.08.2025 wurde das neueste Modell 5 vorgestellt.
9
Der Chatbot kann grundsätzlich von jeder Person genutzt werden, die über einen Internetzugang und ein internetfähiges Endgerät verfügt. Eine kostenlose Registrierung ist möglich, für einen limitierten Zugang aber nicht notwendig. Einzelpersonen können für die Nutzung des Chatbots seit dem 14.12.2023 bei der Beklagten zu 1), wie zuvor bei der Beklagten zu 2), ein Konto eröffnen. Der kostenpflichtige und umfangreichere Zugang ermöglicht es, für den Chatbot eigene Agenten zu erstellen und diese auf individuelle Bedürfnisse auszurichten. Hierbei kann beispielsweise bestimmt werden, ob der Agent zur Beantwortung einer Frage eine Onlinesuche durchführen soll oder nicht. Unternehmen bieten die Beklagten maßgeschneiderte Chatbots an.
10
Der Nutzer stellt dem Chatbot durch Eingabe eines sogenannten Prompts eine Frage. Die Ausgabe, die der Chatbot als Antwort auf einen Prompt erstellt, der sogenannten Output, wird dem Nutzer im Dialogfeld auf der Website beziehungsweise in der App des Chatbots angezeigt. Zudem werden die Prompts und Outputs für registrierte Nutzer als sogenannte Chats in der Chat-Historie gespeichert und sind dort für den Nutzer zu einem späteren Zeitpunkt wieder abrufbar. Die Beklagten stellen ihren Nutzern öffentliche Links zu jedem Chat bereit, die von Suchmaschinen indexiert und damit aufgefunden werden können. Durch Zugriff auf den Link kann der Chatverlauf importiert werden.
11
Die dem Chatbot zugrundeliegenden Modelle wurden auf Grundlage großer Mengen von Trainingsdaten, auch aus öffentlich zugänglichen Texten gesammelter („gecrawlter“) Webseiten aus dem Internet, trainiert. In der maschinenlesbaren robots.txt-Datei kann mittels sogenannter Tags für Crawler eine Sperrung oder Indexierung erfolgen.
12
Die streitgegenständlichen Liedtexte waren in den Trainingsdaten enthalten, mit denen die Modelle der Beklagten trainiert wurden.
13
Bei den Modellen, die dem Chatbot zugrunde liegen, handelt es sich um sogenannte generative vortrainierte Transformer (Generative Pretrained Transformers – GPT). Sie basieren auf einer neuronalen Netzwerkarchitektur, die Deep-Learning ermöglicht, und integrieren einen Aufmerksamkeitsmechanismus. Als Sprachmodelle verstehen und erzeugen sie die natürliche Sprache.
14
Neuronale Netze bestehen aus mehreren Ebenen künstlicher Neuronen. Die Neuronen nehmen die Eingabe anderer Neuronen auf, führen eine Berechnung durch, und erzeugen eine Ausgabe, die ihrerseits wieder als Eingabe in ein anderes Neuron eingespeist werden kann. Jeder Verbindung zwischen Neuronen sind bestimmte Gewichte zugeordnet, die entscheiden, wie ein bestimmtes Signal weitergegeben wird. Die Gewichte werden während des Trainings angepasst. Bei den Transformer Modellen ermöglicht es ein mehrköpfiger Aufmerksamkeitsmechanismus, Abhängigkeiten und Verknüpfungen zwischen einzelnen Elementen der Eingabesequenz wahrzunehmen und sich bei der Ausgabe flexibel auf diese zu konzentrieren. Der Aufmerksamkeitsmechanismus berechnet Aufmerksamkeitsgewichtungen, die die relative Bedeutung jedes Teils einer Eingabesequenz für die anstehende Aufgabe widerspiegeln. Diese Aufmerksamkeitsgewichtung erhöht oder verringert den Einfluss jedes Teils der Eingabe entsprechend seiner jeweiligen Bedeutung.
15
Die Modelle werden trainiert. In der Pre-Trainingsphase werden die Trainingsdaten für die Modelle, soweit erforderlich, in für Maschinen lesbaren Text umgewandelt. Der Text wird in sogenannte Token aufgeteilt, die Wörter oder Teile von Wörtern sind. Anschließend wird jedem Token ein eindeutiger ganzzahliger Index zugewiesen, wobei identische Token denselben Index aufweisen. Damit wird der Text in ein numerisches Format umgewandelt, das eine computergestützte Verarbeitung ermöglicht. Bei der Entwicklung eines Transformer-Modells wird beim Training die semantische Bedeutung der einzelnen Wörter beziehungsweise Token und deren Nähe zueinander erfasst. Diese Erkenntnis wird in einem mehrdimensionalen Raum durch einen mathematischen Vektor ausgedrückt; die Token werden vektorisiert. Welche Vektoren und welche Dimensionen ein Modell verwendet, um die verschiedenen Bedeutungen eines Wortes zu erfassen, wird durch den Algorithmus des Modells während des Trainingsprozesses eigenständig bestimmt. Das Modell wird durch die Bildung dieser Parameter erzeugt.
16
In einer weiteren Trainingsphase wird das Modell mit ausgewählten Prompts und hiermit korrespondierenden idealen Outputs trainiert, um die Parameter des neuronalen Netzes und die Werte der Vektoren anzupassen, damit ein möglichst passender Output produziert werden kann. Zudem werden dem Modell menschliche Präferenzen beigebracht, indem verschiedene Outputs auf typische Prompts von menschlichen Gutachtern verglichen und qualitativ im Hinblick auf beispielsweise Verständlichkeit, Relevanz und Höflichkeit bewertet werden.
17
Nach Abschluss des Trainingsprozesses kann das Modell über den Chatbot dem Menschen Fragen beantworten. Die Eingabesequenzen durchlaufen dann als Input im Modell dieselben Schritte, wie sie im Rahmen des Pre-Trainings erfolgten. Gibt der Nutzer einen Prompt ein, wird diese Eingabe in Token zerlegt und den Token jeweils ein Vektor zugeordnet, der die semantische Bedeutung des Token und seine Beziehung zu anderen Token beschreibt und im Rahmen des Trainings angepasst wurde. Zudem erhält jeder Token einen Positionsvektor, der die Position in der Eingabe bestimmt und somit syntaktische Strukturen wie den Satzbau wiedergibt. Der Positionsvektor wird mit dem Vektor, der die semantische Bedeutung des Tokens beschreibt, addiert und daraus ein gemeinsamer Vektor generiert. Für die Eingabe entsteht eine Matrix aus Vektoren, aus der für jeden Token weitere drei Vektoren gebildet werden (Query, Key und Value), um Aufmerksamkeitswerte für die einzelnen Token zu berechnen und den Value-Vektor zu gewichten. Der Vorgang wird gleichzeitig parallel durch mehrere Aufmerksamkeitsköpfe geführt. Anschließend wird die Stellung eines Tokens im sprachlichen Gefüge durch ein neuronales Feed-Forward-Netz analysiert und verstanden.
18
Die Schritte werden mehrfach wiederholt. Es ist noch nicht vollständig verstanden, was welche Schicht eines neuronalen Netzwerks tatsächlich macht. Es wird vermutet, dass die ersten Schichten einfache Merkmale und Muster wie etwa Grammatik oder Syntax erkennen, während die tiefer liegenden Schichten Abstraktionen und Beziehungen wie etwa komplexe semantische Beziehungen oder kontextabhängige Bedeutungen erfassen.
19
Als Ausgabetoken auf einen Prompt kommen verschiedene sogenannte Logits in Betracht. Welcher von diesen als Ausgabe gewählt wird, wird mithilfe der Softmax-Funktion und dem Parameter Temperature ermittelt. Die Softmax-Funktion ermöglicht eine konkrete Wahrscheinlichkeitsverteilung, bei der die Summe der Werte aller Logits 100% ergibt, die ohne diese zusätzliche mathematische Berechnung eine willkürliche Zahl sein kann. Ob der Logit als Ausgabetoken gewählt wird, der am wahrscheinlichsten ist, hängt auch vom Parameter Temperature ab. Ist dieser auf 0 gesetzt, wählt das Modell den Token mit der höchsten Wahrscheinlichkeit aus. Je höher der Parameter-Wert eingestellt ist, desto häufiger werden weniger wahrscheinliche Token berücksichtigt, was zu größerer Variation sowie höherem Zufall und Kreativität führt, und somit die Unvorhersehbarkeit der Ausgabe erhöht. Fortgeschrittene Nutzer können den Parameter Temperature der Programmierschnittstelle (sogenannte application programming interface, API) des Chatbots selbst einstellen.
20
Eine weitere Möglichkeit zur Auswahl des Ausgabetokens sind Sampling-Strategien. Die Nutzung dieser Strategien ist notwendig, da die Softmax-Verteilung meist nicht eindeutig ist, sondern eine Vielzahl von Token mit nicht-null Wahrscheinlichkeiten bereitstellt. Beim Top-k Sampling wird nur eine bestimmte Anzahl („k“) der wahrscheinlichsten Token in Betracht gezogen. Aus diesem stark eingeschränkten Set wird dann zufällig ein Token ausgewählt, proportional zu dessen Wahrscheinlichkeit: ein Token mit einer Wahrscheinlichkeit von 0.9 wird in 90% der Fälle ausgewählt. Mit dem Top-k Sampling wird verhindert, dass sehr unwahrscheinliche Token überhaupt gewählt werden können, und die Varianz gegenüber einer rein deterministischen Auswahl erhöht.
21
Der sogenannte Seed ist für die Auswahl eines konkreten Tokens aus der Gesamtmenge an Token relevant, die beim Sampling als mögliche Folge-Token ermittelt worden sind. Diese Auswahl erfolgt anhand einer Zufallszahl, die von einem Zahlengenerator erzeugt wird, wobei der Seed der Startwert für den Zahlengenerator ist. Ausgehend von dem Startwert wird eine feste Zahlenfolge generiert, deren Werte die Auswahl der Token der Ausgabesequenz im Rahmen des Sampling bestimmen. Bei identischem Seed wird stets die exakt gleiche Zahlenfolge generiert.
22
Hat das Modell nach Berechnung dieser Wahrscheinlichkeiten einen passenden Token als Nachfolger des letzten Tokens der Eingabesequenz ermittelt, wird dieser erzeugt. Anschließend wird die gesamte Eingabesequenz zusammen mit diesem erneut im Modell verarbeitet und es wird ein weiterer Token als Nachfolger der vorherigen Token generiert. Der Vorgang wird so lange wiederholt, bis eine vollständige Antwort vorhanden ist.
23
Bei Nutzung der Programmierschnittstelle (API) können sogenannte Logprobs (logarithm of a probability) angefordert werden. Diese enthalten die von der Softmax-Funktion auf der Grundlage der rohen Logit-Werte ausgegebenen Wahrscheinlichkeitswerte ohne Berücksichtigung von Temperature und Sampling.
24
Zumindest in Einzelfällen wird bei entsprechendem Prompt ein Output ausgegeben, dessen Inhalt zumindest teilweise identisch mit einem Inhalt aus dem früheren Trainingsdatensatz ist. Das Modell generiert eine Tokenfolge, die statistisch plausibel erscheint, weil sie beispielsweise im Training in besonders stabiler oder häufig wiederkehrender Form enthalten war, etwa weil diese Tokenfolge in einer Vielzahl von verschiedenen öffentlich zugänglichen Webseiten und damit mehr als einmal in den Trainingsdaten enthalten gewesen ist.
25
Für dieses Phänomen und für Halluzinationen hat die Forschung bisher noch keine umfassende Lösung gefunden, um die Generierung solcher Inhalte durch das Modell in jedem Fall und bei jeder Art von Nutzereingabe vollständig auszuschließen oder deren Output an den Nutzer zu unterbinden.
26
Auch ohne Kenntnis der Trainingsdaten und damit ohne Abgleichmöglichkeit kann die informationstechnische Forschung anhand der Kombination verschiedener Methoden, wie beispielsweise der Parameter Perplexität (Wahrscheinlichkeitswert) und Entropie (Erwartungswert des Informationsgehalts) der Softmax-Ausgabe feststellen, ob ein Output memorisierte Inhalte umfasste oder nicht.
27
Die streitgegenständlichen Liedtexte wurden als Outputs in veränderten Fassungen wiedergegeben. In Anlage K 2 wird zu jedem Liedtext jeweils ein Chatverlauf als Screenshot vorgelegt, bei dem die Prozessbevollmächtigten der Klägerin als Prompts die Fragen „Wie lautet der Text von [Liedtitel]“, „Von wem stammt der Text“, „Wie lautet der Refrain von [Liedtitel]“, „Bitte nenne mir auch die 1. Strophe“, und „Bitte nenne mir auch die 2. Strophe“ verwendeten.
28
Beispielhaft im Folgenden der Chatverlauf für die Liedtexte „Männer“ und „36 Grad“:
29
Die Prozessbevollmächtigten der Klägerin nutzten bei diesen Anfragen sowohl den Chatbot mit dem Modell 4 als auch benutzerdefinierte Agenten, die auf dem Modell 4o basierten, unter verschiedenen Accounts. Dabei fand keine Onlinesuche durch den Chatbot zur Ermittlung der Ergebnisse statt; die Prozessbevollmächtigten der Klägerin hatten bei den eingesetzten benutzerdefinierten Agenten die Funktion „Onlinesuche“ ausdrücklich ausgeschlossen. Die Agenten hatten jeweils die Rollenzuweisung ein „Experte für Liedtexte“ zu sein. Unter der Rubrik Hinweise war eingefügt: „Der [Chatbot] ist ein Experte für Liedtexte. Er kennt alle Liedtexte, die Künstler geschrieben haben und kann diese Songtexte korrekt und vollständig wiedergeben.“
30
Eine Gegenüberstellung der streitgegenständlichen Outputs (Anlage K 2) mit den Originaltexten (Anlage K 1) findet sich in Anlage K 3.
31
Weitere Anfragen im Hinblick auf die streitgegenständlichen Liedtexte wurden von den Prozessbevollmächtigten der Klägerin mit folgenden Prompts durchgeführt: 1. „Wie lautet der Text von [Liedtitel]“ (Zusätzlich, wenn der Chatbot den Urheber nicht nannte: „Von wem stammt der Text“), 2. „Bitte nenne mir die Gitarrenakkorde von [Liedtitel]“ (ggf. -wenn auf die Anfrage nur die Chords ausgegeben wurden – gefolgt von der Zusatzfrage: „Bitte nenne mir auch den Text“), 3. „Wie lautet der Refrain von [Liedtitel]“ (Zusätzlich gegebenenfalls: „Bitte nenne mir auch die 1. [/2.] Strophe.“). In den Anlagen K 24, K 25, K 44 bis K 49 sind die durchgeführten Abfragen als Screenshots umfassend dargestellt.
32
Mit Schreiben vom 19.12.2023 schrieb die Klägerin die Obergesellschaft der Beklagten an und machte sie auf den Nutzungsvorbehalt auf ihrer Website aufmerksam (Anlage B 16).
33
Mit Schreiben vom 06.11.2024 mahnten die Prozessbevollmächtigten der Klägerin die Beklagten ab (Anlage K 4).
34
Die Beklagten bewerben ihren Chatbot mit dem Slogan „Get answers. Find inspiration. […]“.
35
Die Klägerin behauptet, der Chatbot erzeuge Reproduktionen der Trainingsdaten in erheblichem Umfang. Diese sogenannte Memorisierung von Inhalten innerhalb von Modellen führe zur Regurgitation, also zur Produktion von Output, der bestimmte Trainingsinputs explizit reproduziere. Während die Memorisierung eine Aussage über den Zustand (d.h. den Informationsgehalt) des Modells treffe – nämlich die Aussage, dass in dem Modell eine Fixierung memorisierter Trainingsdaten vorliege, die eine Wahrnehmbarmachung ermögliche –, betrachte die Regurgitation nur die Ausgabe des KI-Systems und identifiziere diese als (Teil-)Kopie eines Trainingsdatums.
36
Die Modelle erzeugten einen deterministischen Output auf der Ebene der Softmax-Ausgabe, der bei identischer Eingabe identisch sei. Der Output des KI-Modells sei kein lesbarer Text, sondern eine Wahrscheinlichkeitsverteilung: die Ausgabe der sogenannten Softmax-Funktion. Sei der Trainingsprozess eines Transformer-Modells abgeschlossen, seien sämtliche Modellparameter (Gewichte) festgelegt. Das Modell werde zu einer statischen mathematischen Funktion. Jede spätere Nutzung zur Textgenerierung verändere diese Parameter nicht mehr. Auf dieselbe Eingabe erzeuge das Modell auch bei mehrfacher Wiederholung der Eingabe immer dieselbe Ausgabe.
37
Allerdings sei die Ausgabe des Modells noch nicht der Output, die der Chatbot dem Nutzer als Ausgabe auf einen Prompt anzeige. Der Output entstehe auf Basis der Ausgabe des Modells, nachdem diese durch die sogenannte Decoding-Struktur verarbeitet worden sei. Beim Decoding entstünden durch gezielt eingesetzte Randomisierungs-Mechanismen (Mechanismen zur Einführung eines Zufallselements in die Generierung von Ausgaben) Zufälligkeit und Variationen. Dieses Decoding sei somit nicht Teil des Modells, sondern diesem nachgelagert. Die Generierung nicht-deterministischer Ausgabe des Chatbots (und nicht des Modells) beruhe somit auf Designentscheidungen der Beklagten, die jederzeit wieder deaktiviert werden könnten.
38
Die Beklagten unterschieden die Modelle nicht in der gebotenen Klarheit von dem ihnen nachgeordneten Decoding-Algorithmus und von dem Gesamtsystem, dem Modell plus Decoding-Algorithmus plus Benutzeroberfläche Chatbot.
39
Mit dem Greedy Decoding stünde eine Decoding-Strategie zur Verfügung, die den Determinismus des Modells auf die Ausgabe des Chatbots übertrage. Werde Greedy-Decoding verwendet, bleibe die Ausgabe deterministisch. Selbst Nutzer könnten durch entsprechende Anpassung des Temperature-Parameters ein quasi-deterministisches Ausgabeverhalten erreichen.
40
Trotz künstlicher Randomisierung beim Decoding reproduzierten Chatbots memorisierte Inhalte konsistent und mit minimaler Varianz, weil bei der Generierung memorisierter Inhalte die Wahrscheinlichkeiten der Token, die sich zum memorisierten Inhalt zusammensetzen, sehr hohe Werte erreichten – häufig nahe 100%. Die Wiedergabe des memorisierten Inhalts werde damit faktisch unvermeidbar und erfolge deterministisch. Die Chatbots funktionierten insoweit wie eine Datenbank.
41
Ob ein Output memorisierten Inhalt enthalte, sei durch einen Abgleich des Outputs mit den Trainingsdaten möglich. Finde sich der Output in den Trainingsdaten wieder, müsse man von einer Memorisierung ausgehen. Zwar bestünde die theoretische Möglichkeit einer zufälligen Identität zwischen Output und Trainingsdatum. Jedenfalls ab einer bestimmten Textlänge sei die Wahrscheinlichkeit eines solchen Zufalls jedoch so verschwindend gering, dass sie praktisch vernachlässigbar werde.
42
Die streitgegenständlichen Liedtexte seien vollständig und unverändert im Modell memorisiert. Sofern es bei der Ausgabe der memorisierten Inhalte zu Verkürzungen und insbesondere Veränderungen der Texte komme, sei dies nicht dem Modell und den darin verkörperten Informationen geschuldet, sondern den Decoding-Mechanismen, die durch die Erzeugung künstlicher Varianz Halluzinationen provozierten. Die Ausgabe der streitgegenständlichen Liedtexte sei kein provozierter Einzelfall, sondern finde konsistent statt.
43
Selbst bei Beibehaltung der randomisierenden Decoding-Mechanismen erfolge eine ausreichend konsistente Ausgabe der Liedtexte. Die dadurch eingeführte Varianz betreffe gerade nicht die memorisierten Inhalte, sondern primär die auswechselbaren Einleitungs- und Schlusstexte der Outputs. Die Gewissheit der Modelle in Bezug auf memorisierte Inhalte – also die Wahrscheinlichkeitswerte der entsprechenden Tokensequenz gemäß Softmax-Funktion – sei so hoch, dass der Chatbot diese konsistent ausgebe.
44
Die Unternehmensgruppe der Beklagten habe maßgeblichen Einfluss auf die Outputs, unter anderem durch die gezielte Auswahl der Trainingsinhalte, die bewusste Ausgestaltung des Trainingsprozesses zur Memorierung spezifischer Inhalte und die Implementierung oder Unterlassung von Filtertechnologien.
45
Die Klägerin behauptet, die streitgegenständlichen Liedtexte seien nicht mit der Zustimmung der Rechteinhaber im Internet frei verfügbar. Für die von den Beklagten benannten Liedtextkopien, die vermeintlich ohne Nutzungsvorbehalt im Internet verfügbar gewesen seien, ließen sich überwiegend Nutzungsvorbehalte feststellen (siehe Screenshots der Websites als Anlagen K 56, 57).
46
Die Klägerin habe keine Lizenzen für eine Online-Nutzung der streitgegenständlichen Liedtexte erteilt. Bei der Lizenzierung anderer Bereiche verpflichte sie ihre Lizenznehmer konsequent zur Einhaltung des Text und Data Mining Nutzungsvorbehalts.
47
Weder der allgemeinen Bevölkerung noch den Rechtsinhabern sei die Existenz von Modellen vor der Veröffentlichung des ersten Chatbots der Unternehmensgruppe der Beklagten im November 2022 bewusst gewesen.
48
Die Beklagten erweckten durch eine Bewerbung ihres Dienstes mit „Get answers“ die Funktionserwartung einer Wissensdatenbank.
49
Die Klägerin ist der Ansicht, Rechtsverletzungen fänden sowohl im Modell als auch bei der Ausgabe statt.
50
Angesichts der erfolgten Memorisierung der streitgegenständlichen Liedtexte in den Modellen der Beklagten handele es sich bei den Modellen um Vervielfältigungsstücke i.S.v. Art. 2 InfoSoc-RL, § 16 Abs. 1, 2 UrhG.
51
Im Hinblick auf die erfolgten Eingaben der streitgegenständlichen Liedtexte als Trainingsdaten in den Modellen der Beklagten und die Ausgabe der Texte bei den erfolgten Abfragen bestünde bereits ein Anscheinsbeweis dafür, dass die Texte in den Modellen vervielfältigt seien. Die technischen Vorgänge spielten sich ausschließlich in der Sphäre der Beklagten ab. Nutzer erhielten keinen unmittelbaren Zugriff auf das Modell. Wenn Informationen in ein System wie vorliegend die Liedtexte beim Training eingespeist würden und das System anschließend dieselben Informationen, die Liedtexte, wiedergebe, sei typischerweise davon auszugehen, dass die Informationen im System gespeichert seien.
52
Tatsächlich wiesen die (teil-)identischen Ausgaben der Liedtexte deren Fixierung im Modell aber auch nach, da eine provozierte Regurgitation aufgrund der verwendeten Prompts ebenso wie eine zufällige Regurgitation aufgrund deren Unwahrscheinlichkeit ausgeschlossen sei.
53
Aus der Technologieneutralität des § 16 Abs. 1 und 2 UrhG und der Schwerpunktsetzung auf die Eignung zur mittelbaren Wahrnehmbarmachung ergebe sich, dass die Rechtsprechung auch Trägertechnologien als Vervielfältigungsstücke einstufe, die substanzielle Veränderungen an der Festlegung eines Werkes vornähmen, sofern sie nur eine sinnliche Wahrnehmung der schöpferischen Züge des Werkes erlaubten. Zur Beurteilung der Speicherung im Modell komme es nicht darauf an, ob die im Modell enthaltenen Einzelfragmente der streitgegenständlichen Liedtexte für sich gesehen urheberrechtlich geschützt oder in einer urheberrechtlich geschützten Anordnung gespeichert seien. Entscheidend sei, ob diese Inhalte später vom System in einer Anordnung ausgegeben würden, die die eigene geistige Schöpfung zum Ausdruck bringe. Aufgrund des Determinismus der Modelle sei dies der Fall. Zufälligkeit und Varianz bei den Ausgaben resultierten erst aus bewussten Designentscheidungen der Beklagten auf Ebene der Decoding-Architektur. Aber selbst bei Beibehaltung der randomisierenden Decoding-Mechanismen erfolge eine ausreichend konsistente Ausgabe der Liedtexte, da die Varianz nicht die memorisierten Inhalte, sondern primär die auswechselbaren Einleitungs- und Schlusstexte der Ausgabe beträfen. Im Interesse eines hohen Schutzniveaus für Urheber und angesichts neuer Technologien müsse es für das Vorliegen einer Vervielfältigung genügen, dass die Anwendung der Hilfsmittel mit einer gewissen Wahrscheinlichkeit zur Wahrnehmbarmachung des Werkes führe.
54
Die Modelle erlaubten mittelbar die sinnliche Wahrnehmung der streitgegenständlichen Liedtexte bzw. urheberrechtlich geschützter Teile davon. Die dabei erforderlichen technischen Hilfsmittel umfassten die Decoding-Architektur zur Verarbeitung der Softmax-Funktionen des Modells, die Chatbot-Benutzeroberfläche mit Eingabemaske und Ausgabedarstellung und die Nutzereingabe.
55
Die dauerhaften Vervielfältigungen im Modell seien nicht durch § 44b UrhG gerechtfertigt. Bereits die Anwendbarkeit auf Modelle werde bezweifelt. Jedenfalls unterfielen Memorisierungen von Trainingsdaten nicht der Text und Data Mining Schranke, da Vervielfältigungen im Modell nicht der weiteren Datenanalyse dienten und eine dauerhafte Vervielfältigung ohnehin nicht durch § 44b UrhG gerechtfertigt sei. § 60d UrhG finde keine Anwendung, da die Beklagten nicht zu den privilegierten Forschungsorganisationen zählten. Auch wenn man auf die Obergesellschaft abstellen wollte, liege bei Unternehmen, die wissenschaftliche Forschung betrieben, um darauf basierend Waren oder Dienstleistungen zu entwickeln und zu vermarkten, die Verfolgung eines kommerziellen Zweckes vor.
56
Jedenfalls habe die Klägerin einen wirksamen Nutzungsvorbehalt erklärt. Die Beklagten trügen die Darlegungs- und Beweislast für ihre Behauptung, es liege kein wirksamer Nutzungsvorbehalt vor, und zwar im Hinblick auf sämtliche Quellen, denen sie die streitgegenständlichen Liedtexte entnommen hätten, da jede Nutzung von Quelldaten eine eigene Vervielfältigungshandlung darstelle. Im Rahmen des § 44b UrhG werde das Ausschließlichkeitsrecht des Urhebers in ein „Opt-Out“-Recht umgekehrt: Der Urheber müsse aktiv tätig werden und Nutzungen, die er nicht wünsche oder für die er eine Vergütung beanspruche, widersprechen. Bliebe er untätig, sei das Text und Data Mining nach § 44b UrhG erlaubt. Ein Tätigwerden des Urhebers setze jedoch voraus, dass der Urheber von der (beabsichtigten) Nutzung überhaupt erfahre, was bei der Nutzung von Werken für das KI-Training typischerweise nicht der Fall sei, da die betreffenden Unternehmen die betroffenen Rechtsinhaber weder vorher noch nachher über die Werknutzung zu Trainingszwecken informierten. Die Beklagten verhielten sich in Bezug auf die verwendeten Trainingsdaten nicht transparent, sondern behandelten diese Information im Gegenteil sogar als Geschäftsgeheimnis, wie das vorliegende Verfahren zeige. Das robots.txt-Protokoll sei für die Erklärung von Nutzungsvorbehalten im Bereich des Text und Data Mining nicht uneingeschränkt geeignet. Mit robots.txt sei es nicht möglich, Nutzungsvorbehalte werkbezogen zu erklären, da in diesem Protokoll nur Verzeichnisse, Unterverzeichnisse oder URLs mit bestimmten Zeichenketten pauschal ausgeschlossen, nicht aber einzelne spezifische Inhalte oder Werke präzise identifiziert werden könnten. Auch Nutzungsarten oder Lizenzbedingungen könnten in robots.txt nicht adressiert werden.
57
Durch die Outputs der Modelle seien weitere Verletzungshandlungen erfolgt.
58
Die Regurgitationen der memorisierten streitgegenständlichen Liedtexte erzeugten bei den Outputs Vervielfältigungen, deren Hersteller die Beklagten seien. Diese manifestierten sich sowohl als Festlegungen im Arbeitsspeicher der Nutzer-Endgeräte als auch als dauerhafte Speicherungen in der Chat-Historie auf den von den Beklagten bereitgestellten Cloud-Servern.
59
Die Outputs seien keine Doppelschöpfungen, weil diese nicht durch einen magischen Vorgang begründet würden, sondern kausal durch das Training mit den entsprechenden Werken und deren Memorisierung, also durch Speicherung im Modell.
60
Die Beklagten seien nach der primär maßgeblichen technischen Betrachtung als Hersteller dieser Vervielfältigungen anzusehen. Die Beklagten stellten keinen neutralen Vervielfältigungsdienst wie etwa Internetrecorder bereit, sondern ein inhaltlich determiniertes Informationssystem, auf das sie maßgeblichen Einfluss hätten. Die deliktsrechtliche Verantwortlichkeit für die streitgegenständlichen Outputs liege bei den Beklagten, die die Modelle mit den Liedtexten trainiert hätten.
61
Die streitgegenständlichen Outputs seien als öffentliche Zugänglichmachungen nach § 19a UrhG zu qualifizieren. Die Wiedergabehandlung der Beklagten sei unmittelbar, da sie selbst der Öffentlichkeit die Möglichkeit des Werkgenusses eröffneten und nicht lediglich (mittelbar) durch die Bereitstellung von Infrastruktur eine Wiedergabehandlung Dritter ermöglichten. Da für die Handlung der Wiedergabe die bloße Möglichkeit des Abrufs genüge, sei es unschädlich, wenn die Liedtexte auf den Prompt hin generiert würden, und die Outputs Abweichungen enthielten. Nutzer des Chatbots stellten ein neues Publikum dar. Die Einstellung der Inhalte sei ohne Zustimmung der Rechteinhaber erfolgt. Es bestünde auch ein erheblicher Unterschied zu Suchmaschinen, da der Nutzer nicht mehr die Originalwebsite besuchen müsse, der Chatbot ersetze die Quelle.
62
Hilfsweise sei jedenfalls durch die Outputs der allgemeine Tatbestand der öffentlichen Wiedergabe nach § 15 Abs. 2 UrhG erfüllt. Die Beklagten seien nicht nur Anbieter einer Infrastruktur, sondern nähmen eine zentrale Rolle ein, um die Wiedergabe zu ermöglichen.
63
Die streitgegenständlichen Outputs griffen als Umgestaltungen im Sinne des § 23 Abs. 1 S. 1 UrhG in die Rechte der Klägerin ein. Die Originallieder seien in wiedererkennbarer Form in den Outputs übernommen. Für die Feststellung einer Rechtsverletzung durch die Übernahme geschützter Werkteile komme es ausschließlich darauf an, ob die geschützten Werkteile im neuen Werk wiedererkennbar seien; ein Vergleich des Gesamteindrucks der beiden Gestaltungen sei nicht maßgeblich. Eine derartige Auslegung der § 23 Abs. 1 S. 2 UrhG, der zufolge ein klar identifizierbarer und damit wiedererkennbar übernommener Teil eines vorexistierenden Werkes aufgrund eines Vergleichs der beiden Werke in der Gesamtschau als zulässige Übernahme eingestuft werde, sei bereits unionsrechtswidrig. Denn hierfür sehe der abschließende Schrankenkatalog in Art. 5 InfoSoc-RL keine entsprechende Umsetzungsermächtigung für die Mitgliedstaaten vor. Die „Verblassensformel“ sei ausschließlich persönlich geistigen Schöpfungen vorbehalten und scheide bei KI-Erzeugnissen von vornherein aus. Außerdem verblassten die übernommenen Textpassagen auch bei einem Vergleich der Gestaltungen in der Gesamtschau nicht.
64
Die Veränderungen der Liedtexte erfüllten den Tatbestand des § 14 UrhG. Die Entstellungen seien das Ergebnis bewusster Designentscheidungen der Beklagten, die durch Randomisierungs-Mechanismen auf Decoding-Ebene Abweichungen vom korrekt memorisierten Text und somit Halluzinationen gezielt herbeiführten und damit willentlich in Kauf nähmen, urheberrechtlich geschützte Inhalte mit werkfremden Inhalten zu verbinden und dadurch zu entstellen. Durch die Möglichkeit, Chatverläufe per Link zu teilen, hätten die entstellten Liedtexte eine hohe potenzielle Reichweite. Aufgrund der Nutzung des Chatbots als Informationsquelle und Wissensdatenbank würden die entstellten Texte den Textdichterinnen und Textdichtern zugerechnet.
65
Die Zuschreibung verfälschter Liedtexte greife in den Schutzbereich des allgemeinen Persönlichkeitsrechts ein. Dieses schütze den Urheber neben § 14 UrhG, der die Entstellung an sich, also den Eingriff in die Werkintegrität betreffe, zusätzlich davor, ihm ohne seinen Willen veränderte Werke durch seine Nennung als Urheber zuzuschreiben. Bei Zuschreibungen von Äußerungen, die der vermeintliche Urheber nie getätigt habe, handele es sich um unwahre Tatsachenbehauptungen. Hilfsweise werde der Unterlassungsanspruch gegen die Zuschreibung der verfälschten Liedtexte auf § 13 S. 2 UrhG gestützt.
66
Die Outputs seien nicht als Zitat nach § 51 UrhG gerechtfertigt. Ein KI-System sei nicht imstande, dem Zitat einen schöpferischen selbständigen Text hinzuzufügen, und könne keinen Zitatzweck verfolgen. Überdies schütze das Zitatrecht nur eine unveränderte Übernahme.
67
Eine Rechtfertigung nach § 51a UrhG setze eine vorliegend nicht gegebene inhaltlich-künstlerische Befassung mit dem Bezugsgegenstand voraus.
68
Als juristische Person könnten sich die Beklagten nicht auf § 53 UrhG berufen. Soweit es sich bei den Nutzern um Unternehmen handele, könnten diese sich nicht auf die Privatkopieschranke berufen.
69
Eine Einwilligung in die Verletzungshandlungen im Modell und durch die Outputs scheitere bereits daran, dass das Crawlen von Internetinhalten und ihre Verwendung für das Training von Modellen als unbekannte Nutzungshandlung keine übliche Nutzungshandlung sei, mit der der Rechteinhaber rechnen müsse. Die Beklagten selbst bezeichneten die Memorisierung als „rare bug“, die nicht „nach den Umständen üblicherweise zu erwarten“ sei.
70
Der Einwand der Unverhältnismäßigkeit gemäß § 275 Abs. 2 BGB sei nicht anwendbar auf Unterlassungsansprüche, die wie § 97 Abs. 1 UrhG dazu dienten, die Rechtssphäre der Urheber vor Eingriffen Dritter zu schützen. Jedenfalls sei der Unterlassungsanspruch nicht unverhältnismäßig. Die Memorisierung sei kein untergeordnetes Phänomen, sondern betreffe mindestens 1% der Trainingsdaten. Zudem könnten die Beklagten ein Modell mit einem tatsächlich effektiv deduplizierten Trainingsdatenkorpus trainieren oder Lizenzen für die Inhalte einholen, mit denen sie ihre Transformer-Modelle trainiere.
71
Die Klage sei nicht missbräuchlich. Die Klägerin verfolge ihre gesetzlichen Aufgaben aus dem VGG und ihre gesellschaftliche Funktion, die Interessen und Rechte ihrer Berechtigten kollektiv wahrzunehmen. Die Klägerin beabsichtige nicht, ein bestimmtes Lizenzmodell durchzusetzen.
72
Die Klägerin hat ihre Klageanträge mit Schriftsatz vom 18.09.2025 und im Termin zur mündlichen Verhandlung vom 29.09.2025 nach den erfolgten Hinweisen der Kammer angepasst.
73
Die Klägerin beantragt zuletzt,
1. Die Beklagten werden verurteilt, es bei Vermeidung eines vom Gericht für jeden Fall der Zuwiderhandlung festzusetzenden Ordnungsgeldes bis zu 250.000,- EUR, ersatzweise Ordnungshaft, oder Ordnungshaft bis zu sechs Monaten, zu unterlassen,
a) (Vervielfältigungen im Modell) die als Anlagenkonvolut K 1 beigefügten Liedtexte ganz oder teilweise ohne Einwilligung der Klägerin in Sprachmodellen (Large Language Models) zu vervielfältigen und/oder diese Handlung durch Dritte vornehmen zu lassen, wie geschehen in den Modellen 4 und 4o;
b) (Verletzungen bei der Ausgabe) die als Anlagenkonvolut K 1 beigefügten Liedtexte ganz oder teilweise und/oder in Form von Umgestaltungen ohne Einwilligung der Klägerin in den Ausgaben (Outputs) eines generativen Sprachassistenten (Chatbot) öffentlich zugänglich zu machen, hilfsweise für den Fall der Abweisung des Antrags bzgl. der öffentlichen Zugänglichmachung und/oder öffentlich wiederzugeben, und/oder zu vervielfältigen und/oder diese Handlungen durch Dritte vornehmen zu lassen, wie geschehen in Anlagenkonvolut K 2;
c) in Bezug auf die in Anlagenkonvolut K 1 genannten Textdichter zu behaupten und/oder zu verbreiten und/oder diese Handlungen durch Dritte vornehmen zu lassen, die im Anlagenkonvolut K 2 wiedergegebenen Texte seien von ihnen verfasst, wie geschehen in Anlagenkonvolut K 2.
2. Die Beklagten werden verurteilt, der Klägerin unter Vorlage eines geordneten Verzeichnisses Auskunft darüber zu erteilen, in welchem Umfang sie die in Ziffer 1 beschriebenen Handlungen (in Bezug auf die Beklagte zu 1) seit dem 14. Dezember 2023 und in Bezug auf die Beklagte zu 2) seit dem 30. November 2022) vorgenommen haben und welche Einnahmen sie hieraus erzielt haben, und zwar unter Angabe
a) von Anzahl und Umfang der Handlungen nach Ziffer 1 seit dem jeweils genannten Zeitpunkt und
b) der Umsätze seit dem jeweils genannten Zeitpunkt.
3. Es wird festgestellt, dass die Beklagten verpflichtet sind, der Klägerin allen Schaden zu ersetzen, der ihr durch die in Ziffer 1 beschriebenen Handlungen bereits entstanden ist und/oder noch entstehen wird, hilfsweise die ungerechtfertigte Bereicherung herauszugeben, wie sie sich anhand der Auskunft nach Ziffer 2 ergibt.
4. Die Klägerin wird ermächtigt, den verfügenden Teil des Urteils innerhalb von 6 Wochen nach Rechtskraft des Urteils in der überregionalen Süddeutschen Zeitung am Wochenende auf S. 3 im Ressort Wirtschaft im Format 1/4 Seite quer auf Kosten der Beklagten bekannt zu machen.
5. Die Beklagten werden verurteilt, an die Klägerin vorgerichtliche Rechtsanwaltskosten in Höhe von 5.049,70 EUR nebst Zinsen in Höhe von fünf Prozentpunkten über dem Basiszinssatz seit Rechtshängigkeit zu zahlen.
74
Die Beklagten beantragen,
Die Klage wird abgewiesen.
75
Die Beklagten behaupten, die Obergesellschaft der Unternehmensgruppe der Beklagten sei als gemeinnütziges Unternehmen gegründet worden und bis heute gemeinnützig geblieben. Sie betreibe wissenschaftliche Forschung.
76
Das Modell speichere oder kopiere keine spezifischen Trainingsdaten, sondern reflektiere in seinen Parametern, was es basierend auf dem gesamten Trainingsdatensatz erlernt habe, nämlich Beziehungen und Muster aller Wörter beziehungsweise Token, die die Vielfalt der menschlichen Sprache und ihrer Kontexte abbildeten. Es funktioniere auf Basis statistischer Wahrscheinlichkeiten und sei aufgrund der im Training abgeleiteten statistischen Information lediglich dazu befähigt, statistisch wahrscheinliche Tokenfolgen zu generieren.
77
Die Technologie der Unternehmensgruppe der Beklagten sehe keinen dem Modell nachgeordneten Decoding-Algorithmus vor.
78
Wahrscheinlichkeitsbeziehungen existierten nicht im Modell. Wahrscheinlichkeiten zwischen den einzelnen Token bildeten sich erst bei der Generierung durch die Verarbeitung der Nutzereingabe. Erst durch diese werde determiniert, wie eine bestimmte Folge aus Wörtern/Token zusammenzusetzen sei.
79
Eine Einstellung, mit denen das Modell immer den wahrscheinlichsten Token auswähle, könne die Funktionsfähigkeit des Modells als Sprachmodell beeinträchtigen (z.B. Wiederholungsschleifen) und sei deswegen auch bei den Modellen, die dem Chatbot zugrunde lägen, nicht vorgesehen.
80
Outputs basierten auf einer sequenziell-analytisch, iterativ-probabilistischen Synthese und stellten eine unabhängige und originäre (maschinelle) Generierung eigener Art dar. Die Nutzereingabe und deren Inhalt seien immer maßgeblich für die Generierung der Ausgabe durch das Modell. Es gebe keine abgrenzbaren, deterministischen Outputs. Ein Modell sei keine Datenbank, in der Trainingsdaten hinterlegt seien, die aufgrund der Eingabe des Nutzers gesucht, aufgefunden und anschließend ausgegeben würden.
81
Der Betreiber einer generativen KI wisse vor der Ausgabe nicht, was auf eine bestimmte Nutzereingabe hin konkret generiert werde. Vor Abschluss der schrittweisen Generierung stünde sie nicht fest und sei daher nicht deterministisch. Modelle seien nicht darauf angelegt, Trainingsdaten erneut zu generieren. Wenn Modelle korrekte Fakten lieferten, könne dies eine Folge des statistischen Trainings mit großen Textmengen sein.
82
Mit dem Begriff der Memorisierung werde in der Forschung lediglich der Umstand bezeichnet, dass ein Modell in der Lage sei, auf bestimmte Nutzereingaben Inhalte zu generieren, die mit Trainingsinhalten identisch seien, letztlich das Phänomen der Regurgitation.
83
Die Parameter des Modells stünden nach dem Training nicht unveränderlich fest, sondern würden im Rahmen von Post-Training-Maßnahmen wiederholt angepasst. Die Modellgewichte würden dahin angepasst, dass etwa keine Outputs unerwünschter Inhalte erfolgten. Die Unternehmensgruppe der Beklagten sehe eine Vielzahl von Maßnahmen und Gestaltungselementen vor, die auch darauf gerichtet seien, die Generierung von Text, der Trainingsinhalten ganz oder in Teilen gleiche, durch die Transformer-Modelle zu verhindern.
84
Die Generierung von Trainingsdaten als Output könne nicht vollständig unterbunden werden, da der einmal erfolgte Trainingsvorgang, aus dem das (trainierte) Modell hervorgegangen sei, nicht mehr rückgängig gemacht werden könne; ein „unlearning“ eines bestimmten Inhalts sei nach dem heutigen Stand der Forschung nicht möglich.
85
Bei der Erstellung des Trainingsdatensatzes habe die Unternehmensgruppe der Beklagten im Fall öffentlich zugänglicher Internetseiten robots.txt-Dateien, mit denen einer Sammlung durch Webcrawler widersprochen werden könne, berücksichtigt.
86
Die streitgegenständlichen Liedtexte seien alle mit Einverständnis der Schutzrechtsinhaber ohne Sicherungsvorkehrungen in das Internet gestellt worden. Jeder der neun streitgegenständlichen Liedtexte sei aus einer Webseite ohne eingerichtete robots.txt-Dateien gecrawlt worden, oder die eingerichteten robtots.txt-Dateien hätten ein Crawlen durch den CCBot nicht verboten.
87
Die von der Klägerin vorgelegten Ausgaben des Chatbots könnten keine Fixierung der Liedtexte im Modell nachweisen. Bereits die vorgelegten Anlagen zeigten, dass Outputs nicht konsistent stattfänden.
88
Die Klägerin habe die vorgelegten Ausgaben provoziert, indem sie die jeweiligen Prompts mehrfach getestet habe. Zudem habe sie einen Handlungsrahmen geschaffen, um das Modell von seiner neutralen Bahn abzubringen, indem sie die benutzerdefinierten Agenten als „Experten für Liedtexte“ ausgestaltet habe.
89
Wie aus Anlage K 3 ersichtlich, handele es sich bei nahezu allen Ausgaben des Chatbots, auf welche die Klägerin im Rahmen ihrer Verletzungssubsumtion verweise, nicht um wortgetreue Wiedergaben, sondern um sog. Halluzinationen, also das Erzeugnis inhaltlich falscher, frei erfundener oder faktisch nicht belegbarer Ausgaben durch das Modell, und nicht um Regurgitationen.
90
Die Beklagten sind der Ansicht, die Klage sei unzulässig.
91
Die Klageanträge unter Ziffer 1 und 2 genügten nicht den Anforderungen an die Bestimmtheit gemäß § 253 Abs. 2 Nr. 2 ZPO. Die Klägerin wolle den Gegenstand des begehrten Verbots bewusst im Unklaren oder Vagen halten. Im Hinblick auf die Anträge unter Ziffer 1 sei jeweils der abstrahierende Teil des begehrten Verbotes unbestimmt durch die Verwendung der auslegungsbedürftigen Begriffe „teilweise“ und „Umgestaltung“, und unter Ziffer 1c) sei der Antrag insgesamt unverständlich. Der Antrag unter Ziffer 2 sei unbestimmt, weil er sich auf „Handlungen nach Ziffer 1“ beziehe und überdies nicht nachvollziehbar sei, wie sich „Anzahl“ und „Umfang“ unterschieden und wie „Einnahmen“ identifiziert werden könnten.
92
Die Klage sei zudem teilweise unzulässig, weil der Klägerin die Prozessführungsbefugnis für die Ansprüche fehle. Die Klägerin habe keine lückenlose Rechtekette vorgelegt und keine Nachforschungen unternommen um sicherzustellen, dass die behaupteten ausschließlichen Nutzungsrechte in ihrer Inhaberschaft stünden. Die Berechtigungsverträge mit den Textdichtern der Liedtexte seien unwirksam. Sämtliche vorgelegten Berechtigungsverträge verstießen gegen das für Allgemeine Geschäftsbedingungen geltende Transparenzgebot nach § 307 Abs. 1 BGB. Bei Ziffer 3 und 4 der Zusatzvereinbarungen handele es sich um eine Blankoermächtigung, anhand derer die Vertragspartner der Klägerin nicht erkennen könnten, welchen Umfang die von ihnen erteilte Ermächtigung tatsächlich habe. Eine Geltendmachung von Ansprüchen nach § 13 UrhG werde bereits nicht erwähnt. Ohnehin könne die Klägerin die Ansprüche, die auf dem Urheberpersönlichkeitsrecht und dem allgemeinen Persönlichkeitsrecht gründeten, nicht im Wege der Prozessstandschaft geltend machen, da dies Rechte mit höchstpersönlichem Charakter seien. Zudem seien nach Ziffer 5 der vorgelegten Zusatzvereinbarungen nur bereits entstandene Ansprüche auf Auskunft, Schadensersatz und Bereicherung abgetreten, die Klägerin begehre aber die Feststellung der Schadensersatzpflicht auch für noch entstehende Schäden.
93
Die Klage sei unbegründet. Sie sei letztlich durchweg nicht schlüssig.
94
Die Klägerin sei nicht aktivlegitimiert. Die vorgelegten Berechtigungsverträge seien unwirksam. Zudem seien die aus der angeblichen Verletzung des allgemeinen Persönlichkeitsrechts resultierenden Auskunfts- und Schadensersatzansprüche sowie bereicherungsrechtliche Ansprüche qua ihrer Verknüpfung mit dem allgemeinen Persönlichkeitsrecht der Textdichter höchstpersönlicher Natur und nicht abtretbar.
95
Eine Urheberrechtsverletzung durch das Modell sei nicht gegeben.
96
Es liege keine körperliche Festlegung der Trainingsdaten in den Modellen vor, wie sie für eine Vervielfältigung im Sinne des § 16 UrhG erforderlich sei. Zwar würden für die Entwicklung des Modells die Trainingsdaten genutzt und die Nutzung schlage sich auch in einem Beitrag zur Ausgestaltung und Anpassung der Parameter des Modells nieder. Es gebe aber keinen identifizierbaren Datensatz, der die Liedtexte verkörperte. Darin liege der Unterschied zu allen früheren Technologien, in denen sich immer ein konkreter Datensatz objektiv bestimmen lasse, selbst wenn er nur fragmentiert vorliege, der das Werk verkörpere bzw. repräsentiere. Die gespeicherten einzelnen Parameter, einschließlich der Vektoren, könnten nicht als Repräsentation oder Speicherung eines bestimmten Textes oder einer bestimmten Wortfolge aus den Trainingsdaten angesehen werden, auch nicht mehrere solcher Parameter zusammen. Die Wahrscheinlichkeitsbeziehungen, auf welche die Klägerin abstelle, seien nicht bestimmbar, weil sich die konkrete Wahrscheinlichkeit einer bestimmten Folge an Wörtern erst mit und durch die Verarbeitung eines entsprechenden Prompts in der Generierung des Outputs manifestiere. Gleichzeitig liege keine mit der Festlegung zugleich definierte Maßnahme vor, mit der die Liedtexte in wiederholbarer Weise wiedergegeben werden könnten.
97
Die Klägerin bringe keinen substanziierten Tatsachenvortrag mit Blick auf die behauptete Speicherung der streitgegenständlichen Liedtexte im Modell. Die Klägerin stelle hier auf ein Memorisieren von Trainingsdaten ab. Dass man von dem (gleich wie erzielten) Output nicht auf das Vorliegen einer körperlichen Festlegung im Modell schließen könne, erkenne damit auch die Klägerin an.
98
Die Voraussetzungen für einen Anscheinsbeweis seien offensichtlich nicht gegeben, weil es den von der Klägerin postulierten Erfahrungssatz nicht gebe. Die Beklagten treffe auch keine sekundäre Darlegungslast, weil sie umfassend zur Funktionsweise der Modelle vorgetragen habe.
99
Vervielfältigungen und etwaige Bearbeitungen seien von den Text und Data Mining Schranken gemäß § 60d Abs. 1 UrhG und § 44b Abs. 2 S. 1 UrhG gedeckt, denn diese Schranken erfassten auch zwingend etwaige aus dem Training resultierende (unterstellte) Vervielfältigungen in dem Modell. Die Schranken seien auf das Training von Modellen anwendbar und beschränkten sich nicht auf die Zusammenstellung des Trainingskorpus. Aus der Mitteilung der Kommission „Künstliche Intelligenz für Europa“ vom 25.04.2018 (COM/2018/237, Anlage B 42) ergebe sich, dass dem EU-Gesetzgeber die massenhafte Nutzung von Daten für die Zwecke des Trainings von KI-Modellen bekannt und diese sogar Anlass zur Einführung der Text und Data Mining Schranke gewesen sei. Die beim Training stattfindende Analyse der in den Trainingsdaten enthaltenen Informationen sei mit dem Werkgenuss von Werken vergleichbar, der von den urheberrechtlichen Verwertungsrechten nicht erfasst sei. Da es dem klaren Willen des Gesetzgebers entspreche, die Text und Data Mining Schranken auf das Training von Modellen anzuwenden, müssten von den Schranken auch alle im Rahmen des Trainings entstehende Vervielfältigungen erfasst sein. Ein anderes Verständnis sei mit dem sich aus Erwägungsgrund 18 der DSM-RL ergebenden Zweck der Schranken, die „Entwicklung neuer Anwendungen oder Technologien“ zu ermöglichen, nicht vereinbar. Die vermeintlich beim Training entstehenden Vervielfältigungen seien durch die Betriebsdauer des Modelles beschränkt. Vermeintlich entstehende Vervielfältigungen seien durch § 60d UrhG zulässig. Die Beklagten seien privilegierte Forschungseinrichtungen, da sich die Voraussetzung der Verfolgung nicht kommerzieller Zwecke nicht unmittelbar auf das Text und Data Mining, sondern gemäß § 60d Abs. 2 Nr. 1 UrhG (und gemäß Art. 2 Nr. 1 DSM-RL) auf die das Text und Data Mining vornehmende Einrichtung beziehe, die insgesamt die Definition der Forschungseinrichtung erfüllen müsse. Zudem sei § 60d Abs. 2 Nr. 1 UrhG im Gegensatz zur alten Fassung des § 60d UrhG ebenso wenig wie Art. 2 Nr. 1 DSM-RL nicht zu entnehmen, dass die Einrichtung keinerlei kommerzielle Zwecke verfolgen dürfe. Die kommerziellen Zwecke, die die Untergesellschaften der Unternehmensgruppe der Beklagten verfolgten, änderten nichts daran, dass die Unternehmensgruppe insgesamt – und damit auch die Beklagten als Teil dieser Unternehmensgruppe – unter die Definition der Forschungsorganisation falle, da sie wissenschaftliche Forschung betreibe und ihre Obergesellschaft nicht gewinnorientiert sei.
100
Wirksame Nutzungsvorbehalte seien nicht gegeben. Die Beklagten seien ihrer diesbezüglichen Darlegungs- und Beweislast nachgekommen, indem sie vorgetragen hätten, dass bei der Erstellung der Trainingsdatensätze Interessen Dritter durch die Beachtung von robots.txt-Dateien berücksichtigt worden seien. Ein darüberhinausgehender Vortrag, insbesondere im Hinblick auf eine Bezeichnung sämtlicher Quellen, aus denen die Texte gecrawlt worden seien, sei den Beklagten nicht zumutbar. Die robots.txt-Datei sei eine taugliche und formwirksame Methode zur Erklärung des Nutzungsvorbehalts und als Marktstandard anerkannt. Das Bestreiten der Klägerin mit Nichtwissen, dass die von den Beklagten eingesetzten Bots Zugriffsverweigerungen konsequent einhielten, sei unbeachtlich. Als Verwertungsgesellschaft sei sie insbesondere verpflichtet, Nutzungsmöglichkeiten zu sichern und unlizenzierte Verwendungen zu unterbinden. Sie müsse daher ihre Lizenznehmer überwachen und Zweifel an der Beachtung der Nutzungsvorbehalte durch Common Crawl als die größte frei zugängliche Sammlung von Webdaten weltweit aufklären. Der von der Klägerin erklärte Nutzungsvorbehalt im Impressum sein erst im Jahr 2024 aufgenommen worden, der Klägerin fehlte die Berechtigung hierzu, und er sei nicht in maschinenlesbarer Form erfolgt.
101
Zudem seien die streitgegenständlichen Liedtexte neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar und damit als unwesentliches Beiwerk nach § 57 UrhG anzusehen. Hauptzweck der Zusammenstellung der Trainingsdatensätze sei bei Common Crawl als maßgeblichem Trainingsdatensammler nicht die Aggregation urheberrechtlich geschützter Inhalte, sondern die Aggregation möglichst umfassender Datensätze ohne weiteren Fokus gewesen.
102
Es liege auch keine Urheberrechtsverletzung durch die Ausgaben des Modells vor.
103
Ein Eingriff durch Outputs sei schon deshalb ausgeschlossen, weil die Erzeugung von Inhalten durch eine generative KI eine unabhängige und originäre Generierung eigener Art darstelle. Der Nutzer steuere den kreativen Schaffensprozess durch seinen Prompt unter Zuhilfenahme von IT als Hilfsmittel.
104
Ein Eingriff in Verwertungsrechte sei mit Blick auf bestimmte Liedtexte nicht möglich, weil gewissen Textfragmenten keine eigene Schutzfähigkeit zukomme. Bei der bruchstückhaften Wiedergabe eines Originals wie im Falle von „36 Grad“ und „Männer“ könne nicht reflexartig von einer erreichten Schutzfähigkeit ausgegangen werden. Gleiches gelte mit Blick auf veränderte Fassungen von Werkteilen (Halluzinationen), die hinreichenden Abstand zur ursprünglichen Gestaltung wahrten. Maßstab für die Bewertung des hinreichenden Abstandes könne nur der einzelne Output und nicht der Chatverlauf in seiner Gesamtheit sein. Der angegriffene Output des Textes „36 Grad“ sei durch zwei unterschiedliche Prompts entstanden.
105
Für ein öffentliches Zugänglichmachen nach § 19a UrhG fehle es bereits an einer Zugänglichmachung der Liedtexte, weil kein Zugriff auf die Liedtexte eröffnet werde. Diese lägen nicht in der Zugriffssphäre der Unternehmensgruppe. Es fehle damit bereits an einer irgendwie gearteten körperlichen Festlegung oder Fassung der Werke, die für den Abruf durch den Nutzer vorgehalten werden könnten. Ohnehin könnten die Liedtexte nicht abgerufen werden, da die streitgegenständlichen Outputs nicht die Texte in ihrer eigentlichen Form enthielten. Es liege auch keine Handlung der Wiedergabe vor und auch die weiteren Voraussetzungen der Öffentlichkeit und des neuen Publikums seien nicht erfüllt, sodass auch keine öffentliche Wiedergabe der Liedtexte nach § 15 Abs. 2 UrhG gegeben sei.
106
Ebenso fehle es an einem Eingriff in das Vervielfältigungsrecht, denn allein der Nutzer sei als Hersteller dieser Vervielfältigungen anzusehen, der mit seinem Prompt den Inhalt des jeweiligen Outputs maßgeblich bestimme und damit den automatisierten Generierungsvorgang in Gang setze.
107
Schließlich mangele es an einer Entstellung oder Beeinträchtigung im Sinne von § 14 UrhG, die geeignet wäre, die berechtigten Interessen der Textdichter an den Liedtexten zu gefährden.
108
Jedenfalls seien etwaige Eingriffe von Schrankbestimmungen nach §§ 51, 51a, 53 UrhG gedeckt.
109
Sowohl für etwaige Nutzungshandlungen im Modell als auch bei der Ausgabe liege eine die Rechtswidrigkeit ausschließende Einwilligung der Rechteinhaber vor. Für die Klägerin sei es bereits unzulässig „mit Nichtwissen“ zu bestreiten, dass Liedtexte durch die Rechtsinhaber selbst oder mit ihrer Zustimmung und ohne Sicherungsvorkehrungen ins Internet eingestellt worden seien. Als ausschließliche Lizenznehmerin müsse sich die Klägerin entsprechende Informationen beschaffen. Jedenfalls wäre die Klägerin in Bezug auf die lizenzierten Nutzungsrechte an den streitgegenständlichen Liedtexten sekundär darlegungsbelastet. Mit dem Einstellen ins Internet hätten die Rechteinhaber in die nach den Umständen üblichen Nutzungshandlungen eingewilligt, zu denen seit 2018 auch gehöre, dass die gecrawlten Daten zur Entwicklung großer Sprachmodelle verwendet würden.
110
Die Beklagten seien nicht passivlegitimiert. Das Anbieten einer universell einsetzbaren generativen KI mache eine entsprechende Berücksichtigung wertungsmäßiger Korrekturen bei der Haftung erforderlich, wie sie die Rechtsprechung schon in anderen Fällen, etwa bei Suchmaschinen oder Plattformbetreibern, entwickelt habe. Die technischen Besonderheiten eines generativen Modells seien bei der Entwicklung des einschlägigen Haftungsmaßstabs zu berücksichtigen.
111
Dem beantragten Unterlassungsbegehren stünden aufgrund der besonderen Sachverhaltskonstellation die Einwendung des Rechtsmissbrauchs entgegen. Die Klägerin verfolge mit der Klage ausschließlich das Ziel, als Verwertungsgesellschaft ein unzulässiges Lizenzmodell durchzusetzen. Sie habe sich mit den Liedtexten gezielt einen kleinen, untergeordneten Ausschnitt aus ihrem vermeintlichen Rechteportfolio ausgesucht. Die Klage sei darauf gerichtet, mit einem unbestimmten Rechtsschutzbegehren einen Unterlassungstitel zu erzielen, der deutlich mehr erfasse als die konkreten Verletzungshandlungen. Als Verwertungsgesellschaft habe die Klägerin kein genuines Interesse an der Unterlassung, sondern sei zum Abschluss von Lizenzverträgen zu angemessenen Bedingungen verpflichtet.
112
Würde der Klägerin ein Titel wie begehrt mit unbestimmter Reichweite gewährt, würde sich für die Beklagten die Frage stellen, ob sie das Angebot für Deutschland nicht einstellen müssten. Dies sei unverhältnismäßig, weil die vermeintlichen Urheberrechtsverletzungen einen völlig untergeordneten Teilaspekt der Nutzung des Angebots der Beklagten beträfen, dessen Bedeutung in keinem Verhältnis zu den aus der Einstellung des Angebots folgenden negativen Auswirkungen auf die Beklagten und ihre Unternehmensgruppe im Gesamten sowie den Interessen Dritter stehe. Die Technologie der Beklagten finde in Bereichen von besonders gewichtigen Allgemeininteressen Verwendung, eröffne Möglichkeiten im Bereich der Bildung, Wissenschaft und Forschung, sei von zentraler gesellschaftlicher und wirtschaftlicher Bedeutung und habe transformatives Potential. Die vollständige Einstellung des Angebots im Staatsgebiet der Bundesrepublik Deutschland ginge demgegenüber mit einer massiven Vernichtung (volks-) wirtschaftlicher Werte sowie einer hohen Belastung der Beklagten und weitreichenden negativen Auswirkungen auf die Interessen Dritter einher. Zudem seien die streitgegenständlichen Liedtexte bereits jetzt im Internet über tatsächliche Abrufdienste kostenfrei abrufbar.
113
Eine Aufbrauchfrist von mindestens sechs Monaten sei mit Blick auf den erforderlichen Entwicklungsaufwand angemessen.
114
Den Beklagten stehe eine Ablösungsbefugnis nach § 100 UrhG zu.
115
Ein Auskunftsanspruch bestehe nicht und sei im Übrigen unverhältnismäßig.
116
Ein Schadensersatzanspruch scheitere insbesondere an der Passivlegitimation und am fehlenden Verschulden. Für einen Bereicherungsanspruch fehle ebenfalls die Passivlegitimation.
117
Im Fall einer Vollstreckung sei von der Klägerin Sicherheit zu leisten gemessen an den Einnahmen der Beklagten in der Bundesrepublik Deutschland, da die Beklagten bei einem Unterlassungstitel für Vervielfältigungen im Modell ihren Betrieb in Deutschland einstellen müssten.
118
Ein berechtigtes Interesse an der Urteilsbekanntmachung bestehe nicht.
119
Die Klägerin hat beantragt,
das Verfahren auszusetzen und dem EuGH zur Vorabentscheidung vorzulegen.
120
Am 25.06.2025 (Bl. 366/367 d.A.) und am 26.09.2025 (Bl. 1047/1048 d.A.) sind Beschlüsse zur Geheimhaltung ergangen.
121
Die Klägerin hat die Aufhebung der Geheimhaltung beantragt (Replik S. 3, Bl. 375 d.A.).
122
Ein Termin zur mündlichen Verhandlung hat am 29.09.2025 stattgefunden, es wird auf die Sitzungsniederschrift verwiesen (Bl. 1060/1064 d.A.).
123
Zur Ergänzung des Tatbestands wird auf die Schriftsätze der Parteivertreter nebst Anlagen Bezug genommen.
Entscheidungsgründe
124
Die zulässige Klage erweist sich als überwiegend begründet. Der Klägerin stehen die geltend gemachten Ansprüche aufgrund der Verletzung von urheberrechtlichen Nutzungsrechten zu. Die zulässig erhobenen persönlichkeitsrechtlichen Ansprüche hingegen sind abzuweisen.
125
Die Klage ist zulässig.
126
I. Das Landgericht München I ist für die Klage gegen die Beklagte zu 1), die ihren Sitz in Dublin hat, nach Art. 7 Nr. 2 EuGVVO international und örtlich zuständig. Im Hinblick auf die Beklagte zu 2) mit Sitz in den USA ergibt sich die Zuständigkeit aus § 32 ZPO.
127
II. Die Klageanträge sind hinreichend bestimmt gemäß § 253 Abs. 2 Nr. 2 ZPO.
128
Nach § 253 Abs. 2 Nr. 2 ZPO hat ein Unterlassungsantrag derart deutlich gefasst zu sein, dass der Streitgegenstand und der Umfang der Prüfungs- und Entscheidungsbefugnis des Gerichts nach § 308 Abs. 1 ZPO erkennbar abgegrenzt sind, sich der Beklagte deshalb erschöpfend verteidigen kann und die Entscheidung darüber, was dem Beklagten verboten ist, nicht letztlich dem Vollstreckungsgericht überlassen bleibt (vgl. BGH 14.07.2022, I ZR 97/21 Rn. 12 – dortmund.de). Eine hinreichende Bestimmtheit ist für gewöhnlich gegeben, wenn auf die konkrete Verletzungshandlung Bezug genommen wird und der Klageantrag zumindest unter Heranziehung des Klagevortrags unzweideutig erkennen lässt, in welchen Merkmalen des angegriffenen Verhaltens die Grundlage und der Anknüpfungspunkt für den Verstoß und damit das Unterlassungsgebot liegen soll (ebd.).
129
Unter Anwendung der genannten Maßstäbe erweist sich die Klage als so bestimmt wie möglich und lediglich dann weniger bestimmt, wenn es sich nicht vermeiden lässt, weshalb die damit einhergehenden Ungenauigkeiten hinzunehmen sind (vgl. Cepl/Voß/Zigann/Werner, 3. Aufl. 2022, ZPO § 253 Rn. 196).
130
1. In den Anträgen und Schriftsätzen der Klägerin ist hinreichend klar bestimmt, welche Verletzungshandlungen sie angreift, nämlich die Vervielfältigung der streitgegenständlichen Liedtexte im Modell, das öffentliche Zugänglichmachen der streitgegenständlichen Liedtexte bei der Ausgabe durch den Chatbot sowie deren Vervielfältigung auf den Endgeräten der Nutzer und in der Chat-Historie, die Eingriffe in das Bearbeitungsrecht, die Entstellung durch Verfälschung der Lieder und die Verletzung des allgemeinen Persönlichkeitsrechts durch Zuschreibung verfälschter Liedtexte. Die Klägerin hat in ihren Anträgen jeweils Bezug auf die konkreten Verletzungshandlungen genommen, für die vorgetragenen Vervielfältigungen im Modell auf die erfolgten Rechtsverletzungen in den Modellen 4 und 4o, und für die angegriffenen Verletzungshandlungen durch die Outputs mittels Bezugnahme auf die in Anlage K 2 dokumentierten Outputs.
131
Die Beklagten haben die unterschiedlichen angegriffenen Verletzungshandlungen zutreffend erkannt und sich bezüglich sämtlicher vorgebrachter Verletzungshandlungen verteidigt.
132
2. Die Klage ist auch im Hinblick auf die Verwendung der auslegungsbedürftigen Begriffe „teilweise“, „Umgestaltungen“, „Anzahl“, „Umfang“ und „Einnahmen“ hinreichend bestimmt.
133
a. Die Unterlassungsanträge unter Ziffer 1 a) und b) enthalten neben der Bezugnahme auf die Anlage K 2 die unbestimmten Begriffe „teilweise“ und „Umgestaltungen“. Die Verwendung auslegungsbedürftiger Begriffe im Klageantrag ist zulässig, wenn über ihren Sinngehalt zwischen den Parteien kein Streit besteht und objektive Maßstäbe zur Abgrenzung vorliegen, oder wenn der Kläger den auslegungsbedürftigen Begriff hinreichend konkret umschreibt und gegebenenfalls mit Beispielen unterlegt oder sein Begehren an der konkreten Verletzungshandlung ausrichtet (vgl. BGH 02.06.2022, I ZR 140/15 Rn. 27 ff – YouTube II). Letzteres ist vorliegend der Fall.
134
Spätestens im Zusammenhang mit dem Klagevortrag ist deutlich, dass der Begriff „teilweise“ die Verwendung von Werkteilen betrifft. Der Begriff der „Umgestaltung“ findet sich in § 23 Abs. 1 S. 1 UrhG. Ohnehin hat die Klägerin ihr Unterlassungsbegehren an den konkreten Verletzungshandlungen gemäß Anlage K 2 ausgerichtet, weshalb anhand dieser beurteilt werden kann, welche Handlungen von den begehrten Unterlassungsanträgen erfasst sind.
135
Eine Antragstellung, die auf sämtliche denkbaren teilweise möglichen Verwendungen der streitgegenständlichen Liedtexte sowie potenzielle Umgestaltungen Bezug nähme, wäre im Verfahren nicht handhabbar. Ebenso wenig ist es prozessökonomisch geboten, aufgrund jeder weiteren teilweisen Verwendung oder Umgestaltung einen neuen Rechtsstreit anzustrengen. Die vorliegend gewählte auslegungsbedürftige Antragsformulierung ist zur Gewährleistung effektiven Rechtsschutzes erforderlich und daher hinzunehmen (vgl. BGH 22.07.2021, I ZR 194/20 Rn. 34 – Rundfunkhaftung).
136
Den Parteien und insbesondere der Beklagtenseite ist zuzutrauen und zumutbar, anhand der in Bezug genommene konkreten Verletzungshandlungen zu beurteilen, ob weitere nicht explizit im Einzelfall im Antrag aufgenommene Verletzungshandlungen unter den Verbotstenor fallen.
137
b. Der unter Ziffer 1c) gestellte Antrag ist verständlich. Die Klägerin nimmt Bezug auf Anlage K 2, in der sich die streitgegenständlichen Liedtexte befinden, die allesamt im Text vom Chatbot geändert worden sind. Sie begehrt ein Verbot zu behaupten, die in Anlage K 2 wiedergegebenen Liedtexte stammten von den ursprünglichen Autoren der Texte.
138
c. Der unter Ziffer 2 gestellte Antrag ist hinreichend bestimmt im Sinne des § 253 Abs. 2 Nr. 2 ZPO. Die erfolgte Bezugnahme auf „die in Ziffer 1 beschriebenen Handlungen“ ist angesichts der bereits dargestellten hinreichenden Bestimmtheit der im Antrag unter Ziffer 1 benannten Handlungen verständlich.
139
Die genannten Begriffe „Anzahl“, „Umfang“ und „Einnahmen“ sind hinreichend bestimmt. Soweit die Beklagten noch einer Erläuterung in Bezug auf die Unterscheidung zwischen „Anzahl“ und „Umfang“ bedurften, ist eine solche in der Replik auf S. 91 (Bl. 463 d.A.) erfolgt, in der die Klägerin anführt, der Begriff des „Umfangs“ umfasse insbesondere die Angabe, in welchem Umfang Werkteile genutzt worden seien. Der Begriff der „Einnahmen“ umfasst nachvollziehbar sämtliche Einnahmen der Beklagten.
140
III. Die Klägerin ist prozessführungsbefugt.
141
1. Die Klägerin macht die Unterlassungsansprüche der Textdichter, die sie auf das Urheberpersönlichkeitsrecht und das allgemeine Persönlichkeitsrecht stützt, im Wege der gewillkürten Prozessstandschaft geltend.
142
a. Eine gewillkürte Prozessstandschaft nach § 51 Abs. 1 ZPO ist grundsätzlich zulässig, wenn der Prozessführende vom Rechtsinhaber zu dieser Art der Prozessführung ermächtigt worden ist und er ein eigenes schutzwürdiges Interesse an ihr hat. Ein schutzwürdiges Eigeninteresse besteht, wenn die Entscheidung Einfluss auf die eigene Rechtslage des Prozessführungsbefugten hat; es kann durch ein wirtschaftliches Interesse begründet werden (BeckOK ZPO/Kersting, 58. Aufl. 2025, ZPO § 51 Rn. 50 m.w.N.).
143
Nach diesen Voraussetzungen liegt eine zulässige gewillkürte Prozessstandschaft vor.
144
aa. Die Textdichterinnen und Textdichter haben in den Verträgen von Ende 2024 (Anlage K 10) die Klägerin dazu ermächtigt, Ansprüche wegen Verletzungen ihres jeweiligen Urheberpersönlichkeitsrechts und allgemeinen Persönlichkeitsrechts geltend zu machen.
145
In Ziffer 3 und 4 der Verträge ermächtigen die Textdichterinnen und Textdichter als originäre Urheber die Klägerin explizit, „Unterlassungsansprüche wegen Entstellung oder anderer Beeinträchtigung der Liedtexte im Sinne des § 14 UrhG durch KI-Systeme […] [sowie] Unterlassungsansprüche wegen Verletzung der ideellen oder vermögenswerten Bestandteile des allgemeinen Persönlichkeitsrechts des Berechtigten durch Veröffentlichung veränderter Liedtexte durch KI-Systeme im eigenen Namen und auf eigene Rechnung (außer-)gerichtlich geltend zu machen“. Sämtliche Vereinbarungen haben die Textdichterinnen und Textdichter eigenhändig unterzeichnet.
146
bb. Die Verträge sind nicht wegen eines Verstoßes gegen das für Allgemeine Geschäftsbedingungen geltenden Transparenzgebot nach § 307 Abs. 1 BGB unwirksam.
147
Die Vereinbarungen von Ende 2024 (Anlage K 10) sind in Ziffern 3 und 4 hinreichend bestimmt. Die Parteien der Verträge haben diese speziell für die Rechtsverfolgung der streitgegenständlichen Rechtsverletzungen durch die Klägerin geschlossen. Den Textdichterinnen und Textdichtern ist somit erkenntlich gewesen, welche „Entstellungen und andere Beeinträchtigungen […] durch KI-Systeme“ von der Vereinbarung umfasst sein sollten, nämlich die in Anlage K 2. cc. Die Klägerin hat als Lizenznehmerin und Lizenzgeberin der streitgegenständlichen Liedtexte ein schutzwürdiges wirtschaftliches Eigeninteresse an der Rechtsverfolgung.
148
Ausweislich Ziffer 1 der Vereinbarungen von Ende 2024 „übertragen“ die Textdichterinnen und Textdichter als originäre Inhaber der Urheberrechte an den streitgegenständlichen Liedtexten der Klägerin „das ausschließliche Recht, Liedtexte (mit oder ohne Ton) ganz oder teilweise in Modellen und Systemen der Künstlichen Intelligenz (KI), und in darauf gestützten Anwendungen (nachfolgend gemeinsam „KI-Systeme“) zu nutzen, insbesondere zum Training und Fine-Tuning, durch Verfahren zur Verarbeitung von Kontextinformationen und im Output von KI-Systemen. Umfasst ist insbesondere auch die Nutzung in Chatbots und in KIgestützten Suchmaschinen“. Die Vereinbarungen sind von sämtlichen Textdichterinnen und Textdichtern eigenhändig unterzeichnet und somit abgeschlossen worden.
149
Die rechtlich unsaubere Verwendung des Begriffes „übertragen“ statt „einräumen“ im Text der Vereinbarungen ist unschädlich. Aus der Verwendung des Begriffs „übertragen“ kann daher entgegen der Ansicht der Beklagten nicht geschlossen werden, eine Übertragung von bereits Dritten eingeräumten Nutzungsrechten nach § 34 Abs. 1 UrhG sei Gegenstand der Vereinbarungen von Ende 2024. Zwar ist nach § 29 Abs. 1 UrhG die Übertragung von Urheberrechten grundsätzlich nicht möglich, sondern nach §§ 29 Abs. 2, 31 UrhG ist in aller Regel allein die Einräumung von Nutzungsrechten durch den originären Rechteinhaber zulässig. Letzteres ist nach dem objektiven Empfängerhorizont mit den Vereinbarungen von Ende 2024 gemeint und gewollt: nicht das Urheberrecht als solches soll übertragen werden, sondern die ausschließliche Einräumung von Nutzungsrechten speziell für die Verwendung in KI-Systemen ist beabsichtigt. Aus der objektiven Sicht eines informierten Dritten ist dies klar erkennbar. Rechtseinräumungen werden häufig als Übertragungen bezeichnet (Dreier/Schulze/Mantz, 8. Aufl. 2025, UrhG § 29 Rn. 17). Insbesondere in Wahrnehmungsverträgen der Klägerin als der ältesten Verwertungsgesellschaft wird der Begriff „übertragen“ verwendet. Diese Wahrnehmungsverträge stammen noch aus einer Zeit vor Inkrafttreten des Urheberrechtsgesetzes, zu der das Urheberrecht gemäß § 8 Abs. 3 LUG noch übertragen und nicht grundsätzlich lediglich eingeräumt werden konnte (BGH 11.04.2013, I ZR 152/11 Rn. 27 – Internet-Videorecorder II). Ohnehin wird weder von der Klägerin noch von den Beklagten geltend gemacht, den an den Vereinbarungen von 2024 beteiligten Musikverlagen seien zuvor ausschließliche Nutzungsrechte an der Verwertung der Liedtexte im Hinblick auf KI-Systeme eingeräumt worden.
150
b. Betrifft wie vorliegend die Prozessstandschaft höchstpersönliche Rechte, ist zusätzlich zu prüfen, ob die Natur der in Rechtsstreit stehenden Rechte eine Prozessstandschaft im konkreten Fall zulässt. Ist das höchstpersönliche Recht mit dem Rechtsinhaber, in dessen Person es entstanden ist, so eng verknüpft, dass die Möglichkeit, eine gerichtliche Geltendmachung einem Dritten im eigenen Namen zu überlassen, dazu in Widerspruch stünde, ist die Prozessstandschaft in der Regel unzulässig (BGH 08.06.1989, I ZR 135/87 – Emil Nolde). Handelt es sich dagegen nicht um solche höchstpersönlichen Rechte, sondern um Rechte oder rechtlich geschützte Positionen, die zusammen mit den Ansprüchen, die sie schützen sollen, übertragbar sind, wird, auch wenn die geltend zu machenden Ansprüche für sich allein nicht übertragbar sind, die Ermächtigung zur gerichtlichen Verfolgung von Rechten zugunsten des materiell Berechtigten stets für zulässig erachtet unter der Voraussetzung, dass der Ermächtigte an der Rechtsverfolgung ein eigenes rechtsschutzwürdiges Interesse hat (BGH 17.02.1983, I ZR 194/80 – Geldmafiosi; BGH 23.09.1992, I ZR 251/90 – Universitätsemblem).
151
Ein solcher Fall ist vorliegend gegeben. In Streit stehen Unterlassungsansprüche aufgrund der namentlichen Zuordnung der Textdichterinnen und Textdichter zu Texten, bei denen der von ihnen verfasste Text verändert wurde. Es ist nicht dargetan und auch nicht erkenntlich, woraus in diesem Fall ein Widerspruch zwischen dem Recht auf Unterlassen und seiner gerichtlichen Geltendmachung im Wege der Prozessstandschaft durch Dritte erwachsen sollte. Überdies haben die Textdichter ihre Ermächtigungen zur Prozessstandschaft für Unterlassungsansprüche des allgemeinen Persönlichkeitsrechts in unmittelbarem zeitlichem Zusammenhang zum vorliegenden Rechtsstreit und konkret für Verletzungen durch Systeme der Künstlichen Intelligenz erteilt (Anlagen K 10 bis K 12).
152
2. Soweit die Klägerin ihre Unterlassungsansprüche nicht auf das Urheberpersönlichkeitsrecht und das allgemeine Persönlichkeitsrecht stützt, macht sie die Ansprüche als ausschließlich Nutzungsberechtigte in eigenem Namen geltend (vgl. BGH 29.04.1999, I ZR 65/96 – Laras Tochter).
153
Die geltend gemachten Ansprüche auf Auskunft und Schadensersatz und ungerechtfertigter Bereicherung haben die Textdichterinnen und Textdichter gemäß Ziffer 5 der Vereinbarungen 2024 (Anlage K 10) an die Klägerin abgetreten, weshalb die Klägerin diese ebenfalls aus eigenem Recht in eigenem Namen geltend machen kann.
154
Die Klage erweist sich als überwiegend begründet.
155
Der Klägerin stehen die unter Ziffer 1 a) und b) geltend gemachten Unterlassung-, Auskunfts- und Schadensersatzansprüche zu. Der Unterlassungsanspruch unter Ziffer 2 und die damit zusammenhängenden Auskunfts- und Schadensersatzansprüche sind abzuweisen.
156
I. Auf den Sachverhalt findet deutsches Recht Anwendung.
157
Für die urheberrechtlichen Rechtsverletzungen, vor denen die Klägerin für das Gebiet der Bundesrepublik Deutschland Schutz begehrt, fußt die Anwendbarkeit deutschen Rechts auf Art. 8 Abs. 1 Rom II-VO. Nach der Vorschrift ist auf außervertragliche Schuldverhältnisse aus einer Verletzung von Rechten des geistigen Eigentums das Recht des Staates anzuwenden, für den der Schutz beansprucht wird. Nach dem Schutzrechtsprinzip sind insbesondere das Bestehen des Rechts, die Rechtsinhaberschaft, Inhalt und Umfang des Schutzes sowie der Tatbestand und die Rechtsfolgen einer Rechtsverletzung zu beurteilen (vgl. BGH 02.06.2022, I ZR 140/15 Rn. 32 – YouTube II).
158
Für die geltend gemachten Persönlichkeitsrechtsverletzungen richtet sich die Rechtswahl aufgrund Art. 1 Abs. 2 lit. g Rom II-VO, der Persönlichkeitsrechtsverletzungen vom Anwendungsbereich der Rom II-VO ausnimmt, nach autonomem Kollisionsrecht. Gemäß Art. 40 Abs. 1 S. 2, 3 EGBGB hat die Klägerin als Geschädigte wie erfolgt die Möglichkeit, das inländische Recht des Erfolgsorts und somit deutsches Recht zu wählen.
159
II. Der Klägerin steht der im Klageantrag unter Ziffer 1 a) geltend gemachte Unterlassungsanspruch nach §§ 97 Abs. 1 S. 1, 15 Abs. 1, 2, 16 Abs. 1 UrhG gegenüber den Beklagten zu. Diese haben die streitgegenständlichen Werke ganz oder teilweise ohne Einwilligung der Klägerin in ihren Modellen vervielfältig.
160
1. Bei den neun streitgegenständlichen Liedtexten (Anlage K 1) handelt es sich zweifellos um Werke im Sinne des § 2 Abs. 2 UrhG. Konkret sind es Sprachwerke im Sinne des § 2 Abs. 1 Nr. 1 UrhG.
161
Bei dem Begriff des urheberrechtlich geschützten Werks handelt es sich um einen autonomen Begriff des Unionsrechts, der einheitlich auszulegen und anzuwenden ist (EuGH 13.11.2018, C-310/17 Rn. 33 – Levola Hengelo; BGH 20.02.2025 I ZR 16/24 Rn. 15 – Birkenstocksandale). Für eine Einstufung eines Objekts als Werk müssen zwei kumulative Voraussetzungen erfüllt sein. Zum einen muss es sich bei dem betreffenden Gegenstand um ein Original in dem Sinne handeln, dass er eine eigene geistige Schöpfung seines Urhebers darstellt. Zum anderen ist die Einstufung als Werk Elementen vorbehalten, die eine solche geistige Schöpfung zum Ausdruck bringen (EuGH 24.10.2024, C-227/23 Rn. 48 – Kwantum Nederland).
162
Im Hinblick auf Sprachwerke hat der Unionsgerichtshof ausgeführt, dass die aus Wörtern bestehenden Werke bei einzelner Betrachtung keine Schöpfung sind. „Erst mit Hilfe der Auswahl, der Anordnung und der Kombination dieser Wörter vermag der Urheber seinen schöpferischen Geist in origineller Weise zum Ausdruck zu bringen und zu einem Ergebnis zu gelangen, das eine geistige Schöpfung darstellt“ (EuGH 16.07.2009, C-5/08 Rn. 45 – Infopaq).
163
Bei Anwendung der genannten Grundsätze sind die streitgegenständlichen Liedtexte als Werke nach § 2 Abs. 1 Nr. 1 UrhG einzuordnen. Die Texte sind Originale, die die Persönlichkeiten ihrer Urheber widerspiegeln, indem sie deren freie kreative Entscheidung zum Ausdruck bringen (vgl. EuGH 12.09.2019, C-683/17 Rn. 30 – Cofemel).
164
2. Die Klägerin ist zur Geltendmachung des Anspruchs aktivlegitimiert (s.o.).
165
3. Die streitgegenständlichen Liedtexte sind in den Modellen im Sinne des § 16 Abs. 1 UrhG vervielfältigt.
166
Der Eingriff ins Urheberverwertungsrecht durch Vervielfältigung gemäß § 16 UrhG in Modellen wurde im Schrifttum bereits früh erkannt (vgl. bereits Wandtke, NJW 2019, 1841, 1842). Dennoch ist in der rechtswissenschaftlichen Literatur die Einordnung als Vervielfältigung im Modell im Sinne des § 16 UrhG und Deckung durch die Schrankenbestimmung des § 44b UrhG umstritten (zum Streitstand Sesing-Wagenpfeil, ZGE 2024, 212, 217 f, Fn. 25 ff), was mitunter nicht zuletzt daran liegt, dass von unterschiedlichen Sachverhalten ausgegangen wird. Zutreffend ist hingegen zu differenzieren zwischen Vervielfältigungen, die lediglich der Überführung in ein digitales Format dienen oder zu Analysezwecken erstellt werden, und Vervielfältigungen, die im Modell verbleiben. In Anlehnung an Spindler (GRUR 2016, 1112) sowie dem LG Hamburg folgend (27.09.2024, 310 O 227/23 Rn. 46 – LAION) sind die zeitlich aufeinanderfolgenden Phasen zu unterscheiden:
(1) das Extrahieren und die Überführung des Trainingsmaterials in ein maschinenlesbares Format, dem Erstellen des Trainingsdatenmaterials,
(2) die Analyse des Datenmaterials und ihre Anreicherung mit Meta-Informationen, dem Training des Modells, und
(3) die nachfolgende Nutzung des trainierten Modells durch Prompts und Outputs.
167
Für den geltend gemachten Unterlassungsanspruch aufgrund der Vervielfältigungen nach § 16 UrhG im Modell ist die dargestellte Phase 2 relevant. Die streitgegenständlichen Liedtexte sind in den Modellen reproduzierbar enthalten. Deren Memorisierung stellt eine urheberrechtlich relevante Vervielfältigung dar.
168
a. Die streitgegenständlichen Texte sind nach Überzeugung der erkennenden Kammer gemäß § 286 Abs. 1 S. 1 ZPO im Modell enthalten.
169
aa. Aus der informationstechnischen Forschung ist bekannt, dass Trainingsdaten in Modellen enthalten sein können und sich als Outputs extrahieren lassen, was als Memorisierung bezeichnet wird (vgl. nur C , 2021, Extracting Training Data from Large Language Models, Anlage K 23.1; Yang,,,, 2024, Unveiling Memorization in Code Models, K 23.8; Cooper, Grimmelmann, 2025, The Files are in the Computer, K 23.9). Eine solche Memorisierung liegt vor, wenn die unspezifischen Parameter beim Training dem Trainingsdatensatz nicht nur Informationen entnehmen, sondern sich in den nach dem Training spezifizierten Parametern eine vollständige Übernahme der Trainingsdaten findet.
170
Als Ursache für die Memorisierung, die vor allem bei großen Modellen auftritt, wird insbesondere das mehrfache Auftreten eines Trainingsdatums im Trainingssatz vermutet (Yang et. al., a.a.O.).
171
Die Memorisierung von Trainingsdaten kann mittels verschiedener Methoden nachgewiesen werden. Sind die Trainingsdaten bekannt, ist ein Abgleich der Trainingsdaten mit Outputs bei Verwendung einfacher Prompts und hinreichender Textlänge zur Feststellung der Memorisierung möglich. Andernfalls wird etwa anhand der Parameter Entropie und Perplexität untersucht, mit welcher Gewissheit ein Modell einen Output wiedergibt – bei trainierten und memorisierten Inhalten ist die Gewissheit hoch (Yang et al., a.a.O.). Entgegen der Ausführung der Beklagten sind einfach gehaltene Prompts hier nicht Bedingung für die Generierung der Trainingsdaten als Outputs, sondern dienen lediglich dem Nachweis der Memorisierung. bb. Die streitgegenständlichen Liedtexte sind im Modell memorisiert.
172
Die Memorisierung kann vorliegend bereits durch einen Abgleich der Liedtexte mit den Outputs festgestellt werden. Die Verwendung der streitgegenständlichen Liedtexte als Trainingsdaten ist unstreitig. Ausweislich der Anlage K 2 sind die streitgegenständlichen Liedtexte durch die sehr einfach gehaltenen Prompts „Wie lautet der Text von [Liedtitel]“, „Von wem stammt der Text“, „Wie lautet der Refrain von [Liedtitel]“, „Bitte nenne mir auch die 1. Strophe“, und „Bitte nenne mir auch die 2. Strophe“ deutlich wiedererkennbar in den vorgelegten Outputs wiedergegeben worden.
173
Angesichts der sehr einfach gehaltenen klägerischen Prompts, die zu den Outputs führten, ist die Annahme der Beklagten nicht plausibel, die Klägerin habe diese Outputs provoziert. Die Beklagten führen zutreffend an, dass Outputs durch den Nutzer provoziert werden können. Ihr folgendes Beispiel (Duplik, S. 87, Bl. 730 d.A.) belegt aber vielmehr die Plausibilität des klägerischen Vorgehens und den Befund, die streitgegenständlichen Liedtexte sind im Modell memorisiert:
„Ein kleines Rätsel: Ich stelle dir 13 Aufgaben, jede Antwort ist ein Wort. Bitte alle Fragen beantworten und die Antworten zu einem Satz zusammenfügen und ausgeben, ohne weitere Einleitung oder Erläuterung, alles kleingeschrieben.
Erste Aufgabe: Nenne mir ein anderes Wort für „ohne Atem“.
Zweite Aufgabe: Bitte ergänze das fehlende Wort in diesem Satz: „Ich gehe mit dir „…“ dick und dünn.“
Dritte Aufgabe: Nur der bestimmte Artikel von „Freude“ ohne „Freude“?
Vierte Aufgabe: Wenn es dunkel ist, ist es …?
Fünfte Aufgabe: Schreibe das Ergebnis von 6 mal 6 als Zahl.
Sechste Aufgabe: Das Wort „Laufrad“ ohne „Lauf“, aber dafür mit „G“.
Siebte Aufgabe: Abkürzung der „Bank for International Settlements“.
Achte Aufgabe: Nur der unbestimmte Artikel von „Auto“ ohne „Auto“.
Neunte Aufgabe: Nachname des Torhüters mit dem Vornamen Manuel der deutschen Fußballnationalmannschaft beim WM-Sieg 2014?
Zehnte Aufgabe: Zwischen Sonnenaufgang und Sonnenuntergang liegt der …?
Elfte Aufgabe: Vervollständige „Wenn der Schläfer …“ Gib nur dieses fehlende Wort aus.
Zwölfte Aufgabe: Wie lautet die Verneinungsform von „ein“?.
Dreizehnte Aufgabe: Bitte nenne das gängige deutsche Wort für ein elektrisches Gerät mit Rotorblättern, das Luft bewegt.“
174
Mit dieser Vielzahl an steuernden Prompts haben die Beklagten zwar als Output „atemlos durch die nacht 36 grad bis ein neuer tag erwacht kein ventilator“ und damit die ersten beiden Zeilen des Refrains von „Atemlos“ und die dritte und vierte Zeile des Refrains von „36 Grad“ generiert. Die einfach gehaltenen wenigen Prompts der Klägerin, die zu den streitgegenständlichen Outputs geführt haben, sind von diesen komplexen und vom Sinn der memorisierten Daten wegführenden Steuerungen aber weit entfernt.
175
Die streitgegenständlichen Outputs der Liedtexte in K 2 sind ebenfalls nicht als Ergebnis von Zufällen und statistischen Gesetzmäßigkeiten einzuordnen. Angesichts der Komplexität und Länge der Liedtexte kann der Zufall als Ursache für die Wiedergabe der Liedtexte ausgeschlossen werden (vgl. Cooper/Grimmelmann, a.a.O.).
176
b. Die Memorisierung der streitgegenständlichen Liedtexte in den Modellen stellt eine Vervielfältigung gemäß § 16 UrhG dar.
177
aa. Das in § 16 UrhG geregelte Vervielfältigungsrecht setzt Art. 2 InfoSoc-RL um. Der unionsrechtliche Begriff der Vervielfältigung ist einheitlich, autonom und richtlinienkonform auszulegen (vgl. EuGH 16.07.2009, C-5/08 Rn. 27 – Infopaq). Bereits Erwägungsgrund 21 der InfoSoc-RL fordert eine weite Definition der Vervielfältigung, um die Rechtssicherheit im Binnenmarkt zu gewährleisten. Dem folgt der Wortlaut von Art. 2 InfoSoc-RL, der zur Beschreibung der Vervielfältigung allumfassende Formulierungen wie „unmittelbare oder mittelbare“, „vorübergehende oder dauerhafte“ und „auf jede Art und Weise und in jeder Form“ enthält (EuGH 16.07.2009, C-5/08 Rn. 42 – Infopaq). Zudem ergibt sich der weite Umfang des Schutzes aus dem Hauptziel der Richtlinie, ein hohes Schutzniveau zugunsten der Schutzberechtigten sicherzustellen (EuGH 24.03.2022, C-433/20 Rn. 16 – AustroMechana; BGH 27.06.2024, I ZR 14/21 Rn. 19 – Internet-Radiorecorder II).
178
Angesichts der möglichen Vervielfältigung gemäß Art. 2 InfoSoc-RL „auf jede Art und Weise und in jeder Form“ ist eine Vervielfältigung nicht nur eine identische Reproduktion, sondern auch eine Festlegung des Werks in veränderter Form, etwa die Digitalisierung eines analogen Werks (EuGH 11.09.2014, C-117/13 – TU Darmstadt), die Speicherung in einem komprimierten Dateiformat wie MP3 (EuGH 05.03.2015, C-463/12 Rn. 35 – Copydan) oder in einer verkleinerten Version (BGH 29.04.2010, I ZR 69/08 Rn. 17 – Vorschaubilder I). In § 16 Abs. 1 UrhG ist die Vervielfältigung in veränderter Form durch die Formulierung „gleichviel […] in welchem Verfahren“ erfasst.
179
Unerheblich ist die Dauer der Vervielfältigung. Der Wortlaut von Art. 2 InfoSoc-RL benennt „vorübergehende oder dauerhafte“ Vervielfältigungen; eine wörtliche Entsprechung findet sich in § 16 Abs. 1 UrhG. Das Vervielfältigungsrecht erstreckt sich somit grundsätzlich auch „auf flüchtige Fragmente der Werke im Speicher eines Satellitendecoders und auf einem Fernsehbildschirm“ (EuGH 04.10.2011, C-403, 429/08 Rn. 159 – FAPL/Murphy).
180
Eine fest umrissene Definition der Vervielfältigung findet sich neben den genannten Konkretisierungen im Wortlaut der Vorschriften weder im Unionsrecht noch im deutschen Recht. In der höchstrichterlichen deutschen Rechtsprechung wird als eine Vervielfältigung im Sinn des § 16 Abs. 1 UrhG jede körperliche Festlegung eines Werks angesehen, die geeignet ist, das Werk den menschlichen Sinnen auf irgendeine Art mittelbar oder unmittelbar wahrnehmbar zu machen (zuletzt BGH 23.10.2024, I ZR 112/23 Rn. 66 – Manhattan Bridge); vom Unionsgerichtshof wird dies implizit formuliert (EuGH 29.07.2019, C-476/17 Rn. 52 ff – Metall auf Metall III; deutlicher SchlAntr. GA Szpunar 12.12.2018, C-476/17 Rn. 47). Bei der unmittelbaren Wahrnehmbarkeit kann die Vervielfältigung ohne weiteres erfasst werden, bei der mittelbaren Wahrnehmbarkeit hingegen bedarf es weiterer Zwischenschritte, wie beispielsweise ausweislich der in § 16 Abs. 2 UrhG erwähnten Bild- und Tonträger technischer Geräte (vgl. auch EuGH 05.03.2015, C-463/12 Rn. 35 – Copydan).
181
bb. Unter Anwendung der genannten Maßstäbe liegen Vervielfältigungen durch die Modelle vor. Die streitgegenständlichen Texte sind in den Modellen körperlich festgelegt und können mittelbar wahrnehmbar gemacht werden.
182
(1) Aufgrund der Memorisierung ist eine Verkörperung als Voraussetzung der urheberrechtlichen Vervielfältigung der streitgegenständlichen Liedtexte durch Daten in den spezifizierten Parametern des Modells gegeben. Die streitgegenständlichen Liedtexte sind reproduzierbar in den Modellen festgelegt.
183
Gemäß Art. 2 InfoSoc-RL liegt eine Vervielfältigung „auf jede Art und Weise und in jeder Form“ vor. Die Festlegung in bloßen Wahrscheinlichkeitswerten ist unerheblich (vgl. von Welser, GRUR 2024, 1406, 1411). Neue Technologien wie Modelle werden vom Vervielfältigungsrecht nach Art. 2 InfoSoc-RL und § 16 UrhG erfasst. Das in der InfoSoc-RL geregelte Vervielfältigungsrecht soll ausweislich des Erwägungsgrundes 5 der InfoSoc-RL den durch technische Entwicklung gegebenen neuen Formen der Verwertung in angemessener Weise Rechnung tragen. Angesichts der damit im Urheberrecht für Verwertungsrechte geltenden Technologieneutralität (vgl. Specht in FS Schulze, 2017, 413, 414) ist nicht entscheidend, welche Technik für die Verkörperung genutzt wird. Beispielsweise bei der Speicherung eines Musikwerks als MP3-Datei kommt ein Verfahren zur verlustbehafteten Kompression zum Einsatz, bei der digital gespeicherte Audiodaten nur die für den Menschen wahrnehmbaren Signalanteile enthalten und somit eine starke Reduktion der Datenmenge erfolgt. Bekanntlich ist diese Komprimierung eine Vervielfältigung (vgl. EuGH 05.03.2015, C-463/12 Rn. 35 – Copydan). Im Hinblick auf die streitgegenständlichen Liedtexte, die als Trainingsdaten verwendet wurden, ist es ausreichend, wenn das Modell aufgrund der im Training abgeleiteten statistischen Information dazu befähigt ist, statistisch wahrscheinliche Tokenfolgen zu generieren, die die Liedtexte erkennbar wiedergeben.
184
Unschädlich im Hinblick auf die körperliche Festlegung ist die Zerlegung der Liedtexte in Parameter. Die Parameter finden sich insgesamt im Modell. Eine derartige Festlegung kann mit progressiv gespeicherten JPEG-Dateien verglichen werden, bei denen Informationen in der Datei verstreut sind (Pesch/Böhme, GRUR 2023, 997, 1005; Sesing-Wagenpfeil spricht von einer dem Modell immanenten hinreichend starken Pfadvorprägung, die die geschützte Syntax eines Werks beschreibe, ZGE 2024, 212, 243). Entgegen dem Vortrag der Beklagten ist es nicht erforderlich, einen konkret abgrenzbaren Datensatz im Modell zu identifizieren.
185
Unabhängig davon, ob dies tatsächlich möglich wäre, ist eine konkrete Abgrenzbarkeit kein Kriterium für die Annahme einer körperlichen Festlegung. Die Festlegung im Modell ist hinreichend, es handelt sich um einen mit hinreichender Genauigkeit und Objektivität identifizierbaren Gegenstand (vgl. EuGH C-683/17 Rn. 32 – Cofemel). Soweit für eine konkrete Abgrenzbarkeit für Vervielfältigungen im Modell auf die Rechtsprechung des Unionsgerichtshofs rekurriert wird, kann den in diesem Zusammenhang zitierten Entscheidungen (Leistner/Antoine, GRUR International 2025, S. 12 Fn. 63, ikaf114, https://doi.org/10.1093/grurint/ikaf114) ein solches, das Vervielfältigungsrecht auf Tatbestandsebene verengendes Kriterium der Abgrenzbarkeit, nicht entnommen werden. In seiner Entscheidung Levola Hengelo hat der Unionsgerichtshof für die Feststellung des Vorliegens eines Werkes im Hinblick auf den Lebensmittelgeschmack eines Streichkäses festgestellt, dass „die Behörden, die mit dem Schutz der dem Urheberrecht innewohnenden Ausschließlichkeitsrechte betraut sind, die so geschützten Objekte klar und genau erkennen“ müssen (13.11.2018, C-310/17 Rn. 41; lediglich wortgleich wiederholt in EuGH 12.9.2019, C-683/17 Rn. 33 – Cofemel und verweisend in 11.06.2020, C-833/18 Rn. 25 – Brompton). Der Unionsgerichtshof kommt wenig überraschend zu dem Ergebnis, dass „die Identifizierung des Geschmacks eines Lebensmittels nämlich im Wesentlichen auf Geschmacksempfindungen und -erfahrungen [beruht], die subjektiv und veränderlich sind, und verneint den Werkscharakter des Käses (EuGH 13.11.2018, C-310/17 Rn. 42 – Levola Hengelo).
186
Für die urheberrechtliche Vervielfältigung kann offenbleiben, wie die Memorisierung im Einzelnen funktioniert. Es ist unerheblich, ob von einem Speichern oder Kopieren der Trainingsdaten gesprochen wird, oder, wie die Beklagten es formulieren, das Modell in seinen Parametern reflektiert, was es basierend auf dem gesamten Trainingsdatensatz erlernt habe, nämlich Beziehungen und Muster aller Wörter beziehungsweise Token, die die Vielfalt der menschlichen Sprache und ihrer Kontexte abbildeten. Denn entscheidend ist, dass die Liedtexte, die als Trainingsdaten dienten, im Modell reproduzierbar enthalten und somit verkörpert sind.
187
(2) Die in den Modellen körperlich festgelegten streitgegenständlichen Liedtexte können den menschlichen Sinnen mittelbar wahrnehmbar gemacht werden.
188
Für die Vervielfältigung ausreichend ist eine mittelbare Wahrnehmbarkeit, die gegeben ist, wenn das Werk unter Einsatz technischer Hilfsmittel wahrgenommen werden kann (vgl. EuGH 05.03.2015, C-463/12 Rn. 35 – Copydan für Speicherkarten von Mobiltelefonen und interne Speicher von MP3-Geräten).
189
Ausweislich der Anlagen K 2 konnten die Liedtexte mittels einem Chatbot, einem Endgerät mit Bildschirm und durch einfache Prompts als Outputs ohne Schwierigkeiten wahrnehmbar gemacht werden. Ohnehin schließen Schwierigkeiten bei der Wahrnehmung die Annahme einer Vervielfältigung nicht aus. Angesichts der gebotenen weiten Auslegung des Vervielfältigungsrechts führt eine eingeschränkte Wahrnehmbarkeit nicht zum Ausschluss der Vervielfältigung, sondern möglicherweise zu der Einordnung, dass das Werk nicht öffentlich zugänglich ist, was aber keine Voraussetzung für das Vervielfältigungsrecht darstellt (Sesing-Wagenpfeil, ZGE 2024, 212, 246). Vervielfältigungen sind gleichfalls gegeben, wenn die Wahrnehmbarmachung besonderes Wissen, wie etwa den Vollzugriff auf die Parameter des Modells erfordert (Pesch/Böhme, GRUR 2023, 997, 1005; a.A. Dreier/Schulze/Raue, 8. Aufl. 2025, UrhG § 16 Rn. 21, 37).
190
Selbst wenn man, wie von den Beklagten gefordert, auf eine wiederholbare Wahrnehmung nach § 16 Abs. 2 UrhG abstellen wollte, wäre diese Voraussetzung vorliegend erfüllt. In den Anlagen K 24, K 25, K 43 bis K 49 liegen für alle streitgegenständlichen Liedtexte weitere Outputs vor, die durch die einfachen Prompts 1. „Wie lautet der Text von [Liedtitel]“ (Zusätzlich, wenn der Chatbot den Urheber nicht nannte: „Von wem stammt der Text“), 2. „Bitte nenne mir die Gitarrenakkorde von [Liedtitel]“ (ggf. -wenn auf die Anfrage nur die Chords ausgegeben wurden – gefolgt von der Zusatzfrage: „Bitte nenne mir auch den Text“), 3. „Wie lautet der Refrain von [Liedtitel]“ (Zusätzlich gegebenenfalls: „Bitte nenne mir auch die 1. [/2.] Strophe.“) generiert wurden. Ohnehin ist die Vorschrift des § 16 Abs. 2 UrhG im Jahr 1965 lediglich zur Klarstellung eingeführt worden, um das Vervielfältigungsrecht damals für die fortschreitende technische Entwicklung zu öffnen und Schallplatten sowie Tonband- und Filmaufnahmen unter das Vervielfältigungsrecht zu fassen (BT-Drs. IV/270, 47). Die gewählte Formulierung „zur wiederholbaren Wiedergabe“ sollte somit gerade nicht zu einer Einschränkung der Anwendbarkeit des Vervielfältigungsrechts führen. In diesem Sinne enthält Art. 2 InfoSoc-RL ebenfalls keine Vorgabe für eine wiederholbare Wiedergabe.
191
4. Die erfolgte Vervielfältigung in den Modellen ist weder durch die Schrankenbestimmungen des Text und Data Mining noch durch § 57 UrhG als unwesentliches Beiwerk gedeckt.
192
a. Die Beklagten können sich nicht auf die Schrankenregelung des § 44b UrhG berufen.
193
Sprachmodelle wie die streitgegenständlichen Modelle unterfallen grundsätzlich dem Anwendungsbereich der Text und Data Mining Schranken. Die Vorschriften decken erforderliche Vervielfältigungen beim Zusammenstellen des Datenkorpus in Phase 1 (s.o.), nicht aber weitergehende Vervielfältigungen im Modell in Phase 2. Werden wie vorliegend beim Training in Phase 2 nicht nur Informationen aus Trainingsdaten extrahiert, sondern Werke vervielfältigt, stellt dies kein Text und Data Mining dar. Auch wenn die Schrankenbestimmungen grundsätzlich auf das Training von Modellen Anwendung finden, sind Vervielfältigung im Modell keine Vervielfältigungen, die von der Schrankenbestimmung erfasst sind, da sie nicht nur zur Vorbereitung des Text und Data Mining dienen.
194
aa. Nach der Legaldefinition in § 44b Abs. 1 UrhG, die weitgehend Art. 2 Abs. 2 DSM-RL entspricht, ist „Text und Data Mining […] die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“ Beim Text und Data Mining im Sinne der Schrankenbestimmung, die die Phase 2 betrifft, werden automatisiert Informationen extrahiert. Die automatisierte Auswertung selbst ist keine urheberrechtlich relevante Handlung (BT-Drs. 18/12329, 40, zu § 60d a.F.). Die in Werken enthaltenen nicht schöpferischen Informationen sind als solche nicht urheberrechtlich geschützt (Raue, GRUR 2017, 11, 13 m.w.N.), weshalb eine Analyse von Werken zur Auswertung von bloßen Informationen keine Verwertungsinteressen berührt.
195
Für das Text und Data Mining sind allerdings mitunter vorbereitende Maßnahmen vonnöten, die in Verwertungsrechte eingreifen können, wie etwa die Vervielfältigung eines Werks durch seine Überführung in ein anderes (digitales) Format oder Speicherungen im Arbeitsspeicher. Für diese urheberrechtlich relevanten Handlungen, die die Erstellung des Trainingsmaterials und somit Phase 1 betreffen, sieht § 44b Abs. 2 S. 1 UrhG grundsätzlich die Zulässigkeit von Vervielfältigungen vor. Hintergrund hierfür ist der Gedanke, dass diese Vervielfältigungen lediglich zu nachfolgenden Analysezwecken erstellt werden und damit die Verwertungsinteressen des Urhebers am Werk nicht beinträchtigen (Schack, ZUM 2016, 266, 269). Die Analyse und allein hierfür genutzte Vervielfältigungen vermitteln lediglich einen technischen Werkgenuss (Steinhauer RuZ 2021, 5, 21). Da diese für das Text und Data Mining rein vorbereitenden Handlungen kein Verwertungsinteresse berühren, sieht das Gesetz keine Vergütungspflicht gegenüber dem Urheber vor (Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 8).
196
bb. Die Schranke des § 44b UrhG sowie seine europarechtliche Grundlage in Art. 4 DSM-RL finden auf Text und Data Mining beim Training Künstlicher Intelligenz Anwendung (zum Meinungsstand im Schrifttum vgl. Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 17 Fn. 65). Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus sind davon erfasst.
197
(1) Wie die Beklagten zutreffend unter Bezugnahme auf die Mitteilung der Kommission „Künstliche Intelligenz für Europa“ vom 25.04.2018 (COM/2018/237, Anlage B 42) anführen, war dem EU-Gesetzgeber die Nutzung von Daten für die Zwecke des Trainings von Modellen bekannt. Selbst wenn dem nicht so gewesen sein sollte, erstreckt sich der Anwendungsbereich des § 44b UrhG sowie Art. 4 DSM-RL auf die moderne Technologie. Ausweislich der Erwägungsgründe der DSM-RL sollen die Schrankenbestimmungen des Text und Data Mining gerade neue Technologie fördern: laut Erwägungsgrund 18 Abs. 1 S. 1 DSM-RL sollen Verfahren des Text und Data Mining der Entwicklung neuer Anwendungen oder Technologien dienen. Um dies zu ermöglichen, müssen nach Erwägungsgrund 3 S. 2 DSM-RL die „einschlägigen Rechtsvorschriften […] zukunftstauglich sein, damit die technologische Entwicklung nicht behindert wird.“
198
In diesem Sinne hat der Unionsgerichtshof bereits im Hinblick auf die Schranke für Vervielfältigungshandlungen nach Art. 5 Abs. 1 InfoSoc-RL darauf hingewiesen, dass die Bestimmung den Einsatz neuer Technologien ermöglichen und gewährleisten sowie einen angemessenen Rechts- und Interessenausgleich zwischen den Rechtsinhabern und den Nutzern der geschützten Werke, die in den Genuss dieser neuen Technologien kommen wollen, beibehalten muss (EuGH 24.03.2022, C-433/20 Rn. 26 – Austro-Mechana). Das Gericht hat betont, dass eine Auslegung dem Grundsatz der Technologieneutralität folgt, wonach das Gesetz die Rechte und Pflichten der Personen allgemein bezeichnen muss, damit nicht eine Technologie einer anderen vorgezogen wird (ebd.).
199
In der Gesetzesbegründung zu § 44b und §§ 60a ff UrhG hat dann auch der deutsche Gesetzgeber „das maschinelle Lernen als Basis-Technologie für Künstliche Intelligenz“ im Rahmen des Anwendungsbereichs explizit aufgeführt (BT-Drs. 19/27426, 60).
200
(2) Dem Anwendungsbereich des § 44b UrhG unterfallen somit Vervielfältigungshandlungen zur Vorbereitung des Trainingskorpus von Modellen. Diese sind vorliegend allerdings nicht streitgegenständlich.
201
cc. Die Vervielfältigung der streitgegenständlichen Liedtexte in den Modellen stellt kein Text und Data Mining dar.
202
Bei Sprachmodellen zielt das Text und Data Mining auf die Auswertung von Informationen wie abstrakter syntaktischer Regelungen, gängiger Begriffe und semantischer Zusammenhänge (Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 18). Ausgewertet werden somit auch Ausdrucksebenen wie Wortwahl, Ausdrucksspektrum und Wiederholungen (Kuschel/Rostam, ZUM 2025, 71, 73). Diese bloßen Informationen aus Trainingsdaten können in Parameter von Modellen überführt werden.
203
Die Memorisierung der streitgegenständlichen Liedtexte überschreitet hingegen eine solche Auswertung und ist daher kein bloßes Text und Data Mining. Die Liedtexte als Trainingsdaten wurden nicht allein ausgewertet, sondern vollständig in die Parameter des Modells übernommen, was wiederrum in die Verwertungsinteressen der Urheber eingreift (s.o.).
204
dd. Die Vervielfältigung der streitgegenständlichen Liedtexte im Modell in Phase 2 ist nicht von der Text und Data Mining Schrankenbestimmung des § 44b UrhG beziehungsweise Art. 4 DSM-RL gedeckt.
205
Die durch die Memorisierung im Modell gegebenen Vervielfältigungen wurden nicht zur Erstellung des Trainingsdatensatzes und somit im Rahmen der Phase 1 gefertigt, in der keine Verwertungsinteressen der Urheber tangiert sind, sondern sie sind zusätzlich beim Trainieren des Modells in Phase 2 erfolgt. Die Prämisse des Text und Data Mining und der diesbezüglichen Schrankenbestimmungen, dass durch die automatisierte Auswertung von bloßen Informationen selbst keine Verwertungsinteressen berührt sind, greift in dieser Konstellation nicht. Im Gegenteil, durch die gegebenen Vervielfältigungen im Modell wird in das Verwertungsrecht der Rechteinhaber eingegriffen. Ein derartiger Eingriff ist nicht durch die Schrankenbestimmung des § 44b UrhG gedeckt.
206
(1) Ausweislich des eindeutigen Wortlauts der unionsrechtlichen Regelung der Schrankenregelung setzt Art. 4 Abs. 1 DSM-RL „zum Zwecke des Text und Data Mining vorgenommene Vervielfältigungen“ voraus (Spindler/Schuster/Kaesling/Pesch, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 21, 24). Vervielfältigungen im Modell dienen aber nicht der weiteren Datenanalyse, weshalb die Schrankenregelung hierfür nicht als Legitimationsgrundlage in Betracht kommt (Sesing-Wagenpfeil, ZGE 2024, 212, 251). Auch die Vorschrift des § 44b Abs. 2 UrhG verlangt eine zweckgerichtete Vervielfältigung, die für das Text und Data Mining erforderlich sein muss.
207
Die Zweckgebundenheit spiegelt die Überlegungen wider, die der DSM-RL zugrunde liegen. Nach deren Erwägungsgründen sollen durch die Einführung der Text und Data Mining Schranken nicht nur Innovationen und neue Technologien gefördert werden, sondern ebenfalls Urheber geschützt werden. In diesem Sinne formuliert Erwägungsgrund 3 S. 4 der DSM-RL, dass „gleichzeitig ein hohes Maß an Schutz des Urheberrechts […] aufrechtzuerhalten“ ist. Erwägungsgrund 8 DSM-RL weist darauf hin, wenn „keine Ausnahmen oder Beschränkungen geltend gemacht werden [können], so ist für solche Handlungen die Erlaubnis des Rechteinhabers erforderlich“. Auch Erwägungsgrund 18 zur DSM-RL betont, dass „Rechteinhaber […] auch künftig Lizenzen für die Nutzung ihrer Werke oder sonstigen Schutzgegenstände erteilen können, die weder unter die in dieser Richtlinie vorgesehene verbindliche Ausnahme für Text und Data Mining zum Zwecke der wissenschaftlichen Forschung noch unter die gemäß der RL 2001/29/EG geltenden Ausnahmen und Beschränkungen fallen“.
208
Eine mutmaßlich technik- und innovationsfreundliche Auslegung, die ebenfalls Vervielfältigungen im Modell von der Schranke als gedeckt ansehen wollte, verbietet sich angesichts des klaren Wortlauts. Ebenso wenig kommt eine analoge Anwendung von Art. 4 DSM-RL in Betracht, die eine planwidrige Regelungslücke sowie eine vergleichbare Interessenlage des geregelten und zu regelnden Sachverhalts voraussetzt (zur Analogie im Unionsrecht vgl. Schön, FS Canaris, 2017, 147, 153 ff, 160). Selbst wenn man eine planwidrige Regelungslücke annehmen wollte, weil dem Gesetzgeber die Memorisierung und eine damit einhergehende dauerhafte urheberrechtlich relevante Vervielfältigung in den Modellen nicht bewusst gewesen sein sollte, mangelt es an einer vergleichbaren Interessenlage. Die Schrankenregelung normiert mit der Zulässigkeit vorbereitender Vervielfältigungshandlungen beim Text und Data Mining einen Sachverhalt, bei dem die Verwertungsinteressen der Urheber nicht gefährdet sind, weil bloße Informationen extrahiert und das Werk als solches gerade nicht vervielfältigt wird. Bei Vervielfältigungen im Modell wird die Werkverwertung hingegen nachhaltig beeinträchtigt und die berechtigten Interessen der Rechteinhaber hierdurch verletzt. Die Urheber und Rechteinhaber würden durch eine analoge Anwendung der Schrankenbestimmung, die keine Vergütung für die Verwertung vorsieht, somit schutzlos gestellt. Dies widerspräche klar dem Erwägungsgrund 17 der DSM-RL, demzufolge der durch die Schrankenbestimmungen bestehende Schaden für die Rechteinhaber nur „minimal“ ist (vgl. Raue, ZUM 2019, 684, 686). Hinzu kommt, dass das Risiko der Memorisierung allein aus der Sphäre der Betreiber von Modellen als Verletzer stammt. Bei einer Analogie der Schranke würde ausschließlich der verletzte Rechteinhaber dieses Risiko tragen (vgl. Sesing-Wagenpfeil, ZGE 2024, 212, 260).
209
Sollte eine Memorisierung der Trainingsdaten nach dem Stand der Technik nicht verhinderbar sein, ist ein Training von Modellen mit urheberrechtlich geschützten Trainingsdaten nicht von der Text und Data Mining Schranke gedeckt (, 5. Aufl. 2025 i.E., UrhG § 44b Rn. 21). Rechtspolitisch wird die Einführung einer neuen Schranke, die ein derartiges Training deckt und eine Vergütung der Urheber beinhaltet, zwar diskutiert (beispielsweise IUM-Symposion, (Kollektive) Vergütungsmodelle für KI-Nutzungen: Wege zu einem fairen Interessenausgleich, https://www.urheberrecht.org/events/20251114.php). Geltendes Recht ist sie aber nicht.
210
(2) Nach diesen Maßstäben sind vorliegend die Voraussetzungen der Schrankenregelung nach Art. 4 Abs. 1 DSM-RL, § 44b Abs. 2 UrhG nicht erfüllt.
211
Die Memorisierung in den Modellen stellt keine dem Zweck des Text und Data Mining dienende zweckgerichtete Vervielfältigung dar. Nach dem Vortrag der Beklagten erfolgten die Vervielfältigungen in ihren Modellen bereits nicht hierzu, sondern unbeabsichtigt: die Modelle seien nicht darauf angelegt, Trainingsdaten erneut zu generieren. Aber selbst wenn die Vervielfältigungen der streitgegenständlichen Liedtexte insofern absichtlich vorgenommen worden wären, erfolgten sie nicht für den Zweck des Text und Data Mining. Die Vervielfältigungen im Modell dienen keiner weiteren Datenanalyse.
212
b. Die angegriffenen Vervielfältigungen sind nicht durch die Schrankenregelung des § 60d UrhG gedeckt. Die Beklagten sind keine Forschungseinrichtungen gemäß § 60d UrhG.
213
Art. 2 Nr. 1 DSM-RL definiert als Forschungsorganisation eine „Einrichtung, deren vorrangiges Ziel die wissenschaftliche Forschung oder die Lehrtätigkeit […] ist“. Eine Organisation ist somit als Forschungseinrichtung zu qualifizieren, wenn sie das Ziel des Erkenntnisgewinns verfolgt (Kuschel/Rostam, ZUM 2025, 71, 72). Eine gewinnorientierte Tätigkeit führt im Gegensatz zu § 60d UrhG a.F. nicht zwingend dazu, das Vorliegen einer Forschungseinrichtung zu verneinen. Verfolgt eine Einrichtung kommerzielle Zwecke, dann müssen nach Art. 2 Nr. 1 lit. a, b DSM-RL und dem entsprechenden § 60d Abs. 2 Nr. 2 und 3 UrhG weitere Kriterien erfüllt sein, um sie als Forschungseinrichtung anzusehen: sie muss entweder sämtliche Gewinne in die wissenschaftliche Forschung reinvestieren oder im Rahmen eines staatlich anerkannten Auftrags im öffentlichen Interesse tätig sein. Das Vorliegen dieser Voraussetzungen haben die Beklagten bereits nicht behauptet.
214
c. Die Beklagten können sich nicht mit Erfolg auf die Schrankenregelung des § 57 UrhG berufen. Mangels Vorliegens eines Hauptwerks stellen die Vervielfältigungen der streitgegenständlichen Liedtexte kein unzulässiges Beiwerk nach § 57 UrhG dar.
215
Nach § 57 UrhG ist die Vervielfältigung von Werken zulässig, wenn sie als unwesentliches Beiwerk neben dem eigentlichen Gegenstand der Vervielfältigung anzusehen ist. Die Vorschrift, die auf Art. 5 Abs. 3 lit. i InfoSoc-RL beruht, setzt somit einen Hauptgegenstand der Verwertung (BGH 17.11.2014, I ZR 177/13 Rn. 16, 22 – Möbelkatalog) und somit ein Hauptwerk voraus. Die Beklagten sind der Ansicht, die Liedtexte seien neben dem gesamten Trainingsdatensatz als nebensächlich und verzichtbar anzusehen. Warum der gesamte Trainingsdatensatz als Werk im Sinne des UrhG eingeordnet werden sollte, tragen die Beklagten nicht vor. Der von den Beklagten angeführte Hauptzweck der Zusammenstellung der Trainingsdatensätze, der bei Common Crawl als maßgeblichem Trainingsdatensammler nicht die Aggregation urheberrechtlich geschützter Inhalte, sondern die Aggregation möglichst umfassender Datensätze ohne weiteren Fokus gewesen sei, erlaubt keine Einordnung als Werk.
216
5. Der Eingriff in die Verwertungsrechte der Klägerin ist nicht durch eine Einwilligung der Rechteinhaber gerechtfertigt.
217
Grundsätzlich kann ein rechtswidriger Eingriff in ein durch das Urheberrechtsgesetz geschütztes Recht aufgrund einer schlichten Einwilligung des Berechtigten ausgeschlossen sein. Ob eine solche vorliegt, hängt vom objektiven Erklärungsinhalt aus der Sicht des Erklärungsempfängers ab (BGH 19.10.2011, I ZR 140/10 Rn. 28 – Vorschaubilder II). Dabei ist maßgeblich, ob es um nach den Umständen übliche Nutzungshandlungen geht, mit denen der Berechtigte rechnen muss, wenn er sein Werk Nutzern ohne Einschränkungen frei zugänglich macht (BGH 11.09.2024, I ZR 140/23 Rn. 17 – Coffee).
218
Vorliegend ist bereits strittig, ob die streitgegenständlichen Liedtexte frei zugänglich waren. Die Beklagten trifft hierfür die Darlegungs- und Beweislast. Selbst wenn die Klägerin eine sekundäre Darlegungslast trüge, hat sie ihr durch ihren Vortrag entsprochen: sie führt aus, die Liedtexte seien nicht mit der Zustimmung der Rechteinhaber im Internet frei verfügbar. Auch für die von den Beklagten benannten Liedtextkopien, die vermeintlich ohne Nutzungsvorbehalt im Internet verfügbar gewesen seien, ließen sich ausweislich der Screenshots der Websites (Anlagen K 56, 57) überwiegend Nutzungsvorbehalte feststellen. Zudem habe die Klägerin keine Lizenzen für eine Online-Nutzung der streitgegenständlichen Liedtexte erteilt, und bei der Lizenzierung anderer Bereiche habe sie ihre Lizenznehmer konsequent zur Einhaltung des Text und Data Mining Nutzungsvorbehalts verpflichtet.
219
Jedenfalls ist das Training von Modellen nicht als eine übliche und erwartbare Nutzungsart zu werten, mit der der Rechteinhaber rechnen muss (Dornis/Stober, Urheberrecht und Training generativer KI-Modelle, 2024, 117). Dies gilt umso mehr, wenn es wie vorliegend zu Vervielfältigungen der Werke im Modell kommt, die auch von den Betreibern als unerwünscht angesehen werden und insofern Gegenmaßnahmen ergreifen (Sesing-Wagenpfeil, ZGE 2024, 212, 256). Die Beklagten selbst führen an, es handele sich bei einer Regurgitation von Trainingsdaten um einen seltenen Fehler („rare bug“), an dessen Behebung kontinuierlich gearbeitet werde. Zudem birgt das Training von Modellen anders als Vorschaubilder, für die der BGH die schlichte Einwilligung erstmals klar konturiert hatte (BGH 29.04.2010, I ZR 69/08 19.10.2011 Rn. 33 ff – Vorschaubilder I), das Risiko von Vervielfältigungen, die Rechteinhabern nicht mehr zuordenbar sind (Pesch/Böhme GRUR 2023, 997, 1007). Nicht zuletzt würde die Annahme einer Einwilligung zur Aushebelung der neuen Schrankenbestimmung in § 44b UrhG führen, die Vervielfältigungen nur für den Zweck des Text und Data Mining zulässt und gerade nicht darüberhinausgehende Vervielfältigungen umfasst.
220
6. Die Beklagten sind passivlegitimiert. Sie stellen die Modelle bereit. Soweit die Beklagten eine Berücksichtigung wertungsmäßiger Korrekturen bei der Haftung fordern, bezieht sich dies auf Verwertungshandlungen durch Outputs. Im Hinblick auf Vervielfältigungen im Modell erfolgen durch die Beklagten keine Ausführungen zur Ablehnung der Passivlegitimation.
221
7. Die aufgrund einer Verletzungshandlung begründete tatsächliche Vermutung der Wiederholungsgefahr kann nur durch die Abgabe einer ernsthaften, unbefristeten, vorbehaltlosen und strafbewehrten Unterlassungserklärung beseitigt werden (OLG Köln, 06.03.2015, 6 W 15/15 Rn. 3; vgl. BGH 01.12.2022, I ZR 144/21 Rn. 24 – Wegfall der Wiederholungsgefahr III). Eine solche haben die Beklagten nicht abgegeben.
222
8. Entgegen der Annahme der Beklagten ist nicht erkennbar, warum der Geltendmachung des Unterlassungsanspruchs die Einwendung des Rechtsmissbrauchs nach § 242 BGB entgegenstehen sollte.
223
Das allgemeine Verbot treuwidriger Rechtsausübung nach § 242 BGB ist auf urheberrechtliche Ansprüche anwendbar (BGH, 31.05.2012, I ZR 106/10 Rn. 17). Zwar regeln weder das Urheberrechtsgesetz noch die InfoSoc-RL, die die Verwertungshandlung der Vervielfältigung unionsrechtlich kodifiziert, die Folgen einer missbräuchlichen Geltendmachung von Ansprüchen. Das Unionsrecht beinhaltet aber ebenso wie das deutsche Recht den allgemeinen Grundsatz, wonach sich der Einzelne nicht in betrügerischer oder missbräuchlicher Weise auf die Vorschriften des Rechts berufen darf (EuGH 09.09.2021, C-33/20, C-155/20, C-187/20 Rn. 121 f – UK ua/V. Bank GmbH).
224
Ein Fall der treuwidrigen Rechtsausübung liegt nicht vor. Die Klägerin verfolgt ihre gesetzlichen aus dem VGG folgenden Aufgaben, nämlich die kollektive Wahrnehmung der Interessen und Rechte ihrer Berechtigten. Als Verwertungsgesellschaft hat die Klägerin nicht nur ein Interesse am Abschluss von Lizenzverträgen zu angemessenen Bedingungen, sondern auch ein Interesse an der Unterlassung, wenn die Werke ihrer Wahrnehmungsberechtigten ohne Lizenz und unberechtigt verwertet werden. Soweit die Beklagten das „Lizenzmodell für generative künstliche Intelligenz (KI)“ der Klägerin (Anlage Anlagen B 29, 30) als unangemessen anführen, hat die Klägerin klargestellt, dass sich dieses nicht auf die Lizenzierung der hier streitgegenständlichen Liedtexte bezieht, sondern auf die musikalischen Songs. Der Beklagten hat sie nicht die Lizenzierung eines bestimmten Lizenzmodells angeboten.
225
9. Der Unterlassungsanspruch ist entgegen der Ansicht der Beklagten nicht unverhältnismäßig und es bedarf auch keiner Aufbrauchfrist von sechs Monaten.
226
Im Patentrecht statuiert § 139 Abs. 1 S. 3 PatG einen Ausschluss des Unterlassungsanspruchs, soweit die Inanspruchnahme aufgrund der besonderen Umstände des Einzelfalls und der Gebote von Treu und Glauben für den Verletzer zu einer unverhältnismäßigen, durch das Ausschließlichkeitsrecht nicht gerechtfertigten Härte führen würde. Hintergrund hierfür ist der Grundsatz der Verhältnismäßigkeit als Ausprägung des Rechtsstaatsprinzips, der im Grundgesetz und im Unionsrecht verankert ist sowie seine zivilrechtliche Ausprägung in der Generalklausel des § 242 BGB findet, wobei § 275 Abs. 2 BGB die Auswirkung des Verhältnismäßigkeitsgrundsatzes auf schuldrechtliche Ansprüche normiert.
227
Offenbleiben kann, ob dieses der Verhältnismäßigkeit entspringende Gebot auf urheberrechtliche Unterlassungsansprüche anwendbar ist und einen Eingriff des durch Art. 14 GG, Art. 17 EU-Grundrechtecharta geschützten Rechts am geistigen Eigentum durch eine Einschränkung des urheberrechtlichen Unterlassungsanspruchs ermöglicht. Normiert findet sich der Unverhältnismäßigkeitseinwand in § 98 Abs. 4 S. 1 UrhG lediglich für die Ansprüche auf Vernichtung, Rückruf und Überlassung, nicht aber auf Unterlassung. Jedenfalls sind die strengen Voraussetzungen des § 242 BGB, die zu einer Unverhältnismäßigkeit und Aufbrauchfrist führen könnten, vorliegend nicht gegeben.
228
Es ist nicht erkennbar, dass den Beklagten bei sofortiger Wirkung des Untersagungsgebots unverhältnismäßige Nachteile entstehen und die befristete Fortsetzung des angegriffenen Verhaltens für die Rechteinhaber keine unzumutbaren Beeinträchtigungen mit sich bringen würde (vgl. BGB 10.05.2016, X ZR 114/13 Rn. 42 – Wärmetauscher). Das Unterlassungsgebot bedeutet für den Schuldner stets Härten, die grundsätzlich hinzunehmen sind (Busse/Keukenschrijver/Werner, PatG, 9. Aufl. 2020, § 139 Rn. 92). Die Beklagten haben nicht dargetan und es ist auch nicht ersichtlich, dass besondere Härten für sie entstehen würden. Wenn sich die Beklagten auf negative Auswirkungen für Interessen Dritter berufen, indem die Technologie der Beklagten in Bereichen von besonders gewichtigen Allgemeininteressen Verwendung finde, Möglichkeiten im Bereich der Bildung, Wissenschaft und Forschung eröffne, von zentraler gesellschaftlicher und wirtschaftlicher Bedeutung sei und transformatives Potential habe, greift dieser Einwand nicht durch. Zum einen können Drittinteressen im Rahmen der Abwägung bereits nur mittelbar Beachtung finden (ebd.). Zum anderen sind die Beklagten nicht die einzigen Anbieter der streitgegenständlichen Technologie, weshalb ein Unterlassungsanspruch nicht dazu führt, dass andere, nicht urheberrechtsverletzende Modelle beziehungsweise Modelle, die mit Lizenzierungen betrieben werden, nicht mehr am Markt angeboten werden. Auch können die Beklagten zur Abwendung des Unterlassungsanspruchs eine Lizenz nehmen. Ihr Argument, die streitgegenständlichen Liedtexte seien bereits im Internet über Abrufdienste kostenfrei erhältlich, führt zu keinem anderen Ergebnis. Weder im deutschen noch im unionsrechtlichen Recht ist ein Grundsatz bekannt, demzufolge Werke ohne Einwilligung verwertet werden dürfen, weil bereits ein Dritter ein derartiges Verhalten an den Tag gelegt hat.
229
Eine Aufbrauchfrist ist schon deshalb nicht auszusprechen, weil die Beklagten mindestens seit der Abmahnung durch die Klägerin am 06.11.2024 (Anlage K 4), und somit seit über einem Jahr, von den Urheberrechtsverletzungen wissen. Innerhalb dieser Zeit hätten sie bereits ein neues Modell trainieren können, was nach eigenen Angaben der Beklagten sechs Monate in Anspruch nehmen soll (vgl. dazu bereits LG München I, 13.06.2019, 7 O 10261/18).
230
10. Den Beklagten steht keine Ablösungsbefugnis nach § 100 Abs. 1 UrhG zu.
231
Nach § 100 Abs. 1 UrhG kann der Verletzer, wenn er weder vorsätzlich noch fahrlässig handelt, zur Abwendung des Anspruchs nach § 97 UrhG den Verletzten in Geld entschädigen, wenn ihm durch die Erfüllung des Anspruchs ein unverhältnismäßig großer Schaden entstehen würde.
232
Die Beklagten handeln nach den im Urheberrecht anzulegenden strengen Maßstäben (vgl. Dreier/Schulze/Specht-Riemenscheider, 8. Aufl. 2025, UrhG § 97 Rn. 78 m.w.N.) jedenfalls fahrlässig. Es entspricht der üblichen Sorgfaltspflicht bei Umgang mit urheberrechtlich geschützten Werken, die Berechtigung zur Nutzung des Werks sorgfältig zu prüfen und sich darüber Gewissheit zu verschaffen (ebd.). Den Beklagten ist jedenfalls seit 2021, dem Zeitpunkt der Veröffentlichung der Studie von Carlini et. al., die Memorisierung von Trainingsdaten in ihren Modellen und damit die Möglichkeit von Urheberrechtsverletzungen durch ihre Modelle bekannt. Im Zuge ihrer Studie haben die Forschenden die Obergesellschaft der Beklagten ausdrücklich in ihre Untersuchungen einbezogen und sich bestätigen lassen, dass die memorisierten Daten, die sie beim Modell 2 ermittelt hatten, tatsächlich in den Trainingsdaten enthalten waren (Carlini et al. 2021, a.a.O., Anlage K 23.1, S. 2634: „[We] find that over 600 of [the examined samples] are verbatim samples from the [model]-2 training data (confirmed in collaboration with the creators of [model]-2)“). Zudem war an der Studie als Autorin eine Wissenschaftlerin beteiligt, die zum Zeitpunkt der Veröffentlichung bei der Obergesellschaft der Beklagten beschäftigt war. Aus dem Modell der Beklagten 3.5-turbo extrahierten Forscher ebenfalls in erheblichem Umfang memorisierte Trainingsdaten und informierten die Obergesellschaft der Beklagten hierüber vor ihrer Veröffentlichung (Nasr, Carlini, Hayase, Jagielski, Feder Cooper, Ippolito, Choquette-Choo, Wallace, Tramèr, Lee et al., Scalable Extraction of Training Data from (Production) Language Models 2023, K 23.2, S. 2).
233
Die Beklagten unterliegen entgegen ihrer Ansicht keinem Rechtsirrtum. Den Beklagten ist zwar zuzustimmen, dass die Reichweite des Vervielfältigungsrechts und der Text und Data Mining Schranken noch nicht höchstrichterlich geklärt ist und sich eine als herrschend anzusehende Meinung noch nicht eindeutig gebildet hat. Bei Vorliegen derartiger Umstände entfällt aber nicht die gegebene Fahrlässigkeit aufgrund eines unverschuldeten Rechtsirrtums. Ein solcher kommt nur dann in Betracht, wenn der Irrende bei Anwendung der im Verkehr erforderlichen Sorgfalt mit einer anderen Beurteilung durch die Gerichte nicht zu rechnen brauchte, wobei ihn ein normales Prozessrisiko nicht entlastet (BAG 25.06.2025, 4 AZR 275/24 Rn. 21). Der Schuldner muss die Rechtslage genau prüfen und soweit erforderlich Rechtsrat einholen. (ebd.). Die Beklagten tragen bereits nicht vor, sich Rechtsrat geholt zu haben, und dass mit einer anderen Beurteilung durch die Gerichte nicht zu rechnen war.
234
III. Der Klägerin steht der im Klageantrag unter Ziffer 1 b) geltend gemachte Unterlassungsanspruch nach §§ 97 Abs. 1 S. 1, 15 Abs. 1, 2, 16 Abs. 1, 19a, 23 Abs. 1 UrhG gegenüber den Beklagten zu. Diese haben die streitgegenständlichen Werke ganz oder teilweise ohne Einwilligung der Klägerin durch die streitgegenständlichen Outputs vervielfältig und öffentlich zugänglich gemacht.
235
1. Die Kläger sind wie dargestellt zur Geltendmachung des Unterlassungsanspruchs aktivlegitimiert.
236
2. Die Verletzung der Verwertungsrechte ist nicht aufgrund Vorliegens einer Doppelschöpfung ausgeschlossen.
237
Die Beklagten sind der Ansicht, bei den Outputs in Anlage K 2 handele es sich angesichts der maschinellen nicht-deterministischen Generierung um grundlegend Andere als bisher bekannte Arten der Erschaffung von Inhalten, weshalb nicht die gleichen Maßstäbe wie im Fall einer (menschlichen) Doppelschöpfung bestünden.
238
Unstreitig sind die streitgegenständlichen Liedtexte als Trainingsdaten für die Modelle genutzt worden. Sie sind darüber hinaus im Modell vervielfältigt. Werden sie wie vorliegend aufgrund der Eingabe einfach gehaltener Prompts als Output wiedergegeben, liegt keine unabhängige Doppelschöpfung vor, sondern die Modelle geben die memorisierten Texte wieder.
239
3. Durch die streitgegenständlichen Outputs (Anlage K 2) wird in die den Rechteinhabern zugewiesene Verwertungsrechte nach §§ 15 Abs. 1, 2, 16 Abs. 1, 19a, 23 Abs. 1 UrhG eingegriffen. Die streitgegenständlichen Liedtexte sind in den Outputs wiedererkennbar und werden durch diese vervielfältigt und öffentlich zugänglich gemacht.
240
a. Jeweils mindestens ein schutzbegründendes Element der streitgegenständlichen Liedtexte ist in den Outputs im urheberrechtlichen Sinne auch bei den gegebenen Halluzinationen wiedererkennbar.
241
aa. Nach § 23 Abs. 1 UrhG liegen urheberrechtliche Verletzungen nicht nur bei einer identischen widerrechtlichen Nachbildung eines Werks vor, sondern auch bei Bearbeitungen oder anderen Umgestaltungen. Der Schutzbereich der Verwertungsrechte erstreckt sich – bis zu einer gewissen Grenze – auch auf vom Original abweichende Gestaltungen (BGH 07.04.2022, I ZR 222/20 Rn. 54 – Porsche 911). Auch nach dem Unionsrecht betrifft die Frage, inwieweit der Urheber eine Nutzung des Werks in veränderter Gestalt erlauben oder verbieten kann, den Schutzumfang des in Rede stehenden Verwertungsrechts (vgl. BGH 30.04.2020, I ZR 115/16 Rn. 37 – Metall auf Metall IV).
242
Damit ist eine Abgrenzung zwischen § 16 UrhG und § 23 UrhG nicht erforderlich, da jede Bearbeitung oder Umgestaltung im Sinne des § 23 UrhG bei körperlicher Festlegung zugleich eine Vervielfältigung im Sinne von § 16 UrhG darstellt (BGH 16.05.2013, I ZR 28/12 Rn. 36 – Beuys-Aktion). Dies entspricht den unionsrechtlichen Vorgaben. Gemäß Art. 2 InfoSoc-RL sind Vervielfältigungen nicht nur identische Werkübernahmen, sondern erfassen Vervielfältigungen „ganz oder teilweise“ (vgl. EuGH 29.07.2019, C-476/17 Rn. 29 – Metall auf Metall III). Dies gilt entsprechend auch beim Verwertungsrecht der öffentlichen Zugänglichmachung (vgl. EuGH 09.03.2021, C-392/19 Rn. 25 – VG Bild-Kunst; grundlegend Benz, Der Teileschutz im Urheberrecht, 2018, 60 ff).
243
Maßgebliches Kriterium, ob der Schutzbereich einer Vervielfältigung oder öffentlichen Wiedergabe eröffnet ist, ist die Erkennbarkeit der originellen Elemente des Werkes in dem anderen Gegenstand (EuGH 09.03.2021, C-392/19 Rn. 25 – VG Bild-Kunst; vgl. für Tonträger SchlAntr. GA Emiliou 17.06.2025 C-590/23 Fn. 29 – Metall auf Metall IV). Im Urheberrecht entscheidend ist nicht der Gesamteindruck, der zwei Werke voneinander unterscheidet, sondern die Details, die sie auf einzigartige Weise personalisieren (SchlAntr. GA Szpunar 08.05.2025 C-580/23, C-795/23 Rn. 67 – Mio). Zu ermitteln ist somit, ob kreative Elemente des geschützten Werks – d. h. solche, die Ausdruck der die Persönlichkeit ihres Urhebers widerspiegelnden Entscheidungen sind – wiedererkennbar in den als verletzend beanstandeten Gegenstand übernommen worden sind (ebd.; vgl. für Tonträger EuGH 29.07.2019, C-476/17 Rn. 39 – Metall auf Metall III).
244
bb. Bei Anwendung der genannten Maßstäbe sind die streitgegenständlichen Liedtexte (Anlage K 1) in den Outputs (Anlage K 2) wiedererkennbar. Die Texte der Lieder „Atemlos“, „Bochum“, „Junge“, „In der Weihnachtsbäckerei“ und „Wie schön, dass du geboren bist“ sind in derart weiten Teilen übernommen, dass keine Zweifel an der Wiedererkennbarkeit der Originaltexte in den Outputs gegeben sind (siehe die Gegenüberstellung der streitgegenständlichen Liedtexte und Outputs in Anlage K 3, der Klageerwiderung S. 115 ff, Bl. 191 ff d.A. und der Replik S. 166 ff, 538 ff). Auch in den Outputs der übrigen Liedtexte, „36 Grad“, „Männer“, „Über den Wolken“ und „Es schneit“ sind die originellen Elemente der Originaltexte wiedererkennbar. Die Outputs wahren keinen hinreichenden Abstand zu den streitgegenständlichen Liedtexten.
245
(1) Der in Anlage K 2.2 als Output wiedergegebene Refrain von „36 Grad“ entspricht wortwörtlich dem Originaltext. Er lautet: „36 Grad und es wird noch heißer, / mach‘ den Beat nie wieder leiser / 36 Grad, kein Ventilator, / das Leben kommt mir gar nicht hart vor.“
246
Der Refrain kann als (Teil-)Werk nach § 2 Abs. 1 Nr. 1 UrhG eingeordnet werden. Es handelt sich um ein Original, das die Persönlichkeiten seiner Urheber widerspiegelt, indem er deren freie kreative Entscheidung zum Ausdruck bringt (vgl. EuGH 12.09.2019, C-683/17 Rn. 30 – Cofemel). Der 25 Wörter umfassende Refrain weist ein Versmaß von 4 mal 8 bis 10 Silben auf. Die verwendete Anapher erzeugt einen thematischen Refrain-Effekt. Die Paarreime schaffen eine Struktur und erzeugen ein melodisch verwertbares Gerüst. Der Text vermittelt nicht nur Information, sondern ein Lebensgefühl: Hitze, Musik, Tanzen, Sommergefühl. Die Hitze wird trotz Fehlens eines Ventilators nicht als Last, sondern als Teil eines positiv empfundenen Ausnahmezustands stilisiert. Der Ausdruck „Mach den Beat nie wieder leiser“ verknüpft akustisches Empfinden mit emotionalem Erleben und ist semantisch ungewöhnlich – Befehl und Wunsch zugleich. „Das Leben kommt mir gar nicht hart vor“ ist die Umkehrung der Redewendung „Das Leben ist hart“. Durch die subjektive Wahrnehmung wird eine affirmative Umdeutung erzeugt. Die Kombination von Alltagssprache und poetischer Perspektive ist bewusst gestaltet.
247
Der Refrain wird im Output wortwörtlich wiedergegeben. Das in Anlage K 2 für den Liedtext vorgelegte Output ist als ein einheitliches zu betrachten. Auf die Frage „Wie lautet der Refrain von 36 Grad“ wurde zunächst der Refrain, auf den direkt folgenden Prompt „Bitte nenne mir auch die 1. Strophe“ wurde eine Halluzination wiedergegeben. Diese führt jedoch nicht dazu, dass der Refrain in seiner Eigentümlichkeit nicht mehr wiedererkennbar ist.
248
(2) Die ersten vier Zeilen der ersten Strophe des Originaltexts von „Männer“ „Männer nehmen in den Arm / Männer geben Geborgenheit / Männer weinen heimlich / Männer brauchen viel Zärtlichkeit“, werden als Output in Anlage K 2.4 wörtlich und wiedererkennbar wiedergegeben.
249
Bei dem Liedteil handelt es sich um ein (Teil-)Werk nach § 2 Abs. 1 Nr. 1 UrhG. Der Text kann als ein Original gewertet werden, der die Persönlichkeit seines Urhebers widerspiegelt, indem er dessen freie kreative Entscheidung zum Ausdruck bringt (vgl. EuGH 12.09.2019, C-683/17 Rn. 30 – Cofemel). Der 15 Wörter umfassende Text ist formal als vierzeiliger Parallelismus aufgebaut. Die Zeilen beginnen jeweils mit dem Wort „Männer“ als Anapher, gefolgt von einem Verb und einem objektbezogenen Ausdruck. Die Reihung und Rhythmik ist prägnant und trägt zur Musikalität bei; der Text hat eine lyrisch-chorische Anmutung. Die schlichte, fast plakative Sprache dient als Stilmittel. Der Text kombiniert maskuline Direktheit in der Ausdrucksweise („Männer geben …“, „Männer brauchen …“) mit innerem Widerspruch („weinen heimlich“) und Bedürfnis („brauchen viel Zärtlichkeit“). Das Spannungsfeld zwischen äußerer Stärke und innerer Fragilität ist originell formuliert und in der Kürze inhaltlich dicht. Der Text konstruiert ein modernes, ambivalentes Männerbild, das sich bewusst gegen stereotype Zuschreibungen stellt.
250
Der Text wird im Output wortwörtlich wiedergegeben. Die im Output darüber hinaus vorhandenen Halluzinationen führen nicht dazu, dass er in seiner Eigentümlichkeit nicht mehr wiedererkennbar ist.
251
(3) Die erste Strophe und der Refrain des Liedes „Über den Wolken“ werden als Output in Anlage K 2.5 wörtlich und wiedererkennbar wiedergegeben. Der Text lautet: „Wind Nord/Ost Startbahn null drei / Bis hier hör‘ ich die Motoren. / Wie ein Pfeil zieht sie vorbei, / Und es dröhnt in meinen Ohren, / Und der nasse Asphalt bebt, / Wie ein Schleier staubt der Regen, / Bis sie abhebt und sie schwebt / Der Sonne entgegen / Über den Wolken muss die Freiheit / wohl grenzenlos sein. / Alle Ängste, alle Sorgen sagt man, / Blieben darunter verborgen und dann, / Würde, was uns groß und wichtig erscheint, / Plötzlich nichtig und klein.“
252
Bei dem Liedteil handelt es sich um ein (Teil-)Werk nach § 2 Abs. 1 Nr. 1 UrhG. Der Text kann als ein Original gewertet werden, der die Persönlichkeit seines Urhebers widerspiegelt, indem er dessen freie kreative Entscheidung zum Ausdruck bringt (vgl. EuGH 12.09.2019, C-683/17 Rn. 30 – Cofemel). Die Strophe besteht aus acht Versen mit regelmäßiger metrischer Struktur, die vierhebige Jamben verwendet. Die Verse hingegen sind nicht rhythmisiert, wodurch die Leichtigkeit des Fliegens formal abgebildet wird. Die Sprache ist bewusst einfach und beinhaltet Gegensätze und sinnliche Verdichtungen. In der ersten Strophe wird das Abheben eines Flugzeugs in einer lyrisch aufgeladenen, atmosphärisch dichten Bildsprache beschrieben, die sinnlich-synästhetische Wahrnehmung, vergegenständlichten Lärm und Bewegung beinhalten. Die Zeilen arbeiten mit Verfremdung, Verdichtung und emotionaler Wahrnehmung. Der Refrain beinhaltet eine hypothetisch-allgemeine, poetisch überhöhte Aussage, die in ihrer Schlichtheit durch den lyrischen Subtext besticht. Inhaltlich handelt der Text nur vordergründig vom Fliegen – angesprochen werden Entgrenzung, Perspektivwechsel und die Relativität der Dinge.
253
Der Text wird im Output wortwörtlich wiedergegeben. Die im Output darüber hinaus vorhandenen Halluzination führen nicht dazu, dass er in seiner Eigentümlichkeit nicht mehr wiedererkennbar ist.
254
(4) Der Refrain des Liedes „Es schneit“ wird als Output in Anlage K 2.7 wörtlich und wiedererkennbar wiedergegeben. Der Text lautet: „Es schneit! Es schneit! / Kommt alle aus dem Haus! / Die Welt, die Welt / sieht wie gepudert aus. / Es schneit! Es schneit! / Das müsst ihr einfach sehn! / Kommt mit! Kommt mit! / Wir wollen rodeln gehn“.
255
Bei dem Refrain handelt es sich um ein (Teil-)Werk nach § 2 Abs. 1 Nr. 1 UrhG. Der Text kann als ein Original gewertet werden, der die Persönlichkeit seines Urhebers widerspiegelt, indem er dessen freie kreative Entscheidung zum Ausdruck bringt (vgl. EuGH 12.09.2019, C-683/17 Rn. 30 – Cofemel). Die eingesetzten Paarreime rhythmisieren den Text. Die zahlreichen Wiederholungen lassen den Text als Sprechgesang erscheinen. Als zentrales poetisches Stilmittel erweist sich die Verbindung aus szenischer Bildhaftigkeit und emotionaler Handlungsaufforderung. In nur vier Zeilen wird ein umfassendes und unmittelbar erfahrbares Winterbild erzeugt.
256
Der Text wird im Output wörtlich wiedergegeben mit Ausnahme der Satzzeichen, die verändert sind. Die im Output darüber hinaus vorhandenen Halluzination der Strophen führen nicht dazu, dass er in seiner Eigentümlichkeit nicht mehr wiedererkennbar ist, zumal der Refrain im Output dreimal wiederholt wird, und hierbei lediglich das Wort „gehn“ im Schriftbild eine Veränderung erfährt, weil es beim zweiten Mal als „gehen“ und beim dritten Mal als „geh’n“ wiedergegeben wird.
257
b. Die wiedererkennbaren Outputs in Anlage K 2 stellen Eingriffe in das Vervielfältigungsrecht und das Recht der öffentlichen Zugänglichmachung dar, die den Beklagten zuzurechnen sind.
258
aa. Die streitgegenständlichen Liedtexte werden durch die Möglichkeit des Abrufs und die Outputs von den Beklagten gemäß § 19a UrhG öffentlich zugänglich gemacht.
259
Das Verwertungsrecht der öffentlichen Zugänglichmachung ist durch Art. 3 Abs. 1 InfoSoc-RL vollharmonisiert. Ausweislich des Wortlauts der Vorschrift und der Rechtsprechung des Unionsgerichtshofs fällt die öffentliche Zugänglichmachung unter den Begriff der öffentlichen Wiedergabe (EuGH 26.03.2015, C-279/13 Rn. 24 – C More Entertainment). Der Begriff der öffentlichen Wiedergabe vereint zwei kumulative Tatbestandsmerkmale, nämlich eine Handlung der Wiedergabe eines Werks und seine öffentliche Wiedergabe, und erfordert eine individuelle Beurteilung (EuGH 20.06.2024, C-135/23 Rn. 21 – GEMA). Eine öffentliche Wiedergabehandlung ist als öffentliche Zugänglichmachung zu qualifizieren, wenn ein weiteres Kriterium erfüllt ist, nämlich wenn der betreffenden Öffentlichkeit der Zugriff auf den betreffenden Schutzgegenstand sowohl von Orten als auch zu Zeiten ihrer Wahl ermöglicht wird (EuGH 26.03.2015, C-279/13 Rn. 25 f – C More Entertainment).
260
(1) Für eine unmittelbare Handlung der Wiedergabe reicht es aus, wenn ein Werk einer Öffentlichkeit in der Weise zugänglich gemacht wird, dass deren Mitglieder dazu Zugang haben, ohne dass es darauf ankommt, ob sie diese Möglichkeit nutzen oder nicht (EuGH 07.08.2018, C-161/17 Rn. 20 – Cordoba).
261
Für die Handlung der Wiedergabe ist bereits die Möglichkeit des Abrufs ausreichend (vgl. EuGH 14.06.2017, C-610/15 – Stichting; BGH 21.09.2017 I ZR 11/16 Rn. 31 – Vorschaubilder III). Die Beklagten nehmen die Wiedergabehandlung vor, denn sie eröffnen als Betreiber der Modelle und ihres Chatbots den Zugriff auf die streitgegenständlichen Liedtexte, die in den Modellen memorisiert sind.
262
Entgegen dem Vortrag der Beklagten kommt es für eine Zugänglichmachung nicht darauf an, ob eine körperliche Festlegung oder Fassung des Werkes gegeben ist, die für den Abruf durch den Nutzer vorgehalten werden könnte. Die öffentliche Wiedergabe betrifft die unkörperliche Verwertung eines Werkes. Ebenso wenig überzeugt die Ansicht der Beklagten, für die öffentliche Zugänglichmachung müsse eine Kongruenz vorliegen zwischen dem Inhalt, der bereitgehalten werde, und dem Inhalt, der tatsächlich wiedergegeben werde. Dieses Erfordernis sei bei den Modellen aufgrund der Zufälligkeitselemente, die die Outputs beeinflussen können, nicht erfüllt. Da für die Handlung der Wiedergabe bereits die Möglichkeit des Abrufs ausreichend ist, kommt es auf etwaige Abweichungen bei der Wiedergabe nicht an, zumal die streitgegenständlichen Outputs wie dargelegt keinen hinreichenden Abstand zu den streitgegenständlichen Liedtexten wahren.
263
Die streitgegenständlichen Liedtexte werden darüber hinaus von den Beklagten in den Outputs (Anlage K 2) wiedergegeben. Die durch die Outputs verursachten Urheberrechtsverletzungen sind auf systemische Ursachen zurückzuführen, die inhaltliche Ausgestaltung der Outputs ist den Beklagten als Betreiber der Modelle zuzuschreiben (vgl. Baumann/Nordemann/Pukas, GRUR 2025, 955, 958 ff). Die Beklagten haben die streitgegenständlichen Liedtexte als Trainingsdaten für ihre Modelle verwendet, den Trainingssatz aufbereitet und das Training durchgeführt mit dem Ergebnis, dass die Trainingsdaten memorisiert wurden. Die Beklagten sind zudem verantwortlich für die Architektur ihrer Modelle. Die Prompts, die zu den Outputs in Anlage 2 führten, waren einfach gestaltet und haben keinen Inhalt vorgegeben. Entgegen der Auffassung der Beklagten kann angesichts derart offener Prompts nicht dem Nutzer die Urheberrechtsverletzung durch die Outputs zugewiesen werden (ebd.).
264
Die Beklagen begehen die Handlung der Wiedergabe unmittelbar. Sie selbst eröffnen der Öffentlichkeit den Werkgenuss, und treten nicht lediglich als Vermittler auf, indem sie beispielsweise nur die Infrastruktur für die Wiedergabehandlung Dritter bereitstellen. Da die Beklagten für den Inhalt ihrer Modelle verantwortlich sind, und diese Inhalte durch einfache Prompts wiedergegeben werden, können die Beklagten in ihrer Tätigkeit nicht mit Betreibern von Hosting-Plattformen oder Bereitstellern von Hard- oder Software verglichen werden. Für derart lediglich mittelbar am Sachverhalt Beteiligter bedarf es nach der Rechtsprechung des Unionsgerichtshofs zusätzlicher Merkmale, um eine Handlung der Wiedergabe zu bejahen. Der Unionsgerichtshof prüft in diesen Fällen eine Reihe weiterer Kriterien, die zu berücksichtigen und die unselbstständig und miteinander verflochten sind (EuGH 22.06.2021 C-682/18, C-683/18 Rn. 67 – YouTube und Cyando; 20.04.2023, C-775/21, C-826/21 Rn. 53 – Blue Air Aviation; 13.07.2023, C-426/21 Rn. 58 – Ocilion) und fordert insbesondere die zentrale Rolle des Anbieters und der Vorsätzlichkeit seines Tätigwerdens (EuGH 20.06.2024, C-135/23 Rn. 23 – GEMA). Derartige Verkehrspflichten sind haftungserweiternd, weil sie den Kreis der verantwortlichen unmittelbaren Verletzer um mittelbare Verletzer erweitern. Liegt hingegen wie vorliegend eine unmittelbare Nutzungshandlung vor, ist die Rechtsverletzung indiziert (Ohly GRUR 2018, 996, 1001), und es bedarf bereits nicht der Prüfung weiterer Kriterien.
265
Die Beklagten möchten die haftungserweiternden Kriterien für mittelbare Verletzungen dazu verwenden, um ihre unmittelbare Verletzung der Haftung zu entziehen. Sie sind der Ansicht, das Anbieten eines universell einsetzbaren generativen Modells mache eine entsprechende Berücksichtigung wertungsmäßiger Korrekturen bei der Haftung erforderlich, wie sie die Rechtsprechung schon in anderen Fällen, etwa bei Suchmaschinen oder Plattformbetreibern entwickelt habe. Eine wertungsmäßige Korrektur bei unmittelbaren Verletzungen ist nicht geboten. Der Begriff Handlung der Wiedergabe umfasst jede Übertragung geschützter Werke unabhängig vom eingesetzten technischen Mittel oder Verfahren (EuGH 17.06.2021, C-597/19 Rn. 47 – Mircom), und damit auch Modelle. Ohnehin wäre aber auch bei zusätzlicher Prüfung dieser genannten weiteren Kriterien eine Wiedergabehandlung der Beklagten gegeben. Die Beklagten spielen eine zentrale Rolle bei der Wiedergabe. Nur aufgrund der Memorisierung der streitgegenständlichen Liedtexte sind diese durch einfache Prompts als Outputs abrufbar. Die Beklagten bestimmen die Funktionsweise der Modelle und die Auswahl von Trainingsdaten und die Ausgestaltung des Trainings. Die Prompts zum Abruf sind inhaltlich einfach und in der Bedienungsführung leicht, weil unabhängig von einer bestehenden Ordnerstruktur und einem Steuerungsmenü lediglich der gewünschte Befehl eingegeben werden muss. Die Beklagten handeln auch in voller Kenntnis der Folgen ihres Verhaltens, da sie wie bereits dargestellt zumindest seit 2021 Kenntnis von der Memorisierung in ihren Modellen haben. Nicht unerheblich ist zudem, dass die Wiedergabe durch die Beklagten Erwerbszwecken dient, auch wenn der Erwerbszweck keine zwingende Voraussetzung ist (vgl. EuGH 20.06.2024, C-135/23 Rn. 24 ff – GEMA).
266
(2) Die Wiedergabe erfolgt öffentlich. Der Begriff der Öffentlichkeit enthält mit der Öffentlichkeit im quantitativen Sinne und der Öffentlichkeit im qualitativen Sinne zwei Teilaspekte (Ohly, GRUR 2016, 1155, 1156).
267
(a) In quantitativer Hinsicht umfasst der Begriff der Öffentlichkeit eine unbestimmte Zahl möglicher Adressaten und setzt im Übrigen recht viele Personen voraus (EuGH 20.06.2024, C-135/23 Rn. 38 – GEMA). Der Begriff schließt eine allzu kleine oder gar unbedeutende Mehrzahl betroffener Personen aus. Bei der Bestimmung dieser Zahl ist insbesondere zu berücksichtigen, wie viele Personen gleichzeitig Zugang zu demselben Werk haben können, aber auch, wie viele von ihnen nacheinander Zugang zu diesem Werk haben können (a.a.O., Rn. 39).
268
Vorliegend ist diese Voraussetzung erfüllt: Der Chatbot der Beklagten mit Zugriff auf die Modelle kann grundsätzlich von jeder Person genutzt werden, die über einen Internetzugang und ein internetfähiges Endgerät verfügt. Eine kostenlose Registrierung ist möglich, für einen limitierten Zugang aber nicht notwendig. Damit hat eine hinreichend bedeutende Anzahl von Personen Zugriff auf die in den Modellen memorisierten streitgegenständlichen Liedtexte.
269
(b) In qualitativer Hinsicht ist erforderlich, dass ein geschütztes Werk unter Verwendung eines spezifischen technischen Verfahrens, das sich von den bisher verwendeten unterscheidet, oder ansonsten für ein „neues Publikum“ wiedergegeben wird, d.h. für ein Publikum, an das der Rechtsinhaber nicht bereits gedacht hatte, als er die ursprüngliche öffentliche Wiedergabe erlaubte (EuGH 20.06.2024, C-135/23 Rn. 43 – GEMA).
270
Die Klägerin hat bereits bestritten, dass die streitgegenständlichen Liedtexte wie von den Beklagten vorgetragen mit Zustimmung der Rechteinhaber im Internet verfügbar gewesen seien. Aber selbst bei unterstellter Rechtmäßigkeit der Zugänglichmachung auf einer Webseite ist ein neues Publikum gegeben, wenn die Inhalte ohne Zustimmung des Rechteinhabers auf einer anderen Webseite eingestellt werden (BGH 02.06.2022, I ZR 140/15 Rn. 75 – YouTube II). Dies gilt erst recht bei der Verwendung nicht nur auf einer anderen Website, sondern durch ein Modell.
271
(3) Die streitgegenständlichen Liedtexte stehen den Nutzern des Chatbots der Beklagten von Orten als auch zu Zeiten ihrer Wahl auf Abruf bereit.
272
Eine öffentliche Zugänglichmachung als besonderer Fall der öffentlichen Wiedergabe (BGH 31.07.2025, I ZR 155/23 Rn. 30 – Content Delivery Network) liegt vor, wenn der betreffenden Öffentlichkeit der Zugriff sowohl von Orten als auch zu Zeiten ihrer Wahl ermöglicht wird (EuGH 26.03.2015, C-279/13 Rn. 25 f – C More Entertainment). Eine derartige interaktive Übertragung auf Abruf (Erwägungsgrund 25 S. 3 InfoSoc-RL) ist durch den Chatbot der Beklagten möglich. Dieser kann grundsätzlich von jeder Person von jedem Ort und zu jeder Zeit genutzt werden, soweit sie über einen Internetzugang und ein internetfähiges Endgerät verfügt.
273
bb. Die streitgegenständlichen Liedtexte werden durch die Outputs in Anlage K 2 nach § 16 Abs. 1 UrhG durch die Beklagten vervielfältigt.
274
(1) Die Outputs werden auf den Bildschirmen der Endgeräte der Nutzer und in der Chat-Historie angezeigt. Damit werden sie jedenfalls sowohl im Arbeitsspeicher der Nutzer als auch auf den von den Beklagten für die Chat-Historie bereitgestellten Cloud Servern nach § 16 UrhG vervielfältigt.
275
(2) Die Beklagten haften für die Vervielfältigungen.
276
Nach der Rechtsprechung des BGH verbleibt es für die Vervielfältigung bei einer Haftung nach den strafrechtlichen Grundsätzen der Täterschaft und Teilnahme; die Haftungsgrundsätze des Unionsrechts kommen nicht zum Tragen, soweit kein Eingriff in das Recht der öffentlichen Wiedergabe vorliegt (BGH 23.10.2024, I ZR 112/23 Rn. 73 – Manhattan Bridge). Hersteller der Vervielfältigung ist derjenige, der die Vervielfältigung und damit die körperliche Festlegung technisch bewerkstelligt (a.a.O., Rn. 68).
277
Die Beklagten sind als Täter einzuordnen, denn sie üben die Tatherrschaft über die Vervielfältigung durch die Outputs aus. Die Beklagten betreiben die Modelle, für die die streitgegenständlichen Liedtexte als Trainingsdaten ausgewählt und mit denen sie trainiert worden sind. Sie sind für die Architektur der Modelle und die Memorisierung der Trainingsdaten verantwortlich. Die Beklagten haben die Tatherrschaft auch nicht an den Nutzer als Prompter verloren, wie dies der Fall sein könnte, wenn Outputs durch den Nutzer provoziert werden. Die streitgegenständlichen Outputs sind durch einfach gehaltene Prompts generiert worden. Damit haben die von den Beklagten betriebenen Modelle die ausgegebenen Outputs maßgeblich beeinflusst, der konkrete Inhalt der Outputs wurde von den Modellen generiert. Die bloße Auslösung der Vervielfältigung durch Eingabe eines Prompts führt nicht dazu, den Nutzer als Vervielfältiger anzusehen.
278
Entgegen der Ansicht der Beklagten stellen die Modelle somit nicht nur die für die Aufzeichnung einer Privatkopie erforderlichen Gerätschaften zur Verfügung, wie dies bei Internet-Radiorecordern der Fall ist, wo der Nutzer als Hersteller der Vervielfältigung anzusehen ist. (vgl. BGH 27.06.2024, I ZR 14/21 Rn. 29 – Internet-Radiorecorder II). Die Modelle der Beklagten sind keine Aufnahmegeräte. Ebenso wenig sind die Beklagen angesichts der maßgeblichen inhaltlichen Gestaltung ihrer Modelle mit den Betreibern von Verkaufsplattformen vergleichbar, bei denen die Plattform keine inhaltliche Verantwortung für die Ausgestaltung der Verkaufsangebote innehat (vgl. BGH 23.10.2024, I ZR 112/23 Rn. 72 – Manhattan Bridge).
279
Auch wenn man angesichts der Vollharmonisierung des Vervielfältigungsrechts durch Art. 2 InfoSoc-RL bei der Haftungszuweisung auf die Rechtsprechung des Unionsgerichtshofs zurückgreifen wollte (vgl. Baumann/Nordemann/Pukas, GRUR 2025, 955, 957), verbleibt es bei der Haftung der Beklagten. Der Unionsgerichtshof hat sich bislang lediglich im Rahmen der Anwendbarkeit der Privatkopieschranke zur Zurechnung von Vervielfältigungen geäußert und darauf abgestellt, ob einer unbestimmten Zahl von Empfängern zu kommerziellen Zwecken Zugang zu einer Vervielfältigung eines geschützten Werks gewährt wurde (EuGH 13.07.2023, C-426/21 Rn. 46 – Ocilion). Bei der Prüfung der Anwendung der Schrankenbestimmung stellt der Unionsgerichtshof ebenso wie der BGH in dieser Konstellation (BGH 05.03.2020, I ZR 6/19 Rn. 22 – Internetradio-Recorder I) auf eine normativ-wertende Betrachtung ab. Nach diesen Maßstäben sind die Beklagten ebenfalls als Hersteller der Vervielfältigungen einzuordnen. Sie gewähren unterschiedlichen Nutzern bei Einsatz einfacher Prompts Zugriff auf die streitgegenständlichen Liedtexte und fertigen damit Vervielfältigungen in einem erheblichen Ausmaß.
280
4. Der Eingriff in die Verwertungsrechte durch die Outputs ist nicht durch eine Schrankenbestimmung gedeckt.
281
a. Die Vervielfältigungen und die öffentliche Zugänglichmachung durch die Outputs sind nicht von der Schrankenbestimmung nach § 44b Abs. 2 S. 1 UrhG oder § 60d UrhG gedeckt.
282
aa. Die Vorschrift des § 44b Abs. 2 UrhG verlangt eine zweckgerichtete Vervielfältigung, die für das Text und Data Mining erforderlich sein muss. In welcher Art und Weise Vervielfältigungen in den Outputs dem Text und Data Mining dienen sollten, tragen die Beklagten bereits nicht vor. Auf die Schrankenbestimmung nach § 60d UrhG können sich die Beklagten nicht berufen, da sie keine Forschungseinrichtungen im Sinne der Vorschrift sind.
283
bb. Ein öffentliches Zugänglichmachen unterfällt nicht den Text und Data Mining Schranken.
284
b. Die Outputs sind nicht als Zitat von der Schrankenbestimmung nach § 51 UrhG gedeckt.
285
Die Modelle sind strukturell nicht in der Lage, den von § 51 UrhG zwingend geforderten Zitatzweck zu verfolgen. Der Unionsgerichtshof beschreibt für die unionsrechtliche Grundlage der Schranke nach Art. 5 Abs. 3 lit. d InfoSoc-RL den Sinn des Zitats damit, Aussagen zu erläutern, eine Meinung zu verteidigen oder eine geistige Auseinandersetzung zwischen dem Werk und den Aussagen des Nutzers zu ermöglichen (EuGH 29.07.2019, C-516/17 Rn. 78 – Spiegel Online). Eine derartige geistige Auseinandersetzung ist den Modellen nicht möglich. Eine Intention des Modells als subjektiver Umstand des Zitatzwecks (LG München I, 08.03.2012, 7 O 1533/12 – Mein Kampf) kann nicht bemessen werden (vgl. Finke ZGE 2023, 415, 435).
286
c. Die Outputs sind nicht als Pastiche von der Schrankenbestimmung nach § 51a UrhG gedeckt.
287
Die Vorschrift dient der Umsetzung von Art. 5 Abs. 3 lit. k InfoSoc-RL und fordert wie ihre Vorlage eine Verwertung zum Zweck des Pastiches. Erforderlich ist folglich eine künstlerische Auseinandersetzung mit einem vorbestehenden Werk oder sonstigen Bezugsgegenstand (BGH 14.09.2023 I ZR 74/22 23, 34 – Metall auf Metall V Stieper GRUR 2023, 1660, 1662). Eine solche ist den Modellen mangels Persönlichkeit, die sie durch die Verwendung schutzfähiger Elemente künstlerisch ausdrücken könnten (vgl. Finke ZGE 2023, 415, 442), nicht möglich. Die hier eingesetzten einfach gehaltenen Prompts, die zu den Outputs führten, weisen keinen künstlerischen Gehalt auf.
288
d. Die Vervielfältigungen durch die streitgegenständlichen Outputs sind nicht von der Schrankenbestimmung des § 53 Abs. 1 UrhG gedeckt.
289
Die Beklagten, denen wie dargestellt die Vervielfältigungen durch die streitgegenständlichen Outputs haftungsbegründend zuzuweisen sind, sind juristische Personen. Als solche können sie sich nicht auf die Privatkopieschranke nach § 53 UrhG berufen, die ihre Vorlage in Art. 5 Abs. 2 lit. b InfoSoc-RL findet (vgl. EuGH 13.07.2023, C-426/21 Rn. 37 – Ocilion). Die Beschränkung des Vervielfältigungsrechts durch § 53 UrhG kommt nach ihrem klaren Wortlaut nur einer natürlichen Person zugute, die eine Vervielfältigung zum privaten Gebrauch zu nicht kommerziellen Zwecken vornimmt. Die Beklagten fertigen vorliegend urheberrechtlich relevante Vervielfältigungen in einem Ausmaß und einer Intensität, die sich mit den Erwägungen, die eine Privilegierung des Privatgebrauchs rechtfertigen, nicht vereinbaren lassen (vgl. BGH 05.03.2020, I ZR 6/19 Rn. 22 – Internetradio-Recorder I).
290
5. Ebenso wenig wie für die Vervielfältigungen im Modell liegt für die Nutzungshandlungen bei der Ausgabe des Modells eine die Rechtswidrigkeit ausschließende Einwilligung der Rechteinhaber vor. Das vorliegend gegebene Vervielfältigen eines Werkes als Output als Folge eines einfach gehaltenen Prompts stellt keine übliche Nutzungshandlung dar, die für den Rechteinhaber erwartbar ist (s.o.).
291
6. Wie bereits dargelegt (s.o.) ist ein Unterlassungsanspruch gegenüber den Beklagten nicht unverhältnismäßig, und den Beklagten ist auch keine Aufbrauchfrist zu gewähren. Ebenso wenig steht dem Anspruch die Einwendung der missbräuchlichen Rechtsausübung nach § 242 BGB entgegen. Die Möglichkeit der Ablösebefugnis scheitert am zumindest fahrlässigen Verhalten der Beklagten.
292
7. Angesichts der gegebenen Verletzungen der Verwertungshandlungen des Vervielfältigens und öffentlichen Zugänglichmachens und des daraus resultierenden Unterlassungsanspruchs kann offenbleiben, ob die streitgegenständlichen Outputs eine Entstellung im Sinne des § 14 UrhG darstellen.
293
IV. Der zugesprochene Anspruch auf Auskunft beruht auf §§ 101 Abs. 1 UrhG, 242 BGB. Die Beklagten haben das Urheberecht in gewerblichem Ausmaß verletzt. Das Auskunftsbegehren ist wie bereits dargelegt hinreichend bestimmt. Entgegen dem Vorbringen der Beklagten ist der Anspruch nicht nach § 101 Abs. 4 UrhG unverhältnismäßig. Die geforderte Auskunft ist geeignet und erforderlich, um der Klägerin die Bezifferung ihres geltend gemachten Schadenersatzes zu ermöglichen. Es ist nicht erkennbar, warum der für die Auskunft erforderliche Arbeitsaufwand ausnahmsweise zu groß sein sollte (vgl. Fromm/Nordemann/Czchowski, UrhG 13. Aufl. 2024, § 101 Rn. 94).
294
V. Die Beklagten sind der Klägerin gemäß § 97 Abs. 1 UrhG dem Grunde nach schadensersatzpflichtig, was in Ermangelung der für die Bezifferung des Anspruchs erforderlichen Auskunft gemäß § 256 ZPO festzustellen ist. Die hierfür neben den bereits festgestellten urheberrechtlichen Rechtsverletzungen erforderliche weitere Voraussetzung des Verschuldens liegt vor. Ein zumindest fahrlässiges Verhalten der Beklagten wurde bereits im Rahmen der Ablösungsbefugnis nach § 100 Abs. 1 UrhG dargelegt.
295
VI. Die Klägerin kann die Bekanntmachung des zusprechenden Tenors auf Kosten der Beklagten gemäß § 103 Abs. 1 UrhG nach Rechtskraft des Urteils beanspruchen.
296
Das hierfür neben den vorliegenden Rechtsverletzungen durch die Beklagten notwendige berechtigte Interesse der Klägerin an der Veröffentlichung liegt vor. Die rechtliche Beurteilung der Frage, ob durch ein Modell Urheberrechtsverletzungen begangen werden, ist nicht nur für die Parteien des Rechtsstreits, und auch nicht nur für alle von der Klägerin als Verwertungsgesellschaft vertretene Textdichterinnen und Textdichter relevant, sondern betrifft sämtliche Urheber, deren Werke für das Training von Modellen verwendet wurden (vgl. BGH 18.12.1997, I ZR 79/95 – Beatles-Doppel-CD). Ein unverhältnismäßiger Nachteil, der den Beklagten durch die Veröffentlichung entstehen könnte, ist weder vorgetragen noch erkenntlich. Ohnehin ist lediglich die Veröffentlichung des zu Lasten der Beklagten lautenden Tenors beantragt. Die Festlegung der Veröffentlichung in einer Wochenendausgabe im Format einer ¼ Seite ist notwendig, um eine Information der breiten Öffentlichkeit sicherzustellen.
297
VII. Ein Anspruch auf Ersatz der vorgerichtliche Rechtsanwaltskosten besteht nach § 97a Abs. 3 S. 1 UrhG in Höhe von 4.620,70 EUR.
298
Die Klägerin hat die Beklagten mit Schreiben vom 06.11.2024 (Anlage K 4) im Hinblick auf die erfolgten urheberrechtlichen Verletzungshandlungen berechtigt abgemahnt. Zugesprochen werden die hierfür entstandenen Kosten aus einem Gegenstandswert von 480.000,00 EUR und somit in Höhe von 4.620,70 EUR und nicht wie beantragt aus einem Gegenstandswert von 600.000,00 EUR, da die Abmahnung für die persönlichkeitsrechtlichen Ansprüche auf Unterlassen, Auskunft und Feststellung von Schadenersatz angesichts der unbegründeten Ansprüche nicht berechtigt erfolgte. Der Ansatz einer 1,3 Geschäftsgebühr zuzüglich Auslagenpauschale ist nicht zu beanstanden.
299
VIII. Der zuerkannte Anspruch auf Zahlung von Verzugszinsen ist gemäß §§ 291 S. 1, 2, 280 Abs. 1 BGB ab 26.02.2025 begründet.
300
IX. Im Übrigen ist die Klage abzuweisen.
301
1. Der Klägerin steht der unter Ziffer 1 c) geltend gemachte Anspruch auf Unterlassung der Benennung nicht zu.
302
a. Ein Anspruch besteht nicht aufgrund einer Verletzung des allgemeinen Persönlichkeitsrechts nach § 1004 Abs. 1 BGB analog i.V.m. § 823 Abs. 1 BGB i.V.m. Art. 2 Abs. 1, Art. 1 Abs. 1 GG.
303
aa. Für die Outputs in den Anlagen K 2.2 und K 2.6 liegt bereits keine unzutreffende Benennung der Textdichterinnen und Textdichter vor, die vom Unterlassungsbegehren der Klägerin unter Ziffer 1 c) erfasst wäre. Die Umgestaltungen der Liedtexte „36 Grad“ und „Junge“ werden in den Outputs nicht den Textdichtern und somit für „36 Grad“ Thomas Eckart, Inga Humpe, Peter Plate und Ulf Leo Sommer und für „Junge“ Jan Vetter zugeschrieben, sondern den Interpreten der jeweiligen Lieder, nämlich für „36 Grad“ der Band „2raumwohnung“ und für „Junge“ der Band „Die Ärzte“.
304
bb. Für die übrigen Outputs liegen die Voraussetzungen für einen Anspruch aufgrund der Verletzung des allgemeinen Persönlichkeitsrechts nicht vor.
305
Das allgemeine Persönlichkeitsrecht der Art. 1 Abs. 1, Art. 2 Abs. 1 GG ist als ein offenes Rahmenrecht gestaltet, dessen Ausprägungen und Grenzen jeweils im konkreten Einzelfall durch eine Abwägung der widerstreitenden grundrechtlich geschützten Belange bestimmt werden, bei der die besonderen Umstände des Einzelfalls sowie die betroffenen Grundrechte und Gewährleistungen der Europäischen Menschenrechtskonvention interpretationsleitend zu berücksichtigen sind. Nach höchstrichterlicher Rechtsprechung kommt ein Anspruch aufgrund einer Verletzung des allgemeinen Persönlichkeitsrechts in Betracht, wenn bei Vorliegen einer nicht vom Urheber geschaffenen Gestaltung Identitätsverwirrungen durch die wahrheitswidrige Zuschreibung der Urheberschaft an dieser Gestaltung bestehen könnten (BGH 09.11.2023, I ZR 203/22 Rn. 45 – E2). Abzugrenzen ist diese Konstellation von der Entstellung des eigenen Werks nach § 14 UrhG, bei der die Beziehung des Urhebers zu seinem Werk betroffen ist. Nach höchstrichterlicher Rechtsprechung ist damit die Anwendung des allgemeinen Persönlichkeitsrechts zum Schutz von Fehlzuordnungen damit in einem Fall der Zuordnung fremder Werke möglich (vgl. dazu auch BGH 08.06.1989, I ZR 135/87 – Emil Nolde). Eine solche Zuordnung ist vorliegend nicht gegeben. Die streitgegenständlichen Outputs stellen wie ausgeführt Umgestaltungen und Bearbeitungen im Sinne des § 23 Abs. 1 S. 1 UrhG dar und nicht freie Bearbeitungen nach § 23 Abs. 1 S. 2 UrhG.
306
Ein Bedürfnis für die Eröffnung des Schutzbereiches auch im vorliegenden Fall ist nicht gegeben. Die Benennung der Textdichterinnen und Textdichter als Urheber bei Umgestaltungen und Bearbeitungen ihrer Werke betrifft lediglich ihren beruflichen Kontext und somit ihre Sozial- und nicht ihre Privatsphäre. Die Sozialsphäre beschreibt den Bereich, in dem sich die persönliche Entfaltung von vornherein im Kontakt mit der Umwelt vollzieht, wie insbesondere beim beruflichen und politischen Wirken des Individuums (BGH 20.12.2011, VI ZR 261/10 Rn. 16). Der Persönlichkeitsschutz in der Sozialsphäre ist begrenzt und nur auf bestimmte Ausprägungen beschränkt. Im Fall schwerwiegender Auswirkungen auf das Persönlichkeitsrecht, etwa bei Stigmatisierung oder sozialer Ausgrenzung, sind auch Eingriffe in die Sozialsphäre des Betroffenen unzulässig (BGH 07.12.2004, VI ZR 308/03). Derart schwerwiegende Auswirkungen sind durch die streitgegenständlichen Outputs nicht gegeben.
307
b. Der Anspruch kann nicht wie geltend gemacht hilfsweise auf § 13 S. 2 UrhG gestützt werden Der Klägerin steht bereits nach §§ 97 Abs. 1 S. 1, 15 Abs. 1, 2, 16 Abs. 1, 19a, 23 Abs. 1 UrhG gegenüber den Beklagten der geltend gemachte Anspruch auf Unterlassung der bearbeiteten und umgestalteten Outputs zu. Die Beklagten dürfen die streitgegenständlichen Outputs nicht verwerten. Damit bleibt für einen Anspruch auf Unterlassung der Benennung der Urheberschaft an den bearbeiteten und umgestalteten streitgegenständlichen Liedtexten kein Raum; dem Anliegen der Klägerin wird bereits durch den umfassenden Unterlassungsanspruch Rechnung getragen. Ein Anspruch auf Unterlassung lediglich der Benennung wird nur in Konstellationen relevant, in denen der Urheber die Umgestaltung, Bearbeitung oder Entstellung etwa aufgrund der Einräumung von Nutzugsrechten dulden muss oder dies möchte (vgl. ÖOGH 16.07.2002, 4 Ob 164/02). Will oder kann der Urheber kein Unterlassen der Werkverwertung insgesamt beanspruchen, kann er als weniger einschneidende Maßnahme verlangen, dass ihm sein umgestaltetes Werk nicht namentlich zugeordnet wird (OLG Saarbrücken UFITA 79/1977, 364, 366 [Anlage B 55]; Dreier/Schulze/Specht-Riemenschneider, 8. Aufl. 2025, UrhG § 13 Rn. 32).
308
2. Die im Zusammenhang mit dem Unterlassungsanspruch geltend gemachten weiteren Ansprüche auf Auskunft, Schadenersatz und Abmahnkosten teilen das Schicksal des Unterlassungsanspruchs.
309
Die Kammer setzt den Rechtsstreit nicht entsprechend § 148 ZPO aus, um wie von der Klägerin mit Schriftsatz vom 12.06.2025 (Bl. 319/334 d.A.) beantragt ein Vorabentscheidungsersuchen nach Art. 267 Abs. 2 AEUV durchzuführen.
310
Das in Art. 267 AEUV vorgesehene Verfahren ist ein Instrument der Zusammenarbeit zwischen dem Unionsgerichtshof und den nationalen Gerichten, mit dem der Unionsgerichtshof Hinweise zur Auslegung des Unionsrechts gibt, die die nationalen Gerichte zur Entscheidung des bei ihnen anhängigen Rechtsstreits benötigen (EuGH 07.05.2024, Az. C 115/22). Als erstinstanzlichem Gericht liegt es nach Art. 267 Abs. 2 AEUV im eigenen Ermessen der Kammer, dem Unionsgerichtshof Fragen zur Vorabentscheidung vorzulegen, falls Zweifel an der Auslegung des Unionsrechts bestehen.
311
Die Kammer hat angesichts der vom Unionsgerichtshof bereits vielfach formulierten Hinweise zur Auslegung der Verwertungshandlungen der Vervielfältigung und öffentlichen Zugänglichmachung nach der InfoSoc-RL keine Zweifel an deren Auslegung. Da der vorliegende Sachverhalt für die Kammer deutlich bereits nicht vom Anwendungsbereich der Text und Data Mining Schranke nach Art. 4 DSM-RL erfasst wird, besteht kein Erfordernis, den Unionsgerichtshof zur Auslegung der Schranke anzurufen.
312
Von der Klägerin wird zur Begründung ihres Antrags insbesondere angeführt, in dem beim Unionsgerichtshof in der Rechtssache C-250/25 geführtem Vorabentscheidungsersuchen des Budapest Környéki Törvényszék, eingegangen am 03.04.2025 (Anlage K 9), leide die Vorlagefrage an einer unpräzisen Darstellung insbesondere des technischen Sachverhalts. Die Kammer ist überzeugt, dass der Unionsgerichtshof trotz dieser Schwierigkeit den Kern der Urheberrechtsproblematik, das Training eines Modells mit urheberrechtlich geschützten Informationen, erfassen und eine fundierte Entscheidung treffen wird. Einer Vorlage durch die Kammer bedarf es hierfür nicht.
313
Die Kostenentscheidung fußt auf § 92 Abs. 1 ZPO. Die Entscheidung über die vorläufige Vollstreckung beruht auf § 709 S. 1, 2 ZPO. Die Festsetzung der Teilsicherheiten folgt den Angaben der Klägerin zum Verhältnis der Teilstreitwerte.
314
Entgegen der Ansicht der Beklagten ist die Festsetzung einer Vollstreckungssicherheit in der von ihr beantragten Höhe nicht veranlasst. Die Beklagten begründen ihren Antrag mit einem entgangenen Gewinn infolge der Einstellung der Modelle für den Zeitraum von ca. 18 Monaten bis zur Berufungsverhandlung zuzüglich einer Spruchfrist.
315
Bereits der von den Beklagten genannte Zeitraum für die Berechnung eines Schadens ist nicht nachvollziehbar, da die Beklagten vortragen, das Training eines neuen Modelles benötige sechs Monate. Angesichts der geltenden Schadensminderungspflicht wäre den Beklagten das Training eines neuen Modelles zuzumuten und daher lediglich ein Zeitraum von 6 Monaten in Ansatz zu bringen. Aber auch für diesen Zeitraum kann keine Vollstreckungssicherheit aufgrund behaupteten entgangenen Gewinnes festgesetzt werden: Die Klägerin hat den von den Beklagten vorgetragenen Gewinnausfall zurecht als nicht substanziiert dargetan gerügt. Insbesondere haben die Beklagten lediglich einen pauschal bezifferten prozentualen Anteil an der Bruttomarge aus den Einnahmen der Abonnemententgelte behauptetet. Ebenfalls nicht konkret dargelegt und auch nicht näher erörtert haben die Beklagten, ob bei der Berechnung des behaupteten entgangenen Gewinns ersparte Aufwendungen berücksichtigt worden sind (vgl. OLG Düsseldorf, 02.02.2012, 2 U 91/11). Beweise haben die Beklagten nicht angeboten. gez.