Die rasante Entwicklung der Künstlichen Intelligenz (KI) hat in den letzten Jahren beeindruckende Fortschritte gemacht. Mit diesen technologischen Innovationen gehen aber auch rechtliche Herausforderungen einher. Ein aktuelles Beispiel ist die Klage der GEMA gegen OpenAI, das Unternehmen hinter dem KI-basierten Sprachmodell ChatGPT. Im Kern geht es um die Frage, ob und in welchem Umfang urheberrechtlich geschützte Werke für das Training von KI-Modellen wiw ChatGPT verwendet werden dürfen.
Hintergrund: Die Rolle von GEMA und OpenAI (ChatGPT)
Die GEMA (Gesellschaft für musikalische Aufführungs- und mechanische Vervielfältigungsrechte) ist die deutsche Verwertungsgesellschaft, die die Urheberrechte von über 95.000 Mitgliedern vertritt. Sie sorgt dafür, dass Komponisten, Textdichter und Musikverleger für die Nutzung ihrer Werke angemessen vergütet werden.
OpenAI ist ein US-amerikanisches Unternehmen, das sich auf die Entwicklung von KI-Technologien spezialisiert hat. Eines ihrer bekanntesten Produkte ist ChatGPT, ein Sprachmodell, das in der Lage ist, menschenähnliche Texte zu erzeugen. Dieses Modell wurde mit einer Vielzahl von Texten trainiert, um seine Fähigkeiten kontinuierlich zu verbessern.
Der Vorwurf: Unlizenzierte Nutzung von Songtexten durch ChatGPT
Laut GEMA wurde ChatGPT unter anderem mit urheberrechtlich geschützten Texten trainiert, darunter auch Songtexte aus dem Repertoire der GEMA-Mitglieder. OpenAI habe hierfür jedoch keine Lizenz erworben und die Urheber für die Nutzung ihrer Werke nicht vergütet.
Bei der Eingabe einfacher Befehle gibt der Chatbot die Originaltexte der Lieder wieder, mit denen das System offensichtlich trainiert wurde. Während andere Internetdienste für die Nutzung der Texte bezahlen, bediene sich OpenAI "systematisch und unter bewusster Inkaufnahme von Urheberrechtsverletzungen an den Inhalten der Urheberinnen und Urheber".
Die rechtliche Grundlage: Urheberrecht und Lizenzpflicht
Das Urheberrechtsgesetz (UrhG) schützt die Rechte der Urheberinnen und Urheber an ihren Werken. Das UrhG sieht vor, dass grundsätzlich jede Nutzung eines geschützten Werkes der Zustimmung des Urhebers bedarf. § 19a UrhG regelt die öffentliche Zugänglichmachung von Werken ("Internetrecht").
Im Falle von ChatGPT wirft die GEMA OpenAI vor, keine entsprechende Lizenz für die Nutzung der Songtexte erworben zu haben. Dies betrifft sowohl das Training des Modells als auch das Wiedergeben der Texte durch den Chatbot.
Kann sich OpenAI auf das Text- und Data Mining berufen?
Eine der zentralen Fragen, die das Landgericht München zu klären hat, wird sein, ob sich Open AI auf die Urheberrechtsschranke des Text- und Data-Mining (§ 44b UrhG) berufen kann. Diese Vorschrift erlaubt das automatisierte Durchsuchen des Internets und das Sammeln von Daten, auch aus urheberrechtlich geschützten Werken, zu Analysezwecken. Ziel ist es, Forschung und Entwicklung durch die Verarbeitung großer Datenmengen zu erleichtern.
Ob diese Schranke auch das Training von KI-Modellen umfasst, ist allerdings umstritten. Das Landgericht Hamburg hat kürzlich (LG Hamburg, Urteil vom 27.09.2024, Az. 310 O 227/23) die Auffassung vertreten, dass die Erstellung von KI-Trainingsdatensätzen als Text- und Datamining im Sinne des § 44b UrhG angesehen werden kann. Eine abschließende Entscheidung musste das Gericht jedoch nicht treffen, da es die Vervielfältigungshandlung bereits von § 60d UrhG (Text- und Datamining zu wissenschaftlichen Zwecken) erfasst sah.
Hat die GEMA einen wirksamen Nutzungsvorbehalt erklärt?
Allerdings sieht § 44b Abs. 3 UrhG einen Nutzungsvorbehalt vor, der es den Rechteinhabern ermöglicht, die Nutzung ihrer Werke für Text- und Datamining zu untersagen. Bei online zugänglichen Werken muss dieser Vorbehalt in maschinenlesbarer Form erfolgen, um wirksam zu sein. Das Landgericht Hamburg neigt in seiner Entscheidung dazu, auch einen in natürlicher Sprache verfassten Nutzungsvorbehalt als "maschinenlesbar" anzusehen, da moderne KI-Systeme in der Lage sind, solche Texte zu verarbeiten. Ein textlicher Hinweis auf einer Website, der die maschinelle Nutzung von Inhalten untersagt, könnte demnach als ausreichender Nutzungsvorbehalt angesehen werden.
Die GEMA erklärte hierzu, dass sie für ihre Mitglieder ausdrückliche Nutzungsvorbehalte geltend gemacht habe. Diese besagen, dass Werke aus ihrem Repertoire nur nach Erwerb einer entsprechenden Lizenz für das Training von KI-Systemen genutzt werden dürfen. Damit soll sichergestellt werden, dass die Urheberinnen und Urheber angemessen an den Einnahmen beteiligt werden, die durch KI-Systeme erzielt werden. OpenAI hatte diese Lizenzen jedoch nicht eingeholt.
Das Landgericht München muss nun entscheiden, ob im Fall GEMA gegen OpenAI die gesetzlichen Voraussetzungen der Schranke des § 44 b UrhG vorliegen und ob die GEMA einen Nutzungsvorbehalt für ihre Mitglieder wirksam ausgeübt hat. Damit nicht genug, stellt sich noch ein drittes Problem.
Originalgetreue Wiedergabe von Liedtexten durch ChatGPT zulässig?
Neben der Problematik des KI-Trainings wirft der Fall eine weitere spannende Rechtsfrage auf: Stellt die originalgetreue Wiedergabe der Songtexte durch ChatGPT eine urheberrechtlich relevante Nutzung dar? Dieser Aspekt ist bislang weitgehend ungeklärt. Für die GEMA stellt die originalgetreue Wiedergabe der Texte eine klare Urheberrechtsverletzung dar, da sie nicht von einer Schranke wie dem Text- und Data-Mining (§ 44 b UrhG) gedeckt ist.
Ausblick
Die Klage der GEMA gegen OpenAI stellt einen wichtigen Präzedenzfall dar, der die Schnittstelle zwischen technologischer Innovation und Urheberrecht beleuchtet. Er verdeutlicht die Notwendigkeit, klare rechtliche und regulatorische Rahmenbedingungen für den Einsatz von KI zu schaffen, um sowohl die Rechte der Urheber zu schützen als auch die Weiterentwicklung der Technologien zu fördern.
Es bleibt abzuwarten, wie das Landgericht München entscheiden wird und welche Auswirkungen das Urteil auf die Praxis der KI-Entwicklung haben wird. In jedem Fall wird das Urteil Signalwirkung haben - sowohl für die GEMA und ihre Mitglieder als auch für die gesamte KI-Branche.