15. Oktober 2024
Künstliche Intelligenz

Erstes Urteil Deutschlands zur urheberrechtlichen Zulässigkeit des KI-Trainings ergangen

Das Landgericht Hamburg hält die Vervielfältigung einer Fotografie im Rahmen der Anfertigung eines KI-Trainingsdatensatzes für zulässig.

Am 27. September 2024 verkündete das Landgericht Hamburg ein seit langem mit Spannung erwartetes Urteil. Erstmals hat ein deutsches Gericht über die Frage entschieden, ob Vervielfältigungen urheberrechtlich geschützter Inhalte, die im Zusammenhang mit dem Training von KI-Modellen vorgenommen werden, auch ohne Zustimmung der Rechteinhaber urheberrechtlich zulässig sind. Das Gericht bejahte diese Frage und stützte sich dabei maßgeblich auf die Vorschrift des § 60d UrhG (LG Hamburg, Urteil v. 27. September 2024 – 310 O 227/23).

Der von großer medialer Aufmerksamkeit begleitete KI-Urheberrechtsstreit eines Fotografen gegen den Verein LAION hat mit dem Urteil des Landgerichts Hamburg sein vorläufiges Ende gefunden. Aufgrund der zentralen urheberrechtlichen Fragen des Rechtsstreits ist jedoch davon auszugehen, dass das Verfahren in weitere Instanzen, möglicherweise bis zum Bundesgerichtshof und zum Europäischen Gerichtshof, getragen wird.

LAION hat im Rahmen eines Überprüfungs- und Analyseprozesses eine fremde Fotografie heruntergeladen

Der beklagte Verein LAION stellte öffentlich und kostenfrei einen Datensatz im Internet zur Verfügung, der zum Trainieren von KI-Systemen genutzt werden kann. Der Datensatz bestand aus 5,85 Milliarden Bild-Text-Paaren, die einerseits Hyperlinks zu im Internet öffentlich abrufbaren Bildern sowie andererseits jeweils eine Beschreibung des Bildinhalts in Textform enthielten.

Zur Schaffung dieses Datensatzes griff LAION auf einen bereits vorbestehenden Datensatz zurück, welcher von Dritten erstellt wurde und ebenfalls Bild-Text-Paare mit Hyperlinks zu Bildern enthielt. Die Bilder lud LAION herunter und ließ mithilfe einer Software überprüfen, ob die Textbeschreibungen in dem vorbestehenden Datensatz mit den dazugehörigen Bildern übereinstimmten. Bilder, bei denen dies nicht der Fall war, wurden aus dem Datensatz entfernt. Die Hyperlinks und Textbeschreibungen der restlichen Bilder wurden sodann in den neuen Datensatz überführt.

Gegenstand des Datensatzes, den LAION erstellte, war auch eine Fotografie des Fotografen, der im hiesigen Fall gegen LAION klagte. Er hatte die Fotografie an eine Bildagentur lizensiert, welche das Foto mit einem Wasserzeichen auf ihrer Webseite hochgeladen hatte.

Auf der Webseite der Bildagentur befand sich folgender Hinweis:

„RESTRICTIONS

YOU MAY NOT:

(…)

18. Use automated programs, applets, bots or the like to access the XXX.com website or any content thereon for any purpose, including, by way of example only, downloading Content, indexing, scraping or caching any content on the website.“ (Hinweis: “XXX.com“ ist die anonymisierte Fassung des Domain-Namens der Bild-Agentur-Webseite)

Der klagende Fotograf war der Auffassung, dass der im Rahmen des Analyseprozesses von LAION vorgenommene Download seiner Fotografie eine unzulässige Vervielfältigung gemäß § 16 UrhG darstellt. LAION wiederum berief sich in dem Prozess auf die urheberrechtlichen Schrankenregelungen des §§ 44b und 60d UrhG, die eine Vervielfältigung von urheberrechtlich geschützten Werken nach Ansicht von LAION im Rahmen des KI-Trainings erlauben würden.

LG Hamburg gestattet Vervielfältigung der Fotografie des Fotografen nach § 60d UrhG

Zentrale Frage des Urteils war, ob die sog. Text und Data Mining-Schranken Vervielfältigungen von urheberrechtlich geschützten Inhalten gestatten, die im Kontext des KI-Trainings vorgenommen werden. Das Urheberrechtsgesetz sieht sowohl in § 44b als auch in § 60d UrhG eine Erlaubnis vor, Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining vorzunehmen. Der Begriff „Text und Data Mining“ wird in § 44b Abs. 1 UrhG legaldefiniert und meint

„die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.“

Das Landgericht Hamburg entschied, dass die Vervielfältigung der Fotografie des Fotografen im Rahmen der Erstellung des Datensatzes von LAION von der Vorschrift des § 60d UrhG erlaubt war, da die Vervielfältigung zum Zwecke der Gewinnung von Informationen über „Korrelationen“ diente. Damit sei – so das Landgericht Hamburg – die Vervielfältigung als Maßnahme zum Zwecke des Text und Data Mining einzuordnen.

Die durch LAION gewonnenen Informationen über „Korrelationen“ bestanden in der (Nicht-)Übereinstimmung von Bildern und ihren textlichen Beschreibungen. Das Landgericht Hamburg hielt es in diesem Zusammenhang für unerheblich, dass der Datensatz letztlich auch für das Training von KI-Systemen verwendet werden könne, da es sich bei der Erstellung des Datensatzes allenfalls um einen dem KI-Training vorgelagerten Vorgang handele. Die bloße Absicht, zukünftige KI-generierte Inhalte erlangen zu wollen, sei kein taugliches Kriterium für die Beurteilung der rechtlichen Zulässigkeit der Erstellung des Trainingsdatensatzes als solchen.

Das Landgericht stellte weiterhin klar, dass LAION keine kommerziellen Zwecke verfolge und dass es die Vervielfältigung auch zu wissenschaftlichen Zwecken vornahm – eine zusätzliche Voraussetzung, welche die Vorschrift des § 60d UrhG aufstellt.

Vervielfältigung der Fotografie kann wohl nicht auf § 44b UrhG gestützt werden

Das Landgericht Hamburg erläuterte schließlich, dass sich LAION voraussichtlich nicht auf die Vorschrift des § 44b UrhG berufen könne.

Ähnlich wie § 60d UrhG gestattet auch § 44b UrhG die Vornahme von Vervielfältigungen urheberrechtlich geschützter Inhalte zum Zwecke des Text und Data Mining und findet – anders als § 60d UrhG – Anwendung unabhängig davon, ob die Vervielfältigung im Rahmen der wissenschaftlichen Forschung oder zu nicht-kommerziellen Zwecken stattfand.

Die Vervielfältigung ist jedoch unzulässig, wenn der Rechteinhaber einen Nutzungsvorbehalt gemäß § 44b Abs. 3 UrhG erklärt hat, welcher bei online zugänglichen Werken in „maschinenlesbarer Form“ erfolgen müsse.

Das Landgericht tendierte dazu, den auf der Webseite der Bildagentur enthaltenen Hinweis als einen solchen Nutzungsvorbehalt einzuordnen. Ein solcher könne auch von abgeleiteten Rechtsinhabern, wie einer Bildagentur ausgesprochen werden. Das Gericht deutete an, dass das Erfordernis der „Maschinenlesbarkeit“ auch dann erfüllt sei, wenn der Vorbehalt in natürlicher Sprache abgefasst sei, da schließlich KI-Anwendungen selbst mittlerweile natürliche Sprache verstehen und interpretieren können.

Das Landgericht hat die Frage der Einschlägigkeit des § 44b UrhG nicht abschließend entschieden, da es eine Erlaubnis der Vervielfältigung bereits auf Basis des § 60d UrhG herleitete.

Wesentliche urheberrechtliche Fragen, die sich im Zusammenhang mit dem Training von KI stellen, bleiben unbeantwortet

Gegenstand der Entscheidung des Landgerichts Hamburg ist nur eine frühe Stufe des KI-Trainings, nämlich die Erstellung eines Trainingsdatensatzes, der zudem die für das spätere Training zu verwendende Werke nicht unmittelbar, sondern nur mittelbar als Hyperlinksammlung enthielt. Die Entscheidung kann daher nicht für spätere Stufen des KI-Trainings verallgemeinert werden.

Ungeklärt ist insbesondere die Frage, wie die Nutzung des Trainingsdatensatzes unmittelbar für das KI-Training urheberrechtlich zu bewerten ist und ob die dabei entstehenden Vervielfältigungen geschützter Inhalte durch die Text und Data Mining-Schranken erlaubt sind. Denn Gegenstand der Nutzung der urheberrechtlich geschützten Inhalte ist dann nicht die bloße Ermittlung von „Korrelationen“ zwischen diesen Inhalten. Ziel ist es vielmehr, die Wesensmerkmale der Inhalte zu übernehmen, um auf dieser Grundlage die Gewichte der Neuronen des künstlichen neuronalen Netzes zu bilden, was nach unserer Einschätzung weit über die Zwecke des Text- und Data-Mining hinausgeht, das auf die bloße Ermittlung von Metainformationen gerichtet ist. Auch ist das Training der KI deutlich näher am Output der KI, der wiederum die normale Verwertung des Werkes, welches zum Training der KI verwendet worden ist,  durch den oder die Urhebende beeinträchtigen kann.

Wesentliche urheberrechtliche Fragen, die sich im Zusammenhang mit dem Training von KI stellen, sind auch nach diesem Urteil damit noch nicht beantwortet.

Auch die Ausführungen des Landgerichts Hamburg zu den Anforderungen an einen Nutzungsvorbehalt nach § 44b Abs. 3 UrhG sind mit Vorsicht zu genießen. Zum einen beruht das Urteil nicht auf diesen Erwägungen. Zum anderen ist nach unserer Einschätzung der Begriff der „Maschinenlesbarkeit“ im Hinblick auf die zugrundeliegende Interessenlage durchaus weit auszulegen, so dass auch ein in natürlicher Sprache abgefasster Nutzungsvorbehalt den Anforderungen des § 44b Abs. 3 UrhG genügen dürfte. Rechtssicherheit werden hier wohl erst die sicher zu erwartenden Entscheidungen des Bundesgerichtshofs oder des Europäischen Gerichtshofs schaffen.

Nutzung urheberrechtlich geschützter Inhalte für das KI-Training ohne Zustimmung der Rechteinhaber weiterhin mit Risiken verbunden

Vor diesem Hintergrund bestehen beim Training von KI-Modellen auch nach der Entscheidung des Landgerichts Hamburg weiterhin urheberrechtliche Risiken. Zwar wird der Entscheidung in der künftigen rechtlichen Diskussion eine gewisse Relevanz beigemessen werden, jedoch ist nochmals hervorzuheben, dass das Gericht nicht die Frage geprüft hat, ob das eigentliche Training von KI-Modellen ebenfalls unter die Ausnahmeregelungen der §§ 44b, 60d UrhG fällt. Die im Verfahren überprüfte Handlung der Beklagten betrifft einen Vorgang, der zeitlich deutlich vor dem eigentlichen KI-Training liegt und sich in technischer Hinsicht erheblich vom eigentlichen Training unterscheidet. Diese Unterschiede erfordern eine rechtliche Differenzierung, die möglicherweise zu einer abweichenden Bewertung führen könnte. Das Urteil des Landgerichts Hamburg stellt daher keinen urheberrechtlichen Freibrief für das KI-Training dar.

Auch in Bezug auf die durch die Entscheidung erfasste Konstellation der Erstellung einer Datensammlung zum Zweck des KI-Trainings ist das letzte Wort noch nicht gesprochen. Der Rechtsstreit wird aller Wahrscheinlichkeit nach in die nächste Instanz gehen. Das Landgericht Hamburg hat zudem bereits angedeutet, dass es den Fall als geeignet für eine Vorlagefrage beim EuGH erachtet.

Bis dahin sollten beim Training von KI – wie auch bereits jetzt – die Nutzungsvorbehalte auf Websites beachtet werden, selbst wenn diese in natürlicher Sprache formuliert sind.

Es bleibt, den Fortgang dieses Verfahrens sowie weitere gerichtliche Entscheidungen – auch aus dem Ausland – im Zusammenhang mit dem KI-Training aufmerksam zu beobachten.

Tags: KI KI-Training künstliche Intelligenz