12. Januar 2026
Vervielfältigung Foto KI-Trainingsdatensatz
Künstliche Intelligenz

Vervielfältigung eines Fotos für Erstellung eines KI-Trainingsdatensatzes zulässig

Das OLG Hamburg bestätigt in Deutschlands erstem Fall zur Nutzung urheberrechtlich geschützter Inhalte im Zusammenhang mit dem KI-Training die Entscheidung der Vorinstanz.

Das Oberlandesgericht Hamburg hat mit Urteil vom 10. Dezember 2025 (Az. 5 U 104/24) die Entscheidung des Landgerichts Hamburg vom 27. September 2024 (Az. 310 O 227/23) bestätigt. Gegenstand des Verfahrens war ein Fall, in dem ein Fotograf einen Verein auf Unterlassung und Schadensersatz in Anspruch nahm, der eine seiner Fotografien im Rahmen der Erstellung eines für das KI-Training verwendbaren Trainingsdatensatzes vervielfältigt hatte. 

Das Oberlandesgericht Hamburg bestätigt die Abweisung der Klage durch das Landgericht Hamburg, stützte seine Entscheidung jedoch nicht (nur) auf die urheberrechtliche Schranke des § 60d UrhG, sondern auch auf die Vorschrift des § 44b UrhG. Es urteilte, dass die Nutzung der Fotografie durch den Verein schon aufgrund dieser Vorschrift zulässig sei und dass insbesondere kein wirksamer Nutzungsvorbehalt gemäß § 44b Abs. 3 UrhG vorlag.

Der KI-Trainingsdatensatz des beklagten Vereins

Der Kläger ist Fotograf und hatte eine Fotografie an eine Bildagentur lizenziert, welche das Foto mit einem Wasserzeichen auf ihrer Webseite hochgeladen hatte. Der beklagte Verein stellte öffentlich und kostenfrei einen Datensatz im Internet zur Verfügung, der zum Trainieren von KI-Systemen genutzt werden kann. Dieser Datensatz bestand aus 5,85 Milliarden Bild-Text-Paaren, die Hyperlinks zu im Internet öffentlich abrufbaren Bildern sowie jeweils eine Beschreibung des Bildinhalts in Textform enthielten. Die eigentlichen Bilder waren also nicht unmittelbar im Trainingsdatensatz gespeichert, sondern nur mittelbar über dort hinterlegte Links abrufbar.

Zum Zwecke der Erstellung des Trainingsdatensatzes griff der Verein auf einen bereits vorbestehenden Datensatz zurück, extrahierte die URLs zu den Bildern und lud die Bilder von ihrem jeweiligen Speicherort herunter. Im Anschluss wurden die Bilder mittels einer Software daraufhin überprüft, ob die im vorbestehenden Datensatz bereits hinterlegten Bildbeschreibungen tatsächlich mit dem Inhalt der einzelnen Bilder und Fotos übereinstimmten. Inhalte, bei denen Text und Bildinhalt nicht hinreichend übereinstimmten, wurden herausgefiltert. Auch die streitgegenständliche Fotografie des Klägers wurde in diesem Prozess erfasst, heruntergeladen und wie beschrieben analysiert.

Vervielfältigung stellt „Text und Data Mining“ gemäß § 44b UrhG dar

Das Oberlandesgericht stellte fest, dass die von dem beklagten Verein vorgenommene Vervielfältigung zum Zwecke des Text und Data Mining gemäß § 44b Abs. 1 UrhG erfolgt ist. Gemäß § 44b Abs. 1 UrhG bezeichnet „Text und Data Mining“ die „automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen“.

Der beklagte Verein hatte die Fotografie heruntergeladen, um ihren Bildinhalt mittels einer Software zu analysieren und mit der bisher für diese Fotografie hinterlegten Bildbeschreibung abzugleichen. Nach Auffassung des Oberlandesgerichts Hamburg stellt dieser Vorgang ein „Text und Data Mining“ gemäß § 44b Abs. 1 UrhG dar. 

Die Feststellung, ob ein konkretes Bild mit einer Bildbeschreibung zusammenpasst, stelle nach Ansicht des Gerichts eine „Korrelation“ im Sinne des § 44b Abs. 1 UrhG dar. Im Bereich der Statistik werde der Begriff „Korrelation“ auch zur Beschreibung von Zusammenhängen zwischen bestimmten Erscheinungen verwendet. Der Begriff umfasst auch die wechselseitige Beziehung von Gegenständen. Das Zusammenpassen von Bild und Text stellt eine solche wechselseitige Beziehung dar. Jedenfalls wäre aber – so das Oberlandesgericht – der Zusammenhang zwischen Bild und Text auch als „sonstige“ Information gem. § 44b Abs. 1 UrhG anzusehen.

Das Gericht hob hervor, dass es irrelevant sei, ob der beklagte Verein mit der Analyse letztlich auch das Ziel verfolgte, mithilfe des Datensatzes es einer KI zu ermöglichen, werkübergreifende Muster zu erkennen (etwa im Rahmen des KI-Trainings). Bereits der Abgleich zwischen Bild und Bildbeschreibung stelle eine Analyse zum Zwecke der Gewinnung von Informationen gemäß § 44b Abs. 1 UrhG dar. Es käme nicht darauf an, ob das spätere Training generativer KI-Modelle die Voraussetzungen des § 44b Abs. 1 UrhG erfüllt. 

Das Gericht stellte in diesem Zusammenhang klar, dass die Vorschriften zum Text und Data Mining (§§ 44b und 60d UrhG) nicht dahingehend einschränkend auszulegen sind, dass sie Maßnahmen, welche der Vorbereitung des KI-Trainings dienen, wie etwa die Erstellung eines KI-Trainingsdatensatzes, nicht erfassen und verwies hier auf die Gesetzesbegründung, die hervorhebt, dass das Text und Data Mining für das maschinelle Lernen als Basis Technologie für Künstliche Intelligenz von besonderer Bedeutung sei. 

Nutzungsvorbehalt erfüllt nicht die Voraussetzungen des § 44b Abs. 3 UrhG

§ 44b Abs. 1 UrhG erlaubt die Vervielfältigung geschützter Inhalte zum Zwecke des Text und Data Minings allerdings nicht unbeschränkt. Die Inhalte dürfen in solchen Fällen nicht genutzt werden, in denen ein Nutzungsvorbehalt erklärt wurde, welcher bei online zugänglichen Werken „in maschinenlesbarer Form“ erfolgen muss. In seinem Urteil äußert sich das Oberlandesgericht ausführlich zu den Anforderungen, welche der Nutzungsvorbehalt erfüllen muss.

Die Beweislast für das Fehlen eines Nutzungsvorbehalts gem. § 44b Abs. 3 UrhG liegt beim Nutzer, also bei demjenigen, der sich auf die Schranke beruft. Den Rechtsinhaber trifft aber eine sekundäre Darlegungslast: er muss darlegen, dass ein Nutzungsvorbehalt vorhanden war und wie dieser ausgestaltet war, wozu gegebenenfalls auch die Maschinenlesbarkeit des Nutzungsvorbehalts gehöre. 

Der Nutzungsvorbehalt wurde hier von der Foto-Agentur erklärt und nicht vom Kläger selbst. Nach Ansicht des Oberlandesgerichts kann sich der Kläger aber dennoch hierauf berufen. Dafür spreche, dass in Fällen, in denen ein Fotograf seine eigenen Bilder mithilfe eines Anbieters von Stockfotos vertreibt, sich zugleich damit einverstanden erklärt, dass der Vertrieb der Rechte an den Bildern nach den Bedingungen dieses Anbieters erfolgt. 

Der Wortlaut des von der Foto-Agentur erklärten Nutzungsvorbehalts lautete:

You may not … use automated programs, applets, bots or the like to access the …com website or any content thereon for any purpose, including, by way of example only, downloading Content, indexing, scraping or caching any content on the website.

Zwar wird im Nutzungsvorbehalt das „Text und Data Mining“ nicht ausdrücklich benannt, jedoch ist dort generell die automatische Auswertung der Inhalte untersagt, sodass darunter nach Auffassung des Oberlandesgerichts auch der automatisierte Download zum Zwecke des Bild-Text-Abgleichs seitens des Beklagten gehört. Nach Ansicht des Oberlandesgerichts erfüllt der Nutzungsvorbehalt jedoch nicht die Voraussetzung der Maschinenlesbarkeit gemäß § 44b Abs. 3 S. 2 UrhG.

Das Gericht führte aus, dass „maschinenlesbar“ nicht nur erfordere, dass der textlich wiedergegebene Nutzungsvorbehalt maschinell erfasst werden kann, sondern auch, dass er in dem Sinn maschinell interpretiert werden kann, dass er dazu führt, dass die vom Vorbehalt erfassten Inhalte nicht ausgewertet werden sollen.

Der Nutzungsvorbehalt konnte im vorliegenden Fall zwar maschinell ausgelesen werden, da er sowohl in den Nutzungsbedingungen als auch im Quellcode der Webseite der Webseite der Foto-Agentur enthalten war. Der Kläger hat jedoch nicht dargelegt und bewiesen, dass zum Zeitpunkt des Downloads des Bildes, welcher bereits in der zweiten Hälfte des Jahres 2021 erfolgte, die technischen Möglichkeiten für maschinelles Textverständnis vorhanden waren. Das Gericht betonte, dass die Veröffentlichung von generativen KI-Systemen, welche ein solches Textverständnis beherrschen, erst Ende 2022 erfolgte.

Zulässigkeit der Foto-Nutzung unter Berücksichtigung des Drei-Stufen-Tests

Das Gericht prüfte auch die Zulässigkeit der streitgegenständlichen Vervielfältigung der Fotografie unter Berücksichtigung des Drei-Stufen-Tests, der in Art. 5 Abs. 5 der InfoSoc-Richtlinie verankert ist. Hiernach dürfen urheberrechtliche Ausnahmen und Beschränkungen, wozu auch § 44b UrhG gehört, nur in bestimmten Sonderfällen angewandt werden, in denen die normale Verwertung des Werks oder des sonstigen Schutzgegenstands nicht beeinträchtigt wird und die berechtigten Interessen des Rechtsinhabers nicht ungebührlich verletzt werden. 

Das Gericht bejahte im vorliegenden Fall die Voraussetzungen des Drei-Stufen-Tests. Die normale Verwertung des Werkes oder des sonstigen Schutzgegenstandes werde nicht beeinträchtigt. Bei der hier stattgefundenen Verwertung handele es sich um einen rein internen Vorgang beim beklagten Verein. Auf der dritten Stufe überwiegen nach Ansicht des Gerichts die Interessen des beklagten Vereins an der Vervielfältigung die Beeinträchtigung des Rechtsinhabers. Die Vervielfältigung war geboten, um den Bild-Text-Abgleich vorzunehmen. Zugunsten des Beklagten spielte es nach Auffassung des Oberlandesgerichts außerdem eine Rolle, dass der Beklagte nicht kommerziell tätig ist und die Möglichkeit bestand, die streitgegenständliche Nutzung durch einen wirksamen Vorbehalt zu verhindern.

Nutzung auch gemäß der Schranke des § 60d UrhG zulässig

Das Oberlandesgericht stellte zudem fest, dass die Nutzung der Fotografie des Klägers auch gemäß der Schranke des § 60d UrhG zulässig ist. Auf diese Vorschrift hatte sich das Landgericht Hamburg erstinstanzlich maßgeblich gestützt. Die Nutzung erfolgte für Zwecke der wissenschaftlichen Forschung. Dazu zählt die eigentliche forschende Tätigkeit ebenso wie das Darstellen ihrer Ergebnisse. Bereits die Erstellung des Datensatzes durch den beklagten Verein erfüllt nach Auffassung des Oberlandesgerichts die Anforderungen an wissenschaftliche Forschung. Die Erstellung des Datensatzes stelle ein methodisches, auf einen späteren Erkenntnisgewinn gerichtetes und nachprüfbares Vorgehen dar, das der angewandten Forschung zuzurechnen sei.

Erstellung von KI-Trainingsdatensätzen: Was Rechteinhaber und Nutzer nun beachten müssen

Das Urteil ist noch nicht rechtskräftig, da das Gericht die Revision zugelassen hat. Es ist wahrscheinlich, dass Revision eingelegt und der BGH über den Fall entscheiden wird. 

Das Oberlandesgericht hat bestätigt, dass die Vervielfältigung urheberrechtlich geschützter Inhalte zum Zwecke der Erstellung eines Trainingsdatensatzes von der Text und Data Mining-Schranke gedeckt sein kann. Die Entscheidung ist aber nicht als Blankett-Erlaubnis für Nutzer von urheberrechtlich geschützten Werken zu verstehen. Ob die Nutzung von urheberrechtlich geschützten Inhalten für die Erstellung von Trainingsdatensätzen zulässig ist, ist eine Frage des Einzelfalles. 

Im vorliegenden Fall bestand ein nicht unwichtiges Detail des Trainingsdatensatzes darin, dass dieser keine urheberrechtlich geschützten Inhalte speicherte, sondern lediglich die Links auflistete, über welche die Werke abgerufen werden konnten. Der Fall könnte bereits anders zu entscheiden sein, wenn der Trainingsdatensatz dauerhaft Werke speichert oder eine (rein) kommerzielle Nutzung erfolgt.

Auch für Rechteinhaber ist diese Entscheidung wegweisend. Sie klärt wichtige Fragen zu den Voraussetzungen, die ein Nutzungsvorbehalt erfüllen muss. Zudem gibt das Oberlandesgericht wichtige Hinweise zur Darlegungs- und Beweislast mit Blick auf das Vorliegen und die Wirksamkeit eines Nutzungsvorbehalts.

Der Umstand allein, dass ein Nutzungsvorbehalt maschinell ausgelesen werden kann, genügt für die Einordnung als „maschinenlesbar“ nicht. Erforderlich ist zusätzlich, dass der Nutzungsvorbehalt von Softwareprogrammen oder KI-Systemen auch so interpretiert wird, dass die vom Nutzungsvorbehalt erfassten Inhalte nicht zum Zwecke des Text und Data Minings genutzt werden dürfen.

In unserem CMS-Blog halten wir Sie in unserer Blog-Serie „Künstliche Intelligenz“ fortlaufend mit aktuellen Beiträgen zu diesen Themen auf dem Laufenden. Sie können diese Blog-Serie über den RSS-Feed abonnieren und werden von uns über neue Beiträge benachrichtigt. Im Rahmen dieser Blog-Serie sind bereits Beiträge erschienen zu Themen wie: GEMA vs. OpenAI: Urheberrechtliche Grundsatzentscheidung des Landgerichts München I ergangen, KI-generierter Softwarecode in der Due DiligenceKI-Update für Arbeitgeber: Referentenentwurf des KI-VO-DurchführungsgesetzesUPDATE: Der Referentenentwurf zum KI-Marktüberwachungs- und Innovationsförderungsgesetz, und OLG Köln: KI-Training mit Nutzerdaten ist zulässig. Weitere Informationen finden Sie zudem auf unserer Insight-Seite: Implikationen für Künstliche Intelligenz und Recht | CMS Deutschland.

Haben Sie Anregungen zu weiteren Themen rund um KI, die in unserer Blog-Serie „Künstliche Intelligenz“ nicht fehlen sollten? Schreiben Sie uns gerne über blog@cms-hs.com.

Tags: Foto KI-Trainingsdatensatz künstliche Intelligenz Urheberrecht