9. Januar 2025
GPAI-Modell Praxisleitfaden
Künstliche Intelligenz

UPDATE – GPAI-Modelle und Urheberrecht: Zweiter Entwurf eines Praxisleitfadens veröffentlicht

Der zweite Entwurf des Praxisleitfadens für GPAI-Modellanbieter enthält Konkretisierungen u.a. zur Einführung einer Copyright Policy.

Am 19. Dezember 2024 wurde der zweite Entwurf eines Praxisleitfadens für Anbieter von KI-Modellen mit Allgemeinem Verwendungszweck (im Folgenden: GPAI-Modelle) veröffentlicht. Im Vergleich zum ersten Entwurf, der bereits im November 2024 erstellt wurde, enthält die neue Entwurfsfassung detailliertere Konkretisierungen der Pflichten, welche der AI Act für Anbieter von GPAI-Modellen regelt. Unter anderem konkretisiert der zweite Entwurf die nach Art. 53 Abs. 1 lit. c) KI-Verordnung (KI-VO) einzuführende Strategie zur Einhaltung des Urheberrechts der Union (Copyright Policy), welche in diesem Beitrag näher erläutert wird.

Praxisleitfäden als Selbstregulierungstool für Anbieter von GPAI-Modellen

Der im August 2024 in Kraft getretene AI Act regelt die Einführung eines Praxisleitfadens für Anbieter von GPAI-Modellen. Mit der Umsetzung der Konkretisierungen, welche der Praxisleitfaden vorsieht, können Anbieter von GPAI-Modellen die Einhaltung der Pflichten nachweisen, welche der AI Act mit Blick auf GPAI-Modelle regelt (Art. 53 Abs. 4, Art. 55 Abs. 2 KI-VO).

Der zweite Entwurf des Praxisleitfadens enthält nunmehr für die einzelnen Pflichten sog. Key Performance Indicators (KPI), anhand derer die Umsetzung der Pflichten des AI Acts für Anbieter von GPAI-Modellen gemessen werden kann. 

Der Praxisleitfaden wird gegenwärtig von einem Expertengremium erarbeitet, an dem Vertreter unterschiedlicher Interessengruppen aus der Industrie sowie der Wissenschaft und Forschung beteiligt sind. Die finale Fassung des Praxisleitfadens soll am 2. Mai 2025 veröffentlicht werden.

Urheberrechtliche Aspekte beim Training und Vertrieb von GPAI-Modellen

GPAI-Modelle stellen die Basis für viele der aktuell bekannten und verwendeten generativen KI-Systeme dar. GPAI-Modelle werden häufig mithilfe sehr großer Mengen an urheberrechtlich geschützten Inhalten trainiert. Es ist nach wie vor ungeklärt, ob die Nutzung urheberrechtlich geschützter Inhalte, wie z.B. Texte, Fotografien, Filme oder Musik zum Zwecke des KI-Trainings von der sog. Text-und-Data-Mining-Schranke erlaubt wird. Es handelt sich hierbei um eine gesetzliche Erlaubnis, welche in § 44b UrhG geregelt ist und die im Wesentlichen die Vervielfältigung von urheberrechtlich geschützten Inhalten zum Zwecke des „Text und Data Minings“ gestattet, worunter die automatisierte Analyse von Inhalten verstanden wird, um daraus Informationen über Muster, Trends und Korrelationen zu gewinnen.

Bisher nicht geklärt ist, ob auch das KI-Training unter den Begriff des „Text und Data Minings“ fällt. Auch die erst kürzlich im September 2024 ergangene Entscheidung des Landgerichts Hamburg hat diese Frage letztlich nicht geklärt. Die Verfasser des Praxisleitfadens problematisieren diesen Aspekt nicht, sondern gehen implizit davon aus, dass die Schranke grundsätzlich auch das KI-Training erlaubt. Auf diese Annahme stützen sich im Wesentlichen auch die Konkretisierungen der Pflichten der KI-VO mit urheberrechtlichem Bezug, die im Praxisleitfaden enthalten sind. Anbieter von GPAI-Modellen sollten sich jedoch der Tatsache bewusst sein, dass die Frage der Anwendbarkeit der Text und Data Mining-Schranke nach wie vor ungeklärt ist und die Rechtfertigung des KI-Trainings mithilfe dieser Schranke nach wie vor mit urheberrechtlichen Risiken verbunden ist.

Copyright Policy

Art. 53 Abs. 1 lit. c) KI-VO verpflichtet Anbieter von GPAI-Modellen zur Einführung einer „‘Strategie zur Einhaltung des Urheberrechts der Union‘“ im Englischen auch „Copyright Policy“ genannt.

Entsprechend den Regelungen im Praxisleitfaden meint die Copyright Policy letztlich ein Paket an organisatorischen Maßnahmen, die sicherstellen sollen, dass während der einzelnen Phasen der Entwicklung und des Vertriebs des GPAI-Modells, einschließlich seines Trainings, urheberrechtliche Vorschriften vom Anbieter des GPAI-Modells weitgehend beachtet und eingehalten werden. Die Copyright Policy soll vom Anbieter in einem Dokument aufgezeichnet und aktuell gehalten werden. Der Anbieter soll zudem eine Zusammenfassung der Copyright Policy auf seiner Webseite veröffentlichen und Personen in seinem Unternehmen benennen, welche die Umsetzung und Einhaltung der Copyright Policy überwachen. Von einigen der Umsetzungsmaßnahmen, welche die Copyright Policy umfasst, sind kleine und mittelständische Unternehmen ausgenommen.

Der Schwerpunkt der Maßnahmen, welche von der Copyright Policy umfasst sein müssen, liegt auf der Phase der Entwicklung und des Trainings des GPAI-Modells. Die Copyright Policy muss Maßnahmen sowohl für den Fall vorsehen, in welchem Datensätze zum Zwecke des Trainings von Dritten erworben werden als auch auf für den Fall, dass der Anbieter selbst Datensätze erstellt und auf urheberrechtlich geschützte Inhalte zugreift.

Möchte der Anbieter einen Datensatz von einem Dritten für das Training des eigenen GPAI-Modells erwerben, muss er nach dem Entwurf des Praxisleitfadens eine Copyright Due Diligence-Prüfung durchführen. Der Anbieter muss angemessene und verhältnismäßige Anstrengungen unternehmen, um Zusicherungen des Dritten dahingehend einzuholen, dass die Daten in dem Datensatz in Übereinstimmung mit dem Urheberrecht zur Erstellung des Datensatzes genutzt wurden. Die Zusicherungen sind auf Plausibilität zu prüfen. Die Copyright Due Diligence-Prüfung muss dokumentiert werden.

In dem Fall, in welchem der Anbieter selbst einen Datensatz zum Training seines GPAI-Modells erstellen möchte, muss er angemessene und verhältnismäßige Anstrengungen unternehmen, um sicherzugehen, dass er nur urheberrechtlich geschützte Inhalte nutzt, auf die er rechtmäßig Zugriff hat. In gleicher Weise soll sichergestellt werden, dass der Anbieter lediglich solche Inhalte nutzt, bei denen die Rechteinhaber keinen Nutzungsvorbehalt erklärt haben. Zu diesem Zweck muss der Anbieter sicherstellen, dass Nutzungsvorbehalte, welche in etwaigen Robot Exclusion Protocols (robots.txt) erklärt werden, erkannt und beachtet werden. Die Umsetzung dieser Maßnahmen muss dokumentiert und zum Teil veröffentlicht werden.

Die Anbieter von GPAI-Modellen sollen zudem angemessene und verhältnismäßige Anstrengungen unternehmen, um sicherzustellen, dass die zum KI-Training genutzten Inhalte zudem nicht von Webseiten stammen, welche dafür bekannt sind, geschützte Inhalte auf rechtswidrige Weise öffentlich zugänglich zu machen (sog. piracy websites).

Nach dem Entwurf des Praxisleitfadens sollen Anbieter auch Maßnahmen ergreifen, die sicherstellen, dass das von ihnen entwickelte GPAI-Modell ohne Urheberrechtsverletzungen von Dritten eingesetzt wird. Die Anbieter sollen etwa nach besten Möglichkeiten ein sog. Overfitting des GPAI-Modells vermeiden, wodurch das Risiko entstehen kann, dass das KI-System, in welches das GPAI-Modell später integriert wird, Outputs erzeugt, die identisch oder im Wesentlichen ähnlich sind mit Inhalten, die zum Training des Modells verwendet wurden. Die Acceptable Use Policy, welche Anbieter von GPAI-Modellen aufsetzen sollen, soll zudem die Nutzung des KI-Modells zu urheberrechtswidrigen Zwecken untersagen.

Schließlich sollen Anbieter von GPAI-Modellen eine Kontaktperson in ihrem Unternehmen benennen, welche für die Entgegennahme von Beschwerden von Rechteinhabern mit Blick auf eine rechtswidrige Nutzung ihrer Werke für das Training des GPAI-Modells zuständig sind.

Umsetzungsfrist läuft am 2. August 2025 ab

Die bisher veröffentlichten Entwürfe geben lediglich ein vorläufiges Bild der Inhalte der finalen Fassung des Praxisleitfadens wieder. Es werden nicht notwendigerweise alle im aktuellen Entwurf enthaltenen Konkretisierungen auch ihren Weg in den am 2. Mai 2025 zu veröffentlichenden Praxisleitfaden finden. Es handelt sich um ein „work-in-progress“.

Trotz der vorläufigen Natur der Entwürfe des Praxisleitfadens, sollten sich Anbieter von GPAI-Modellen jedoch bereits jetzt mit den darin enthaltenen Konkretisierungen befassen. Sie geben wichtige Hinweise darauf, wie sie die Pflichten des AI Acts umzusetzen haben. Die Pflichten sind Teil des 5. Kapitels der KI-VO, welches grundsätzlich bereits ab dem 2. August 2025 Anwendung finden wird. Bis dahin sollten insbesondere die erforderlichen Maßnahmen für die Errichtung der Copyright Policy umgesetzt sein.

Es werden in Kürze weitere Entwurfsfassungen des Praxisleitfadens veröffentlicht, die Aufschluss über weitere Konkretisierungen der Pflichten für Anbieter von GPAI-Modellen geben werden. Wir werden die Ausarbeitung des Praxisleitfadens weiterverfolgen und hierüber an dieser Stelle berichten.

Tags: GPAI-Modell Praxisleitfaden