Ein unabhängiges Expertengremium hat am 14. November 2024 den ersten Entwurf eines Praxisleitfadens für Anbieter von KI-Modellen mit Allgemeinem Verwendungszweck (im Folgenden: GPAI-Modelle) veröffentlicht.
Indem die Anbieter von GPAI-Modellen einen Praxisleitfaden befolgen, können sie gegenüber dem AI Office nachweisen, dass sie die in Art. 53-55 der KI-Verordnung (KI-VO) geregelten Anforderungen einhalten. Insbesondere zu den in Art. 53 Abs. 1 lit. c) und d) KI-VO enthaltenen urheberrechtlichen Anforderungen enthält der Entwurf erste wichtige Konkretisierungen, die in diesem Beitrag näher beleuchtet werden.
Ausgangspunkt: GPAI-Modelle
Nach dem Verständnis der KI-VO sind GPAI-Modelle (zu Deutsch: „KI-Modelle mit Allgemeinem Verwendungszweck“) KI-Modelle, welche eine erhebliche allgemeine Verwendbarkeit aufweisen und in der Lage sind, unabhängig von der Art und Weise ihres Inverkehrbringens ein weites Spektrum an Aufgaben zu erfüllen. Sie können zudem in eine Vielzahl von Downstream-KI-Systemen integriert werden. Sie werden typischerweise auf Basis enormer Datenmengen trainiert. Sie stellen die Basis der heute bekannten generativen KI-Systeme dar. Ihre Flexibilität und Leistungsfähigkeit machen sie zu einem wesentlichen Bestandteil der KI-Wertschöpfungskette, bringen jedoch auch spezifische Risiken mit sich.
An diese Risiken knüpft die KI-VO an und unterscheidet zwischen GPAI-Modellen mit und ohne systemisches Risiko. Ein systemisches Risiko liegt vor, wenn ein GPAI-Modell negative Auswirkungen auf Grundrechte, öffentliche Interessen oder die Gesellschaft insgesamt haben könnte. Zu den Kriterien zur Ermittlung solcher Risiken zählen die Rechenleistung eines Modells und seine Fähigkeit, weitreichende Entscheidungen zu beeinflussen.
Die Differenzierung nach Risiken ist essenziell, da sie die Pflichten der Anbieter direkt beeinflusst. Für Modelle mit systemischen Risiken sieht die KI-VO umfassende Prüfungs-, Dokumentations- und Berichtspflichten mit Blick auf die Ermittlung und Eindämmung solcher Risiken für die Anbieter von GPAI-Modellen vor. Modelle ohne systemisches Risiko gelten hingegen als weniger problematisch und unterliegen daher weniger strengen Vorgaben.
Art. 53 Abs. 1 lit. c) und d) regelt zudem für Anbieter aller GPAI-Modelle spezifische Pflichten mit urheberrechtlichem Bezug. Darüber, wie diese Pflichten konkret zu erfüllen sein werden, enthält der Entwurf des Praxisleitfadens erste wichtige Hinweise.
Praxisleitfaden soll Anbietern von GPAI-Modellen die Einhaltung der Anforderungen aus Art. 53 bis 55 KI-VO erleichtern
Die Entwicklung des ersten Entwurfs eines Praxisleitfadens für die Anbieter von GPAI-Modellen wird durch das AI Office koordiniert, das gemäß Art. 56 Abs. 1 KI-VO die Aufgabe hat, die Ausarbeitung von Praxisleitfäden für Anbieter von GPAI-Modellen zu fördern.
Sinn und Zweck des Praxisleitfadens ist es, Anbietern von GPAI-Modellen die Einhaltung der in Art. 53 bis 55 KI-VO geregelten Anforderungen zu erleichtern. Der Praxisleitfaden ist als Selbstregulierungstool konzipiert und zielt darauf ab, die Anforderungen der KI-VO praxisnah zu konkretisieren. Insbesondere bietet er Anleitungen zur Dokumentation, Risikobewertung und Einhaltung von Urheberrechten – Aspekte, die in der KI-VO nur abstrakt geregelt werden.
Der Praxisleitfaden soll konkrete Anweisungen zur Umsetzung der Regelungen der KI-VO enthalten, wie Vorgaben zur Einführung einer „Strategie zur Einhaltung des Urheberrechts der Union“ gemäß Art. 53 Abs. 1 lit. c) KI-VO. Art. 56 Abs. 9 KI-VO bestimmt, dass der Praxisleitfaden spätestens bis zum 2. Mai 2025 vorliegen muss.
An der Entwicklung des Praxisleitfadens wirken sowohl Anbieter von GPAI-Modellen selbst als auch Vertreter von Industrievereinigungen, der Zivilgesellschaft und der Wissenschaft mit ganz unterschiedlichen Expertisen mit. Die Erarbeitung des Praxisleitfadens erfolgt in vier Arbeitsgruppen. Die Arbeitsgruppen befassen sich mit unterschiedlichen Aspekten, wie z.B. mit Fragen der Einhaltung von Transparenz- und urheberrechtlichen Anforderungen der KI-VO (so etwa die Arbeitsgruppe 1), aber auch mit der Schaffung von Prinzipien für die Umsetzung von Maßnahmen zur Identifizierung, Bewertung und Eindämmung von systemischen Risiken, welche von GPAI-Modellen ausgehen können.
Der Entwurf ist im aktuellen Stadium (Fassung vom 14. November 2024) an mehreren Stellen noch abstrakt, gibt jedoch in vielerlei Hinsicht jedoch schon die Richtung vor, in die sich die weitere Konkretisierung des Praxisleitfadens entwickeln wird.
Konkretisierung der Pflichten mit Urheberrechtsbezug
Ein Schwerpunkt des Praxisleitfadens liegt auf der Bewertung und Minimierung von Risiken, die sich aus der Nutzung von GPAI-Modellen ergeben. Aber auch der Umgang mit urheberrechtlich geschützten Inhalten im Rahmen des Trainings von GPAI-Modellen wird geregelt.
Der Praxisleitfaden konkretisiert die in Artikel 53 Abs. 1 lit. c) und d) enthaltenen urheberrechtsbezogenen Pflichten der KI-VO näher. Art. 53 Abs. 1 lit. c) KI-VO verpflichtet Anbieter von GPAI-Modellen zur Einführung einer Strategie zur Einhaltung des EU-Urheberrechts. Art. 53 Abs. 1 lit. d) KI-VO bestimmt zudem, dass die Anbieter eine detaillierte Zusammenfassung der zum Training verwendeten Inhalte erstellen und veröffentlichen müssen.
Der Praxisleitfaden erläutert zu diesem Zweck konkrete Maßnahmen, die zur Einhaltung der Pflichten umzusetzen sind.
Einführung einer „Strategie zur Einhaltung des Urheberrechts der Union“
Der Entwurf des Praxisleitfadens bestimmt, dass die Strategie zur Einhaltung des Urheberrechts der Union den gesamten Lebenszyklus eines GPAI-Modells abdecken soll, einschließlich aller Änderungen und Fine-Tuning-Maßnahmen. Sie soll durch entsprechende organisatorische Maßnahmen und Verantwortungsaufteilungen innerhalb eines Unternehmens umgesetzt werden.
Die Strategie soll vorsehen, dass vor der Nutzung von fremden Datensätzen für das Training von GPAI-Modellen Anbieter eine urheberrechtliche Due-Diligence-Prüfung durchführen. Sie hat den Zweck, zu ermitteln, ob Dritte bei der Zusammenstellung der Datensätze den Nutzungsvorbehalt gemäß Art. 4 Abs. 3 der Richtlinie (EU) 2019/790 beachtet haben. Nach dieser Vorschrift dürfen solche urheberrechtlich geschützten Inhalte nicht für das Text und Data Mining genutzt werden, bei denen sich der Rechteinhaber diese Nutzung ausdrücklich vorbehalten haben.
Die Strategie soll aber auch nachgelagerte Maßnahmen umfassen: Anbieter müssen sicherstellen, dass Anwendungen, in die ein GPAI-Modell integriert wird, keine urheberrechtsverletzenden Ergebnisse erzeugen. Dies umfasst die Vermeidung von Überanpassungen (Engl.: over-fitting), die dazu führen könnten, dass geschützte Werke in identischer oder ähnlicher Form durch das GPAI-Modell reproduziert werden.
Einhaltung der Text- und Data-Mining-Schranke
Der Entwurf des Praxisleitfadens konkretisiert die Maßnahmen zur Einhaltung der Text und Data Mining-Schranke gemäß Art. 4 der Richtlinie (EU) 2019/790. Hiernach sind Vervielfältigungen von geschützten Werken zum Zwecke des Text und Data Minings zulässig, sofern der Rechteinhaber sich diese Nutzung nicht vorbehalten hat. Zumeist wird in diese Schranke auch die Erlaubnis hineingelesen, urheberrechtlich geschützte Inhalte zum Zwecke des Trainings von GPAI-Modellen zu vervielfältigen.
Von Rechteinhabern erklärte Nutzungsvorbehalte müssen identifiziert und eingehalten werden. Anbieter sollen sicherstellen, dass ihre Crawler Nutzungsvorbehalte von Rechteinhabern, welche im „Robot Exclusion Protocol (robots.txt)“ abgefasst sind, erkennen und befolgen. An dieser Stelle verpflichtet der Praxisleitfaden den unterzeichnenden Anbieter von GPAI-Modellen auch dazu, auf Einladung der EU-Kommission an der Schaffung eines gemeinsamen Standards zur Identifizierung und Einhaltung von Nutzungsvorbehalten mitzuwirken.
Zusätzlich dürfen Crawling-Aktivitäten keine unerlaubten Inhalte, wie solche von Piraterie-Webseiten umfassen, die beispielsweise in der „Commission Counterfeit and Piracy Watch List“ der EU-Kommission aufgeführt sind.
Transparenzanforderungen
Der Praxisleitfaden verpflichtet Anbieter von GPAI-Modellen zu umfangreicher Transparenz mit Blick auf die Einhaltung der urheberrechtsbezogenen Pflichten der KI-VO. Informationen müssen in klarer Form auf den Webseiten der Anbieter veröffentlicht und aktuell gehalten werden. Die Informationen müssen Details über die zur Entwicklung des GPAI-Modells eingesetzten Crawler enthalten.
Zudem müssen Anbieter eine zentrale Anlaufstelle einrichten, die Rechteinhabern eine schnelle Kommunikation mit den Anbietern ermöglicht. Anbieter sind verpflichtet, alle Datenquellen, die für das Training, Testen und Validieren verwendet wurden, sowie die entsprechenden Genehmigungen zu dokumentieren und Informationen hierüber dem AI Office auf Anfrage bereitzustellen.
Der erste Entwurf des Praxisleitfadens für GPAI-Modelle markiert einen wichtigen Meilenstein in der Regulierung von GPAI-Modellen in der EU
Besonders der Schutz urheberrechtlich geschützter Inhalte wird konsequent adressiert. Die Maßnahmen schaffen klare Strukturen für die Einhaltung des Urheberrechts und fördern die Transparenz.
Die weitere Ausarbeitung des Praxisleitfadens bis Mai 2025 bietet allen Interessengruppen die Chance, sich aktiv einzubringen und offene Fragen zu klären sowie Pflichten weiter zu konkretisieren. Die kommenden Monate werden zeigen, wie der Praxisleitfaden weiter verfeinert und letztlich umgesetzt wird, um eine verantwortungsvolle Entwicklung und Nutzung von GPAI-Modellen in Europa zu gewährleisten.