10. August 2021
Text Data Mining
Urheberrecht

Text und Data Mining nach dem neuen Urheberrecht

Eine der Neuerungen, die zum 7. Juni 2021 über die Urheberrechterichtlinie (DSM-RL) den Weg in das deutsche Urhebergesetz gefunden hat, ist das Text und Data Mining.

Kannte das deutsche Urheberrecht seit dem UrhWissG immerhin bereits das Text und Data Mining zu wissenschaftlichen Zwecken (§ 60d UrhG), sieht der neue § 44b UrhG nun zusätzlich auch Text und Data Mining zu sonstigen, d.h. auch kommerziellen Zwecken vor. 

Mining als Innovationstreiber in der europäischen Industrie

§ 44b Abs. 1 UrhG definiert Text und Data Mining als

die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.

Typische Beispiele sind Algorithmen, die automatisiert Websites durchforsten und nach bestimmten Kriterien massenhaft Daten sammeln. Diese Rohdaten dienen in Wissenschaft oder Industrie z.B. zur Analyse bestimmter Sachverhalte, zur Verhaltenserkennung oder Prozessanalyse. Anwendungsfälle reichen vom Zielgruppenmarketing über die Betrugserkennung bis zum Training von KIs.

Die DSM-RL sorgt dafür, dass das Text und Data Mining in allen Mitgliedstaaten ermöglicht wird. Dabei soll eine klare Rechtsgrundlage für das kommerzielle Text und Data Mining Erleichterungen für die Wirtschaft bringen und Innovationen anregen. 

Anwendungsbereich: Zweck des Mining und erlaubte Handlungen

Die Vorschrift des § 44b UrhG ist als Erlaubnisnorm ausgestaltet. Demnach wird die Vervielfältigung von rechtmäßig zugänglichen Werken zum Mining erlaubt (Abs. 2 Satz 1). „Werke″ schließt dabei Datenbanken und Computerprogramme mit ein und auch sonstige Schutzrechte (z.B. Leistungsschutzrechte von ausübenden Künstlern und Herstellern von Tonträgern) werden erfasst. Irrelevant ist nach Abs. 1, ob nur ein einziges oder aber mehrere Werke betroffen sind. Zudem ist das Mining von „digitalen″ und „digitalisierten″ Werken erlaubt. Mit Letzterem sind solche Werke gemeint, die zunächst in analoger Form vorliegen und erst durch das Mining digitalisiert werden.

„Rechtmäßig zugänglich″ sind Werke, deren Zugriff dem Nutzer, also demjenigen, der das Mining durchführt, rechtlich erlaubt ist. Das trifft z.B. auf frei im Internet zugängliche Werke wie öffentliche Websites zu. Andere Werke sind rechtmäßig zugänglich, wenn der Nutzer über eine entsprechende Lizenz verfügt. Die Gesetzesbegründung nennt hierzu als Beispiel Werke, die unter Open Access Bedingungen veröffentlicht wurden.

Löschung von Vervielfältigungen bei Entfall der „Erforderlichkeit“

Gemäß § 44b Abs. 2 Satz 1 UrhG sind die im Zuge des Text und Data Mining entstandenen Vervielfältigung zu löschen,

wenn sie für das Text und Data Mining nicht mehr erforderlich sind.

Damit weicht das UrhG von der entsprechenden Formulierung in der DSM-RL ab, die als Anknüpfungspunkt für die Löschpflicht den Zweck des Mining wählt. Relevant ist das bspw. für das Training von KIs, da hier eine stetige Interaktion mit Nutzern wichtig ist und häufig ältere Daten wiederverwendet werden, etwa für spätere Evaluationen. In diesem Fall ist der eigentliche Mining-Prozess also bereits abgeschlossen, es besteht aber weiterhin ein berechtigtes Interesse an der Nutzung der gewonnenen Daten. Für diesen Anwendungsbereich wäre es also vorteilhafter, wenn eine Löschpflicht erst nach Zweckfortfall entstünde – so, wie es die DSM-RL vorsieht.

Die Gesetzesbegründung äußert sich nicht dazu, was unter der „Erforderlichkeit″ zu verstehen ist, sondern bezeichnet den § 44b Abs. 2 Satz 1 UrhG schlicht als „Umsetzung″ der DSM-RL. Da das Kriterium der „Erforderlichkeit″ im deutschen Urheberrecht traditionell eng ausgelegt wird, wäre eine Übernahme des Wortlauts der Richtlinie wünschenswert gewesen. Ob die Zweckbindung in die „Erforderlichkeit″ hineingelesen werden kann, wird die Gerichte beschäftigen.

Nutzungsvorbehalt des Rechteinhabers – Grenzen des Text und Data Mining

§ 44b Abs. 3 UrhG sieht vor, dass Rechteinhaber eine Nutzung ihrer öffentlich zugänglichen Werke zum Text und Data Mining untersagen können (sog. Opt-Out). Für den Fall online zugänglicher Werke hat ein solcher Nutzungsvorbehalt in maschinenlesbarer Form zu erfolgen. Diese Anforderung trägt dem Umstand Rechnung, dass Text und Data Mining typischerweise automatisiert abläuft. Der Algorithmus soll also selbst erkennen können, wann ein online verfügbares Werk vom Mining auszunehmen ist. Nach der Gesetzesbegründung soll der Data Miner die Beweislast dafür tragen, dass ein wirksamer Nutzungsvorbehalt im Zeitpunkt des Text und Data Mining fehlt. 

Hinzuweisen ist in diesem Zusammenhang noch auf zwei Dinge: Zum einen gilt die Anforderung des maschinenlesbaren Nutzungsvorbehalts nur für online zugängliche Werke. Für analog verfügbare Werke kann der Rechteinhaber einen Vorbehalt auch mit anderen Mitteln aussprechen; Erwägungsgrund 18 der DSM-RL nennt etwa vertragliche Vereinbarungen und einseitige Erklärungen.

Zum anderen sind die Regelungen des § 44b UrhG dispositiv, wie insbesondere der Umkehrschluss zu § 60g Abs. 1 UrhG zeigt, nach dem die Regelungen zum Text und Data Mining für wissenschaftliche Zwecke unabdingbar sind. Würden also Rechteinhaber und Data Miner einen entsprechenden Vertrag abschließen, könnte das Mining auch ohne maschinenlesbaren Hinweis vertraglich ausgeschlossen werden. Spannend könnten damit Konstellationen werden, in denen ein Nutzungsvorbehalt in online zugänglichen AGB steht. Nach der Gesetzesbegründung müssen auch Nutzungsvorbehalte innerhalb von AGB maschinenlesbar sein, um den Anforderungen von § 44b Abs. 3 UrhG zu genügen. Sofern die AGB aber wirksam in einen Vertrag zwischen Rechteinhaber und Data Miner einbezogen wurden, stellt sich die Frage, ob der Vorbehalt ausnahmsweise auch in nicht maschinenlesbarer Form wirksam ist – und zwar aufgrund der vertraglichen Abdingbarkeit von § 44b UrhG als solchem.

Text und Data Mining bleibt vergütungsfrei

Für das kommerzielle Mining sieht § 44b UrhG keine Vergütungspflicht zugunsten der Urheber vor. Zwar ist bspw. die Kritik des Deutschen Journalistenverbands, Urheber sollten daran partizipieren, wenn privatwirtschaftliche Unternehmen ihre Inhalte gewinnbringend weiterverwerten, nicht von der Hand zu weisen. Auf der anderen Seite dient die neue Regelung gerade dazu, den Prozess des automatisierten Mining zu vereinfachen – dazu trägt auch die Vergütungsfreiheit bei. Darüber hinaus bleibt den Rechteinhabern die Möglichkeit, einen Nutzungsvorbehalt zu erklären – ggf. mit der Option, das Mining gegen ein Entgelt zuzulassen. Die möglichen Einschränkungen der Urheber erscheinen daher vor dem Hintergrund des wirtschaftlichen Potenzials des Mining vergleichsweise gering.

Sinnvolle Regelung für den Wirtschaftsstandort Europa

Wagen wir eine Prognose: § 44b UrhG wird den Bedürfnissen eines modernen Wirtschaftsstandorts angemessen Rechnung tragen. Nicht umsonst gehören die Normen zum Text und Data Mining zu den von den verschiedenen Interessenverbänden überwiegend positiv aufgenommenen Bestandteilen der ansonsten sehr umstrittenen DSM-RL. Zwar ist in den nächsten Jahren zu einzelnen Aspekten dieser Norm, insbesondere zum Nutzungsvorbehalt, mit klärenden Gerichtsentscheidungen zu rechnen. Insgesamt trägt § 44b UrhG aber dennoch für Data Miner erheblich zur bezweckten Rechtssicherheit bei.

Tags: Data Mining Text Vergütung