24. Juni 2024
Wer eine KI trainieren will, bspw. um eigene Geschäftsabläufe zu optimieren oder um spezifischen Content zu erstellen, steht häufig vor der Frage, ob er die KI mit urheberrechtlich geschütztem Material trainieren darf, ohne eine Erlaubnis der Urheber dafür einzuholen.
Grundsätzlich zulässig sofern kein Nutzungsvorbehalt
Die Zulässigkeit der Nutzung urheberrechtlicher Inhalte für das Training einer KI richtet sich wohl nach § 44b Urheberrechtsgesetz (UrhG). Die Vorschrift betrifft das Text und Data Mining, definiert als die Vervielfältigung von Werken für die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. Die Vorschrift wurde bereits zum 7. Juni 2021 aufgrund der Urheberrechtsrichtlinie (EU) 2019/790 („DSM-Richtlinie“) in das deutsche Urhebergesetz eingefügt. Obwohl der EU-Gesetzgeber diese Angebote in ihrer heutigen Erscheinungsform also noch gar nicht vor Augen hatte, ist § 44b UrhG auf das Trainieren solcher generativen KI-Systeme wohl anwendbar.
Nach § 44 b Urheberrechtsgesetz (UrhG) ist die Vervielfältigung von Werken für das Text und Data Mining zulässig, wenn die Werke rechtmäßig zugänglich sind und der Rechtsinhaber sich die bezeichnete Nutzung nicht vorbehalten hat. Dieser Nutzungsvorbehalt ist bei online zugänglichen Werken nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt. Er kann laut Gesetzesbegründung „auch im Impressum oder in den Allgemeinen Geschäftsbedingungen (AGB) enthalten sein, sofern er auch dort maschinenlesbar ist.“ Unklar ist allerdings, welche technischen Anforderungen für eine Maschinenlesbarkeit im Sinne der Vorschrift erfüllt sein müssen; ein in natürlicher Sprache verfasster Vorbehalt reicht insoweit wohl nicht aus. Hier fehlt es bislang an einem anerkannten Standard.
Für analog verfügbare Werke kann der Rechteinhaber den Vorbehalt auch mit anderen Mitteln aussprechen, bspw. im Wege vertraglicher Vereinbarungen oder einseitiger Erklärungen.
Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind.
Die Schranke des § 44b UrhG gilt entsprechend gegenüber den sog. Leistungsschutzrechten wie bspw. dem Presseverlegerleistungsschutzrecht, dem Recht an Lichtbildern, dem Recht der ausübenden Künstler oder Tonträgerhersteller oder dem Recht des Datenbankherstellers.
In den USA etwa gibt es keine dem § 44b UrhG vergleichbare Vorschrift. Dort ist für die in Rede stehende Problematik das „Fair Use“-Prinzip von Bedeutung, mithin ein vergleichsweise unbestimmter Maßstab, über dessen Anwendung für das Training generativer KI von den US-Gerichten bereits in diversen Gerichtsverfahren zu befinden war.
Ausreichender Abstand der KI-Ergebnisse zu den geschützten Werken
Denkbar ist freilich auch, dass von der KI generierte Inhalte urheberrechtlich geschützten Inhalten, mit denen die KI trainiert wurde, so nahe kommen, dass dadurch eine Verletzung von Urheber- oder Leistungsschutzrechten an den Trainingsinhalten begründet wird. Bei Texten kann das bspw. dann der Fall sein, wenn die KI Texte oder Textteile nicht in eigenen Worten wiedergibt, sondern wörtlich übernimmt.
Zur Vermeidung einer Rechtsverletzung wäre also sicherzustellen, dass die von der KI generierten Inhalte ausreichenden Abstand zu den Trainingsinhalten wahren.
Ausblick: Die KI-Verordnung trägt zur Vermeidung von Urheberrechtsverletzungen bei
In der KI-Verordnung, die im Verlauf dieses Jahres und über die kommenden Jahre hinweg stufenweise in Kraft tritt, werden urheberrechtliche Fragen zwar nur am Rande berührt. Allerdings fördern die Vorgaben der KI-Verordnung methodisch auch den Urheberschutz. So sind Anbieter von KI-Modellen mit allgemeinem Verwendungszweck nach der KI-Verordnung gehalten
- eine technische Dokumentation des KI-Modells bereitzustellen
- Informationen und Dokumentation zur Integration des KI-Modells in die KI-Systeme anderer Anbieter bereitzustellen
- eine Strategie zur Einhaltung des Urheberrechts und insbesondere des eingangs dieses Artikels erörterten Nutzungsvorbehalts zu entwickeln
- eine hinreichend detaillierte Zusammenfassung der für das Training des KI-Modells verwendeten Inhalte zu veröffentlichen.
Der urheberrechtliche Nutzungsvorbehalt soll von den KI-Modell-Anbietern dabei auch dann zu beachten sein, wenn die urheberrechtlich relevanten Handlungen für das Training der KI außerhalb der EU erfolgen (bspw. in den USA), auch wenn das betreffende ausländische Urheberrecht einen entsprechenden Nutzungsvorbehalt nicht kennt. Wie sich das mit dem im Urheberrecht geltenden Territorialitätsprinzip vereinbaren lässt, wonach jeweils das Urheberrecht desjenigen Staates Anwendung findet, in dem die urheberrechtlich relevanten Handlungen erfolgen, wird man sehen müssen.
Fazit
Grundsätzlich ist das Training einer KI mit urheberrechtlich geschützten Inhalten nach deutschem Recht (und EU-Recht) wohl zulässig, sofern die Inhalte rechtmäßig zugänglich sind und der Rechtsinhaber sich die bezeichnete Nutzung nicht vorbehalten hat. Bei online zugänglichen Werken muss der Nutzungsvorbehalt in maschinenlesbarer Form erfolgen. Wie genau ein Nutzungsvorbehalt „in maschinenlesbarer Form“ wirksam erklärt werden kann, ist bislang unklar.
Die Trainingsdaten sind, soweit urheberrechtlich geschützt, zu löschen, wenn sie für das Training der KI nicht mehr erforderlich sind.
Die Inhalte, die mit der KI generiert werden, müssen ausreichenden Abstand zu urheberrechtlich geschützten Inhalten wahren, mit denen die KI trainiert wurde.
Anbieter von KI-Modellen müssen demnächst eine Strategie zur Einhaltung des Urheberrechts und des o.g. Nutzungsvorbehalts entwickeln.
Rechtsanwalt Marc Dimolaidis LL.M.