Digital Future

Rechte an trainierter KI

Während die neue KI-Verordnung der EU primär regulatorische Herausforderungen mit sich bringt, stellen sich auch im Bereich des geistigen Eigentums Fragen rund um „Künstliche Intelligenz“, „maschinelles Lernen“ und „neuronale Netze“. Klar ist, dass manuell programmierte Software urheberrechtlich geschützt sein kann. Konsens besteht auch dahingehend, dass von KI produzierte Ergebnisse (z.B. DALL-E-Bilder oder ChatGPT-Texte) prinzipiell keinen urheberrechtlichen Schutz genießen. Doch wem gehören die Rechte an der KI selbst?

Training von KI

Im Bereich von Urheberrechten ist zwischen der untrainierten Ausgangssoftware und der trainierten Software zu unterscheiden: KI-Systeme auf Basis von neuronalen Netzen arbeiten nämlich nicht einfach nur die Algorithmen einer Ausgangs-Software ab. Diese beinhaltet vielmehr Anweisungen, wie die im Training „gefütterten“ Daten durch die einzelnen Neuronen des Netzwerks auszuwerten und zu gewichten sind, um diese so „intelligent“ zu machen.

Die Trainingsmethoden können dabei grob wie folgt unterschieden werden: Beim „überwachten Lernen“ ist für den gefütterten Input bereits der richtige Output bekannt, sodass die Fehlerquote durch Abgleich mit der „Input-Output-Paare“ ermittelt werden kann. Beim „verstärkenden Lernen“ erhält die KI positives oder negatives Feedback, welche von ihr vorgenommenen Aktionen erwünscht bzw. unerwünscht sind. Beim „unüberwachten Lernen“ erhält die KI keinerlei Feedback, sondern ordnet den Output nach eigenen Kriterien; diese Methode eignet sich daher besonders zur Clusteranalyse, um unbekannte Muster zu entdecken. 

Unabhängig von der gewählten Methode, findet das Training nicht auf der Ebene des Software-Quellcodes statt, sondern auf der Ebene des Objektcodes. Der Quellcode selbst wird durch das Training hingegen nicht verändert. Die Trainingsdaten können – auch durch Analyse des gewichteten neuronalen Netzes – nicht mehr rekonstruiert werden (sog. „Black-Box-Effekt“).

Untrainierte Software

Klar dürfte sein, dass die Rechte am Quellcode dem jeweiligen Entwickler zustehen bzw. gem. § 69b Abs. 1 UrhG seinem Arbeitgeber. Das Training der KI ändert hieran nichts. Sie fallen durch das Training der KI auch nicht ohne weiteres Weg. Eine Benutzung der trainierten KI ohne Zustimmung des Inhabers der Rechte an der Ausgangssoftware dürfte daher regelmäßig eine Rechtsverletzung darstellen. Dies dürfte sogar schon für das bloße Training gelten, soweit die Ausgangssoftware hierfür genutzt wird.

Trainierte Software

Bei trainierter KI ist fraglich, ob (i) die trainierte Software überhaupt urheberrechtlich schutzfähig ist und (ii) wem etwaige Urheberrechte zustehen. Beide Fragen hängen wegen des Schöpferprinzips im Urheberrecht eng zusammen und sind bislang nicht abschließend geklärt.

Geschützt sind „Programme in jeder Gestalt“ (§ 69a Abs. 1 UrhG) sowie „alle Ausdrucksformen eines Computerprogramms“ (§ 69a Abs. 2 Satz 1 UrhG). Urheberrechtsschutz besteht also sowohl am Quellcode als auch am (untrainiertem) Objektcode; letzter ist nur die kompilierte, maschinenlesbare Ausdrucksform. Der Programmierer des Quellcodes ist damit zugleich Inhaber der Urheberrechte am daraus hervorgehenden Objektcode. Beim Training neuronaler Netzen entsprechen sich Quellcode und trainierter Objektcode jedoch gerade nicht mehr. Durch das Gewichten der Neuronen erhält der Objektcode zusätzliche Informationen, die im Quellcode gerade nicht vorhanden sind. Gerade diese Informationen sind es, die die Software „intelligent“ machen. Die wohl überwiegende Literaturmeinung geht deshalb davon aus, dass die trainierte Software und die Ausgangssoftware gerade nicht zwei Ausdrucksformen derselben Software sind. Damit setzt sich das Urheberrecht des Programmierers an der Ausgangssoftware aber auch nicht an dem trainierten Teil der Software fort. Soweit er auf das weitere Training keinen Einfluss hat, erschöpft sich sein Urheberrecht also in der Ausgangssoftware.

Dies wirft die Folgefrage auf, wem dann die Rechte an der trainierten Software zustehen – sofern diese überhaupt schutzfähig ist. Voraussetzung hierfür ist, dass das Ergebnis eine individuelle geistige Schöpfung darstellt (§ 69a Abs. 3 Satz 1 UrhG). Dabei dürfte an den Gestaltungsvorgang, d.h. das Training selbst anzuknüpfen sein: Sofern dieses rein automatisierter stattfindet und keinerlei intellektuellen menschlichen Input mehr erfordert, dürfte es de lege lata an der urheberrechtlichen Schutzfähigkeit fehlen. Dies liegt insbesondere beim oben angesprochenen „unüberwachten Lernen“ nahe – zumindest, wenn sich der Trainings-Beitrag auf eine ungezielte Zurverfügungstellung von Trainingsdaten beschränkt.

Spannender wird es, wenn in der Durchführung des Trainings noch eine intellektuelle, schöpferische Leistung gesehen werden kann. Beim „überwachten Lernen“ oder „bestärkenden Lernen“ ist urheberrechtlicher Schutz daher nicht von vornherein völlig ausgeschlossen. Als Schöpfer, d.h. Inhaber der Urheberrechte, kommt sinnvoll dabei nur derjenige in Betracht, der die Datenauswahl bzw. das Training veranlasst und gesteuert hat. Maßgeblich ist dann, inwieweit das Training tatsächlich noch der Kontrolle der „Schöpfer“ unterlag, d.h. eine individuelle geistige Schöpfung darstellt. Ob hierfür die bloße gezielte Datenauswahl ausreicht, ist fraglich. Tendenziell dürfte zumindest eine weitere Steuerung (z.B. durch Output-Kontrolle) erforderlich sein. Hier zeigen sich Parallelen zur computergestützten Softwareentwicklung, wobei dort in der Regel die Frage der Individualität kritischer ist; beim maschinellen Lernen dürfte der Schwerpunkt hingegen beim Erfordernis einer geistigen Schöpfung liegen.

Fazit

Die Inhaberschaft von Rechten an KI-basierter Software ist derzeit noch weitgehend ungeklärt. Im Rahmen von vertraglichen Beziehungen kann im Innenverhältnis eine entsprechende Vertragsgestaltung Abhilfe schaffen (z.B. Verwendungsbeschränkungen und Geheimhaltungsverpflichtungen). Gegenüber Dritten dürften primär faktische Zugangsbeschränkungen abhelfen – zumindest soweit gegen deren Nutzung nicht aus Urheberrechten an der untrainierten Ausgangssoftware vorgegangen werden kann.

Weiterleiten