Zum Hauptinhalt springen

Rechtsfragen zur generativen KI.

Rack, Fabian
In: ABI Technik, Jg. 44 (2024-02-01), Heft 1, S. 39-47
Online academicJournal

Rechtsfragen zur generativen KI  Legal Questions Regarding Generative AI 

Der Beitrag gibt einen Einstieg in ausgewählte Rechtsfragen der generativen KI. Der Blick richtet sich auf Betreiber, die fremde Materialien einsammeln, um ihre KI-Modelle zu trainieren. Die hierfür geltende gesetzliche Grundlage und ihre Grenzen werden dargestellt. Außerdem wird beleuchtet, was aus Nutzersicht im Hinblick auf fremde Urheberrechte zu beachten ist und wann eigene Urheberrechte beim Einsatz generativer KI entstehen. Auch datenschutzrechtliche Fragestellungen werden thematisiert.

The article provides an introduction to selected legal issues of generative AI. The focus is on operators who collect external materials in order to train their AI models. The applicable legal basis and its limits are presented. Furthermore, the article highlights what users need to consider regarding third-party copyrights and when their own copyright issues arise when using generative AI. Data protection legal issues are also addressed.

Keywords: Generative KI; Urheberrecht; KI-Kunst; generative AI; copyright law; AI art

1 Rechtsperspektiven im Kontext generativer KI

Dieser Beitrag stellt Rechtsfragen von generativer KI (Künstlicher Intelligenz) im Überblick dar. Zwei Perspektiven werden beleuchtet: Welche Voraussetzungen gelten für das Trainieren von KI-Modellen und in welchem rechtlichen Rahmen agieren KI-Systeme, die eine generative KI zur Verfügung stellen oder fremde Sprachmodelle nutzen (Betreiberperspektive)? Was muss bei der Verwendung generativer KI beachtet werden (Nutzungsperspektive)? Beide Perspektiven stellen zugleich Rechte derer dar, die im Kontext generativer KI möglicherweise beeinträchtigt sind.

Als eine Einführung und Diskussionsgrundlage zu einigen Rechtsfragen von generativer KI ist dieser Artikel primär auf Allgemeinverständlichkeit bedacht und enthält allgemeine Ausführungen und Überlegungen, befasst sich also nicht mit einem KI-System im Speziellen. Schließlich bietet der Beitrag angesichts der Vielfalt an ungeklärten Rechtsfragen Vorschläge und Denkanstöße an.

In welchen Ausprägungen Rechtsfragen generativer KI beleuchtet werden müssen, hängt stark vom Kontext ihres Einsatzes ab. Im Folgenden liegt der Fokus stärker auf Urheberrechtsfragen aus dem Bereich des Kulturschaffens, beschränkt sich aber nicht hierauf.

2 Betreiberperspektive: KI-Modelle bilden, KI-Systeme anbieten

Aus der Sicht von Betreibern generativer KI stellt sich die Frage, ob fremde Texte, Bilder, Videos oder Audios verwendet werden dürfen, um KI-Modelle mit ihnen zu trainieren. Diese politisch derzeit umstrittene Frage kann unter dem geltenden EU-Urheberrecht bejaht werden.

2.1 Trainieren eines Modells mit Werken und Wissen der Welt

Basis der KI-Modelle ist das maschinelle Lernen, ein Prozess, der auch als Training bezeichnet wird. Im Rahmen des Trainings analysiert die KI große Mengen an digitalen Informationen, um Muster zu erkennen. Nach einer Lernphase ist sie in der Lage, ähnliche Muster selbst zu generieren oder zu reproduzieren. „Muster" bezieht sich dabei auf die Anordnung der Elemente, wie Buchstaben oder Wörter in Texten, Pixel in Bildern oder Töne in Musik. Nachdem eine ausreichende Menge an Informationen verarbeitet wurde, kann die KI musterbasierte Inhalte erstellen. Angesteuert wird generative KI durch die Prompts, also die menschlichen Befehle.

Die Modelle werden häufig gebildet, indem Materialien aus dem Internet oder anderen Quellen herangezogen werden. Denkbar ist auch, dass die Modelle mit Materialien trainiert werden, die die Betreiber selbst erstellt haben und bei denen sie die Nutzungsrechte im vollen Umfang besitzen. Dies ist etwa bei der Photoshop/Firefly-KI der Fall, bei der Adobe auf eigene Stockfotos zurückgreifen kann.

Aktuell wird darum gestritten, ob Betreiber generativer KI fremde Inhalte ohne Zustimmung einsammeln dürfen. Kreative klagen in den USA gegen den ChatGPT-Betreiber OpenAI. Sie wollen verhindern, dass OpenAI und andere Anbieter die Werke von Kreativen ohne Einverständnis einsammeln und ihre Modelle damit trainieren. OpenAI begehe aus Sicht der Klagenden mit der Nutzung fremder Werke „systematischen Diebstahl im großen Stil" und „eklatante und schädliche Verletzungen ihrer eingetragenen Urheberrechte". Organisiert wird die Klage vom US-Autorenzusammenschluss Authors Guild. In Deutschland wiederum richten sich die Forderungen von Interessenverbänden an den Gesetzgeber. Es wird im Ergebnis dasselbe wie in den USA gefordert, nämlich dass lernende Systeme nicht ohne Zustimmung fremde Werke einsammeln dürfen. So offen der Aushandlungsprozess ist – die derzeit geltende Rechtslage zu dieser Frage ist im Ausgangspunkt recht klar, zumindest in Deutschland und der EU: Gerade die jüngeren Reformen des Urheberrechts im Kontext Big Data und Machine Learning scheinen darauf zugeschnitten, dass Large-Language-Modelle entstehen können und „die KI" aus bestehendem Schaffen lernen darf.

Die rechtliche Beurteilung der KI-Modelle ist allerdings nicht trivial, weil der Entstehungsprozess häufig nicht transparent ist. Eine Ausnahme bildet hier das Sprachmodell LlaMA des Internetkonzerns Meta, dessen Entstehungsprozess Meta in einem Paper beschreibt. Es soll daher an dieser Stelle als Beispiel dienen. Meta stellt das Modell mittlerweile in Version 2 zum lokalen Betrieb der Allgemeinheit zur Verfügung und informiert in einem Paper darüber, aus welchen Quellen die Daten für das Modell stammen.

Dem Paper zufolge finden sich im Modell LLaMA unter anderem Wikipedia-Dumps, fünf CommonCrawl-Dumps mit Daten aus jeweils drei Milliarden Webseiten, Code aus Github sowie Daten aus Project Gutenberg, einer Plattform, die gemeinfreie Literatur zur Verfügung stellt. LLaMA dient hier exemplarisch, um auf die Urheberrechtsfragen des Trainings aus den unterschiedlichen Quellen einzugehen:

2.1.1 Gemeinfreie Werke (im Beispiel Project Gutenberg)

Das Project Gutenberg stellt als Volltextsammlung Weltliteratur von Autorinnen und Autoren zur Verfügung, deren Urheberrechte erloschen sind. Diese Werke sind „gemeinfrei". Das bedeutet, dass Reproduktionen und Bearbeitungen erlaubt sind und nicht von einer Zustimmung abhängen. Das Urheberrecht setzt damit auch keine Einschränkungen für die Aufnahme gemeinfreier Werke in ein Trainingsmodell. Dies gilt allgemein auch für Digitalisate oder Transkripte gemeinfreier Bilder, Tonmaterialien oder Texte, deren Urheber schon über 70 Jahre tot sind.

Frei von urheberrechtlichen Restriktionen sind auch Materialien, die nie urheberrechtlich geschützt waren. Das sind etwa Fakten wie Messdaten oder auch KI-generierte Werke, deren Urheberrechtsfreiheit später im Beitrag dargestellt wird.

2.1.2 Geschützte Werke im Netz (im Beispiel CommonCrawl)

Den Hauptanteil des Meta-Modells LLaMA machen die CommonCrawl-Dumps aus. So finden sich dort fünf CommonCrawl-Dumps, die sich aus Daten aus Milliarden von Webseiten speisen. CommonCrawl ist eine gemeinnützige Organisation, die das Web seit rund 15 Jahren crawlt und ihre Archive und Daten kostenlos der Öffentlichkeit zur Verfügung stellt.

Spätestens an dieser Stelle wird man davon ausgehen können, dass urheberrechtlich geschützte Texte und andere Werke in diese Datensätze eingeflossen sind. Ein Ansatzpunkt des Urheberrechts ist die Frage danach, ob Kopien von Werken angefertigt werden. Ist dies der Fall, so benötigt man hierfür entweder eine individuelle Erlaubnis oder eine gesetzliche Regelung, die die Anfertigung dieser Kopien erlaubt.

Sofern also beim Crawling der Webseiten Kopien von Texten, Bildern usw. angefertigt werden, ist dies ein urheberrechtlich relevanter Vorgang (eine „Vervielfältigung"). Zur Vereinfachung sei hier angenommen, Meta hätte das Netz selbst gecrawlt und allgemein zugängliche Texte, Bilder und Audios zum Aufbau des Modells kopiert. Unter dem deutschen bzw. europäischen Urheberrecht kommt eine rechtliche Grundlage für das Anfertigen dieser Vervielfältigungen in Betracht: die Text-und-Data-Mining-Erlaubnis (TDM-Erlaubnis).

Hierbei handelt es sich um eine gesetzliche Bestimmung, die es erlaubt, Kopien anzufertigen, mit dem Ziel einer „automatisierte(n) Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen". Die Regelung wurde auf EU-Ebene 2019 verabschiedet, gewiss ohne dabei das im Wochentakt steigende Potenzial generativer KI zu erahnen, aber jedenfalls explizit in der Absicht, für Big-Data-Anwendungen auf EU-Ebene eine Urheberrechtserlaubnis zu schaffen. Nach dem Motto „the right to read is the right to mine" erlaubt es die TDM-Regelung, dass aus großen Datenbergen Muster erkannt werden können und dass ein Urheberrechtsschutz von Texten, Bildern, Videos, Audios und Code diesem Vorgang eben nicht im Wege steht. Das führt zum Ergebnis, dass der Betreiber eines KI-Systems, der etwa ein Sprachmodell erstellen möchte, frei verfügbare Inhalte im Netz hierfür crawlen darf, ohne darauf achten zu müssen, ob Urheberrechtsschutz greift.

Wenn innerhalb Deutschlands Materialien für ein solches KI-Modell gecrawlt werden, kann man sich hierbei im Ausgangspunkt auf die TDM-Erlaubnis berufen. Allgemein zugängliche Materialien dürfen folglich eingesammelt und für das Training der Modelle verwendet werden. Gleichzeitig setzt diese Erlaubnis auch Grenzen: Sie besagt, dass die Kopien gelöscht werden müssen, wenn sie für das TDM „nicht mehr erforderlich sind". Anders ausgedrückt: Sobald das Modell einen Text oder ein Bild bzw. dessen Vektoren „kennt", braucht es die Kopie nicht mehr. Die Grenzen dieser „Erforderlichkeit", wie lange etwas gespeichert werden kann, hängen allerdings vom Einzelfall ab und lassen damit Raum für Argumentation.

Die TDM-Erlaubnis enthält zwei wichtige Einschränkungen. Zunächst einmal ist es unzulässig, technischen Kopierschutz oder Paywalls zu umgehen, um die Materialien zu crawlen. Dies dürfte insbesondere bei Streaming-Angeboten der Fall sein, oder in dem Fall, dass etwa Social-Media-Plattformen ihre APIs geschlossen haben. Zweitens müssen Betreiber von KI-Systemen mit kommerziellem Hintergrund Nutzungsvorbehalte achten: Sie müssen ihren Crawler so designen, dass er maschinenlesbar erklärte „KI-Vorbehalte" erkennt und diese Inhalte dann entsprechend außen vor lässt. Rein wissenschaftliche Anwendungen müssen letztere Einschränkung nicht beachten.

In den USA, wo derzeit Klageverfahren laufen, ist die Rechtslage im Ausgangspunkt anders. Dort wird untersucht, ob die Fair-Use-Regel anwendbar ist. Dabei handelt es sich um eine allgemein gehaltene Urheberrechtserlaubnis, die unter anderem danach fragt, ob durch die Nutzung für Inhaber von Rechten an Texten oder Fotos ein Einnahmeverlust zu befürchten ist. Das Erstellen von KI-Modellen zu rein wissenschaftlichen Zwecken könnte daher auch anders beurteilt werden als zu kommerziellen Zwecken.

Die rechtliche Beurteilung hängt schließlich noch von Faktoren ab, die hier nur angerissen werden können. So kommt es je nach Technologie möglicherweise nicht einmal zur lokalen Vervielfältigung von Texten und Bildern; möglicherweise werden diese augenblicklich analysiert und fließen ins Modell ein. Hier lässt sich diskutieren, ob das Urheberrecht überhaupt anwendbar ist. Lässt sich aus dem Modell zum Beispiel ein Foto, das in das Modell eingeflossen ist, nicht mehr reproduzieren, so ist das Urheberrecht jedenfalls nicht mehr anwendbar. Denn Fakten, Ideen und Konzepte, die sich in der Mustererkennung niederschlagen, fallen nicht unter den Schutz des Urheberrechts. In diesem Fall steht das Urheberrecht auch der Weitergabe des Modells nicht im Wege.

2.1.3 Frei lizenzierter Content oder Open Source-Software (im Beispiel Wikipedia, Github)

Das Meta-Modell enthält auch Inhalte aus Wikipedia. Sie stehen unter den freien Lizenzen der Creative-Commons-Lizenz CC BY-SA (Namensnennung – Weitergabe unter gleichen Bedingungen 4.0) sowie der GNU-Lizenz für freie Dokumentation. Damit sind die Inhalte von vornherein auf freie – wenn auch nicht bedingungslose – Nachnutzung durch die Allgemeinheit angelegt. In diesem Szenario kommt also zu den eben dargestellten gesetzlichen Erlaubnissen die freie Lizenz hinzu. Im Verhältnis zueinander haben die gesetzlichen Freiheiten Vorrang. Folglich ergibt sich also kein Unterschied zu nicht frei lizenzierten Inhalten, um sie in ein KI-Modell aufzunehmen. Sollte die Nutzung für das Modell über die gesetzlichen Erlaubnisse hinausgehen (etwa weil Kopien länger gespeichert werden als gesetzlich erlaubt), so kann dies auf Grundlage der freien Lizenz erfolgen.

Auch Computerprogramme können unter den Schutz des Urheberrechts fallen. Sind sie unter einer Lizenz für freie und Open-Source-Software wie etwa der MIT-Lizenz oder der GPL (General Public License) lizenziert, gilt das soeben zur CC-Lizenz Gesagte, dass der Code gemäß gesetzlicher Erlaubnis in das Modell einfließen darf. Schließlich: Auch bei proprietärem Code kann die TDM-Erlaubnis greifen.

2.2 Lernen und Datenschutzrecht

Wenn KI-Modelle gebildet werden, sind nicht nur Urheberrechte betroffen, sondern möglicherweise auch personenbezogene Daten Dritter. Fließen zum Beispiel Fotos mit abgebildeten Menschen in KI-Modelle, so liegt darin eine Verarbeitung personenbezogener Daten – selbst wenn augenblicklich eine Anonymisierung erfolgt. Diese Verarbeitung wird allerdings meist auf eine gesetzliche Erlaubnis gestützt werden können, namentlich die „berechtigten Interessen". Hiernach wird das Interesse daran, ein Modell für generative KI zu trainieren, mit den Rechten der Betroffenen abgewogen. Diese Abwägung wird regelmäßig zu Gunsten der Betreiber ausfallen, weil es beim Bilden der Modelle, die für generative KI eingesetzt werden können, in der Regel nicht darum geht, Persönlichkeitsprofile zu bilden, sondern darum, Muster zu lernen, etwa zur Physiognomie von Menschen. Verkürzt gesagt dürfte es häufig zum Gleichlauf der Rechtsgrundlagen von Urheberrecht und Datenschutz kommen.

Ein datenschutzrechtlich heikler Punkt ist wiederum der Umgang von Betreibern generativer KI-Systeme mit dem Input durch die User. So riefen in Deutschland die Datenschutzbehörden im Frühjahr 2023 eine KI-Taskforce ins Leben. Sie sandte einen Fragebogen an den ChatGPT-Betreiber OpenAI. Moniert wurde darin zunächst einmal die fehlende Transparenz darüber, ob die Betreiber anhand des Inputs der User, das heißt beim Prompten, ihr Modell selbst weitertrainieren. Gibt beispielsweise eine Userin Informationen über ihren Gesundheitszustand beim Ergründen von Krankheitssymptomen preis, so verpflichtet das Datenschutzrecht zur Transparenz darüber, ob und inwieweit das Modell mit dem Input weitertrainiert wird. Möglicherweise muss dann auch eine Einwilligung der Userin eingeholt werden, bevor ihr Input überhaupt in das Modell einfließen darf. Weitgehend offen sind auch noch die Einflussmöglichkeiten durch die datenschutzrechtlichen Ansprüche wie Auskunft oder Löschung: Ist es überhaupt möglich, aus einem Sprachmodell den Stand zur Verarbeitung personenbezogener Daten zu beauskunften oder zu löschen?

2.3 Modelle lokal betreiben

Neben dem Meta-Modell LLaMA existieren mittlerweile offene und frei lizenzierte Large-Language-Modelle (LLM). Mit ihnen rückt die Möglichkeit stärker in den Fokus, generative KI lokal zu betreiben. Wer etwa einen eigenen Chatbot betreiben möchte, behält bei lokalem (Offline-)Betrieb des Modells die Herrschaft über die Datenverarbeitung. Dies ist aus Sicht des Datenschutzrechts und zur Wahrung der Datenminimierung begrüßenswert. Im Falle eines Chatbots, bei dem sensible persönliche Informationen geteilt werden, kann der lokale Betrieb auch eine zwingende Anforderung der Datensicherheit darstellen.

2.4 Risiken und Transparenz nach künftiger KI-Verordnung berücksichtigen

KI im Allgemeinen ist in den letzten Jahren Gegenstand umfangreicher spezifischer gesetzgeberischer Regulierung gewesen. In der EU steht eine KI-Verordnung (AI Act) an, bei der generative KI nur eine von vielen Einsatzgebieten von KI ist. Primär geht es bei der Verordnung darum, Risiken von KI zu identifizieren und einzudämmen. Die kommende KI-Verordnung soll KI-Systeme je nach Gefahrenkonstellation erfassen. „KI-Basismodelle" müssen unabhängig auf vorhersehbare Risiken für Gesundheit, Sicherheit, Grundrechte, Umwelt, Demokratie und Rechtsstaatlichkeit geprüft werden, um mögliche Gefahren abzumildern. Während sie laufen, müssen sie ein angemessenes Niveau an Leistung, Interpretierbarkeit, Korrigierbarkeit, Sicherheit und IT-Security aufweisen. Betreiber generativer KI werden dem aktuellen Stand zufolge zudem Maßnahmen gegen Desinformation ergreifen müssen. Die KI-Verordnung ist derzeit im Trilogverfahren, wird also unter EU-Kommission, EU-Parlament und Ministerrat final verhandelt.

2.5 Selbstverpflichtungen der Betreiber

Den gesetzlichen Rahmen flankieren schließlich Selbstverpflichtungen der Unternehmen. So erklärten die Unternehmen Amazon, Anthropic, Google, Inflection, Meta, Microsoft und OpenAI im Juli 2023 gegenüber dem Weißen Haus neben vielen anderen Punkten zum Thema KI, dass die Inhalte, die von einer KI erstellt wurden, mit Wasserzeichen oder ähnlichen technischen Maßnahmen kenntlich gemacht werden. Technische Details hierfür sind noch ungewiss.

3 Nutzungsperspektive: Generative KI einsetzen

Der Blick wird nun auf die Nutzungsperspektive gerichtet, also den Einsatz von Systemen generativer KI. Die Verwendung von Texten, Bildern und Audios, die mit generativer KI erzeugt wurden (im Folgenden „Output"), ist im Ausgangspunkt frei. Dennoch gibt es im Hinblick auf fremde Rechte und den Kontext des Einsatzes generativer KI einiges zu beachten.

3.1 Fremde Rechte

3.1.1 Den Output nutzen: Fremde Urheberrechte

Schreiben von Texten und Zeichnen von Illustrationen sind freie Vorgänge – Urheberrecht steht Inspiration nicht im Weg. Einzelne fremde Werke sind allerdings vor einer Übernahme geschützt. Wer beispielsweise einen literarischen Text verfasst und hierfür Werke anderer Autoren als Vorlage verwendet, muss einen „hinreichenden Abstand" zu den verwendeten Vorbildern wahren, um von Inspiration sprechen zu können, um nicht Werke anderer zustimmungspflichtig zu bearbeiten.

Diese Regel lässt sich auch auf generative KI übertragen: Das KI-System, das eingesetzt wird, hat aus Tausenden und Millionen von Werken und Informationen Muster abgeleitet. Auf dieser Grundlage generiert es mit den User-Prompts den Output. Also hat sich auch das KI-System „inspirieren" lassen – auch wenn es treffender so beschrieben ist, dass das KI-System seine Ergebnisse danach erzeugt, was den gelernten Mustern wahrscheinlich entspricht.

Wie beim menschlichen Schaffen gilt auch hier: Solange der Output generativer KI keine Teile oder wesentliche Züge von fremden Werken enthält, kommt eine Userin, was den Output betrifft, in keinen Konflikt mit fremden Urheberrechten. Ebenso wenig steht das Urheberrecht entgegen, „inspiriert von" oder „im Stil von" zu prompten: Output darf auf Ideen, Techniken, Konzepten und Stilmitteln anderer fußen, die aus bestehendem Schaffen anderer abgeleitet wurden. Wenn dabei allerdings fremde Werke reproduziert werden, kann die Nutzung des Outputs in Konflikt mit dem Urheberrecht geraten. Auch wenn gerade die Nachahmung des Stils der wunde Punkt für viele Künstlerinnen und Künstler zu sein scheint, so ist ein Stil als solcher nicht geschützt – und es wäre ein Bruch mit urheberrechtlichen Prinzipien, Nachahmungen zu untersagen.

Lässt man sich zum Beispiel eine künstliche Fotografie im Stil der US-amerikanischen Künstlerin und Fotografin Lee Miller (Sterbejahr 1977, ihr Werk wird also erst 2048 gemeinfrei) erzeugen und beherrscht das KI-System das Handwerk von Millers Fotografie und Surrealismus, so dürfte man als Nutzerin oder Nutzer des KI-Systems das erzeugte Foto verwenden, solange der eben erläuterte Abstand zu Millers einzelnen Werken gewahrt ist. Prüffragen lauten hier: Hat sich das KI-System selbst ein Motiv „ausgedacht" und sich dann überlegt, wie Miller das Motiv belichten, welche Perspektive und welche Lichtempfindlichkeit sie wählen würde? Dann ließe sich tendenziell von einer Inspiration sprechen – mit der Folge, dass Nutzerinnen und Nutzer das Bild frei verwenden könnte. Nicht gewahrt wäre der Abstand, wenn das KI-System eine bestimmte Fotografie von Miller darstellen und damit letztlich ein bestehendes Werk reproduzieren würde – dann würde der Output die Urheberrechte der Fotografin berühren. Die Konsequenz hiervon wäre, dass die Verwertung des KI-erzeugten Bildes ihre Urheberrechte verletzen würde. Die Erben könnten Unterlassung der Bildnutzung verlangen – auch, wenn Nutzer oder Nutzerin die Nähe zu einem fremden Werk nicht kannte.

Vor diesem Hintergrund ist man beim Einsatz generativer KI auf ein gewisses Vertrauen gegenüber den Systemen angewiesen. Wie viel Vertrauen man den unterschiedlichen KI-Systemen schenken kann, darüber lässt sich hier nur spekulieren. Gewisse Anhaltspunkte lassen sich aber ausmachen.

Einerseits konnte bereits nachgewiesen werden, dass der Output von generativer KI fremde Werke enthalten kann. Dies zeigte eine Studie der Alphabet-Töchter Google und DeepMind, der University of California in Berkeley, der ETH Zürich und der Princeton University von Anfang 2023. Der Studie zufolge ließen sich urheberrechtlich geschützte Werke mit gezielten Prompts reproduzieren. Ein solcher Output berührt dann Urheberrechte an fremden Werken und dürfte nicht verwertet, also zum Beispiel, verkauft, in eine Broschüre aufgenommen und anderweitig weitergegeben werden.

Andererseits lässt sich aus den Studien nicht schlussfolgern, dass KI-Systeme mit nennenswerter Wahrscheinlichkeit und Regelmäßigkeit urheberrechtsverletzenden Output generieren. Es scheint eher so, als dass auf die Reproduktion bestehender Werke gezielt hingepromptet werden muss. Zudem dürften auch aus Eigeninteresse heraus KI-Systeme ihre Nutzerinnen und Nutzer nicht in Urheberrechtsverletzungen hineinlaufen lassen wollen. In diesem Zusammenhang scheinen aber Dienste wie Adobe Firefly im Vorteil, weil deren Modell derzeit mit gemeinfreien Bildern oder mit Adobe-Stockfotos trainiert ist, für die Adobe umfangreiche Nutzungsrechte hat.

Der Einsatz generativer KI scheint derzeit kein erhöhtes Risiko für Urheberrechtsverletzungen mit sich zu bringen. Zudem: Einschränkungen durch das Urheberrecht greifen nur, solange fremde Werke überhaupt unter Urheberrechtsschutz fallen. Sind Urheberinnen oder Urheber über 70 Jahre tot, ist eine Reproduktion deren Werke unproblematisch, auch beim Einsatz generativer KI. Wer also Output nutzen möchte, der gemeinfreie Gemälde, Texte oder Musikkompositionen enthält, muss nicht um Zustimmung bitten.

3.1.2 Input: Fremde Rechte achten

Fremde Urheberrechte aus dem Input in den Output: Bildgeneratoren wie DiffusionBee (basierend auf dem Modell Stable Diffusion) bieten die Möglichkeit, sogenannte Outpaints zu erzeugen. Dabei wird eine Abbildung in den Generator geladen und mit einem Prompt der Befehl zum Umgang mit dieser Abbildung eingegeben. Es besteht hier also die Möglichkeit, mit fremden Bildern zu prompten.

Bei urheberrechtlich geschützten Materialien darf zum Beispiel eine fremde Bildkomposition sich nicht in ihren wesentlichen Zügen im Output finden. Wer einen „Rahmen" um ein bestehendes fremdes Bild malen lässt, darf dieses Bild nicht verwenden, solange es sich um eine unfreie Bearbeitung handelt. Der Maßstab ist wiederum das oben Gesagte: Das Generierte muss Abstand wahren, damit keine Urheberrechtsverletzung begangen wird. Allerdings dürfen derlei Bearbeitungen im Privaten angefertigt werden. Als Durchgangsstadium im Schaffensprozess zu einem gänzlich eigenständigen Output ist die Nutzung fremder Werke zulässig.

Außerdem können parodistische oder Pastiche-artige Auseinandersetzungen mit fremden Werken unter gesetzliche Erlaubnisse fallen: Mit einem Bildgenerator ein Meme zu generieren, ist nach einer jüngeren Urheberrechtsreform in vielen Fällen erlaubt.

Datenschutzrecht: ChatGPT setzt derzeit den Hinweis, man möge keine sensible Information teilen, weil die Chat-History zur Verbesserung des Dienstes möglicherweise gereviewt werde. Möchte man dies dennoch tun, ist eine denkbare Maßnahme zur Datensicherheit, ein Modell lokal zu betreiben – insbesondere, solange bei einzelnen Betreibern das Ausmaß der Datenverarbeitung nicht geklärt ist (siehe oben). Im Sinne der Datenminimierung (Daumenregel: nichts verarbeiten, was nicht erforderlich ist) können personenbezogene Informationen, die für einen Prompt nicht zwingend erforderlich sind, etwa durch Pseudonyme ersetzt werden.

Bei „Online-Prompting" kann sich zudem die zusätzliche Erfordernis des Datenschutzrechts ergeben, im professionellen Kontext eine Vereinbarung über Auftragsverarbeitung oder Gemeinsame Verantwortlichkeit getroffen zu haben.

Arbeitsrecht und Geschäftsgeheimnisse: Im Bereich von Geschäftsgeheimnissen werden interne Direktiven eines Arbeitgebers zu berücksichtigen sein, falls der Einsatz generativer KI untersagt sein sollte.

3.2 Schränken die Betreiber der KI-Systeme die Nutzung ein?

Nach aktuellem Stand (Oktober 2023) beanspruchen viele der KI-Systeme wie ChatGPT und DiffusionBee keine Rechte am Output für sich. Im Gegenteil ist dort die Rede davon, dass der Output frei und ohne Einschränkung verwendet werden darf. Das bedeutet allerdings nicht, dass man frei von jeglicher Verantwortung ist: Urheberrechte Dritter müssen – wie oben dargestellt – beachtet werden. Viele Terms von KI-Systemen stellen dies auch explizit klar.

Unter welchen Bedingungen man den Output zur Verfügung stellt, ist gemäß Nutzungsbedingungen vieler Plattformen den Nutzerinnen und Nutzern überlassen. Von den größeren KI-Generatoren macht derzeit allerdings Midjourney bei seiner Gratis-Version eine Einschränkung: Dort ist zu lesen, dass User den Midjourney-Output nur unter CC BY-NC stellen dürfen. Dies bedeutet, dass eine Freigabe des Outputs nur zu nicht-kommerziellen Zwecken zulässig ist. Es ist zweifelhaft, ob solche Einschränkungen durch Betreiber von KI-Generatoren nach deutschem Recht überhaupt wirksam sind. Wer sichergehen will und seinen Output etwa unter freieren Bedingungen zur Verfügung stellen möchte, sollte auf andere Generatoren ausweichen.

Jedenfalls scheinen Bestimmungen wie bei Midjourney besonders vor dem Hintergrund des gesetzlichen Status absurd: Die Betreiber der KI-Systeme oder die Programmierer dieser Systeme haben kein Urheberrecht am generierten Output. Derlei Einschränkungen von Betreibern können zudem höchstens im Verhältnis zu den jeweiligen Nutzerinnen und Nutzern bindend sein, die die Vertragsbedingungen akzeptiert haben und die den Output haben generieren lassen. Für die Allgemeinheit bleibt der Output gemeinfrei.

3.3 Transparenz, Prüfungsrecht

Eine allgemeine Pflicht, KI-Output als „KI-generiert" zu kennzeichnen, gibt es aus Nutzungsperspektive nicht. Allerdings ist dies im Kontext von Prüfungsleistungen wie Hausarbeiten oder Qualifikationsarbeiten zu beachten; dort wird die Thematik rege diskutiert. Fehlende Transparenz über den Einsatz generativer KI als „Ghostwriter" kann als Verstoß gegen die Regeln Guter Wissenschaftlicher Praxis gewertet werden. Die Prüfungsordnungen und Rahmenvorschriften von Hochschulen legen in der Regel fest, dass Hilfsmittel angegeben werden müssen; hierzu zählt auch generative KI. Ansonsten sei hier auf die rechtspolitische Empfehlung verwiesen, mit kontextbezogenen Regeln Klarheit für Prüflingen und Lehrende zu schaffen, dabei aber generative KI nicht pauschal zu verbieten.

3.4 Mit eigenen Urheberrechten umgehen

Teil der Nutzungsperspektive ist auch die Frage, wann Ergebnisse generativer KI nach den Regeln des Urheberrechts geschützt sein können. Wer ein Urheberrecht innehat, kann andere von der Nutzung des Ergebnisses ausschließen, also Kontrolle darüber ausüben, wer das Werk nutzt und ob dies nur gegen Vergütung gestattet wird. Ein urheberrechtlich geschütztes Werk kann also lizenziert und verkauft werden.

3.4.1 Werkschutz bei unspezifisch gesteuerter KI

Im Kontext generativer KI ist das geltende Urheberrecht im Ausgangspunkt klar: Nur Menschen können Werke schaffen, denn Werke sind „persönliche geistige Schöpfungen". Eine Maschine kann eine solche persönliche Schöpfung nicht vollbringen. Wer sich also mit dem Befehl „Zeichne mir ein abstraktes Stillleben mit drei Äpfeln mit dunklen Farben" ein KI-generiertes Bild ausgeben lässt, erlangt damit kein Urheberrecht.

Zwar wird ein Prompt von einem Menschen eingegeben. Aber die Vorgabe durch den eingegebenen Prompt ist regelmäßig ein unspezifischer Steuerungsbefehl. Sein Ergebnis wird durch die Umsetzung des Generators bestimmt, der den Output durch eine mathematische Annäherung autonom generiert. Das KI-System empfängt mit dem Prompt einen Auftrag, wie wenn eine Künstlerin beauftragt wird, ein Bild zu malen oder eine Komposition zu schreiben. In diesen Fällen gesteht das deutsche Urheberrecht dem Auftraggebenden niemals einen Werkschutz zu. Und auch unter dem US-amerikanischem Copyright verneinte kürzlich ein US-Gericht den Urheberrechtsschutz für ein KI-erstelltes Werk: Es fehle die Verbindung zwischen menschlichem Geist und kreativem Ausdruck.

Das Urheberrecht steht dem Weitergeben, Kopieren und Remixen gemeinfreier Outputs also nicht im Weg. Aus User-Perspektive kann man, wenn man KI-Output teilt und dieser auch als KI-Output erkennbar ist, folglich keine Kontrolle über die Nutzung durch Dritte ausüben.

3.4.2 Werkschutz bei spezifisch gesteuertem Output, verändertem Output, kreativer Anordnung d...

Denkbar ist ein Schutz als Werk jedoch, wenn zu einem solch hohen Grad spezifisch und originell gepromptet wird, dass die wesentlichen Züge des Outputs schon durch den Prompt vorgegeben sind. Hierfür kann man sich den Prompt wie ein Drehbuch für einen Film vorstellen, das für sich urheberrechtlichen Schutz genießt. Das KI-System setzt als Regisseur des Films das Drehbuch um. Prüffragen können hier helfen: Erzeugt das KI-System nicht mehr nur noch Ergebnisse, bei denen die individuellen Züge jedes Mal wegen des hohen Abstraktionsgrads der Prompts völlig unterschiedlich sind? Hatte das KI-System für Kriterien, die das Bild originell machen, nur noch wenig Spielraum? Lässt sich der Output in einen Prompt rückübersetzen, der dem tatsächlich eingegebenen Prompt ohne allzu viel Varianz entspricht? Je eher sich diese Fragen bejahen lassen, desto eher kann man von Werkschutz ausgehen. Technische Instruktionen wie die Rate der Iterationen oder technisch geschicktes „Prompt Engineering" sind aber für den Urheberrechtsschutz irrelevant, weil sie nur technische und keine kreativ-schöpferischen Vorgaben sind.

Häufiger werden wohl die Konstellationen sein, in denen der Output als Ausgangspunkt eines Werkes herangezogen und umfangreich nachbearbeitet wird. Lässt sich beispielsweise eine Autorin einen Text mit dem Prompt „Was kann Künstliche Intelligenz?" erzeugen und verändert sie den Text, formuliert sie ihn um, fügt sie eigene Passagen hinzu, so kann durch diesen kreativen Eingriff oder Ergänzung ein Urheberrecht am Text entstehen. Ein instruktives Beispiel für den Einsatz generativer KI, dessen Ergebnis in aller Regel Urheberrechtsschutz genießen wird, sind Figuren wie der Stelfie Time Traveller auf Instagram. Der Künstler hinter dem fiktiven Zeitreisenden namens Stelfie nutzt KI-Bildgeneratoren und Photoshop und erzeugt so Selfies aus unterschiedlichen Zeiträumen der Geschichte mit einigen der bekanntesten historischen Figuren oder Szenen aus unterschiedlichen Epochen. Wenn man die Genese dieser Abbildungen betrachtet, wird ein Zusammenspiel von menschlicher Kreativität und KI-Output deutlich: Der Stelfie Time Traveller beginnt mit einer selbst gezeichneten Skizze, erzeugt Vorlagen mit Photoshop und kombiniert sie mit KI-generierten Elementen, färbt, retuschiert und krümmt Elemente, erweitert das Bild gezielt mit Outpaintings, arbeitet umfassend mit Photoshop und gezielten Inpaintings nach, baut Kameraeffekte wie Lens Flare oder Bewegungsverwischungen ein. Er kreiert damit Ergebnisse, deren schöpferischer Prozess insgesamt klar einen Urheberrechtsschutz entstehen lässt. In seinen Worten:

I feel you have to drive the machine, not the other way around, and to prove how important is the artist part in the overall process creation. I see the overall process as a joint effort with the AI.

Dieser joint effort bringt so viel menschliche Kreativität zum Ausdruck, dass der Einsatz der generativen KI dem Urheberrechtsschutz nicht im Wege steht.

Und noch in einem weiteren Szenario ist Urheberrechtsschutz denkbar: Werden Elemente KI-generierten Outputs im Einzelnen zwar nicht verändert, aber kreativ angeordnet, kann ein Werk entstehen. So wurde einer Bildergeschichte Urheberrechtsschutz zugesprochen, die aus gemeinfreien KI-generierten Comicbildern zusammengesetzt war. Hier lag der schöpferische Beitrag darin, die Bilder anzuordnen und so eine Geschichte zu erzählen, die dann als Gesamtes in ihrer konkreten Gestalt Urheberrechtsschutz genießen kann. Dasselbe gilt, wenn ein Mensch aus vielen KI-generierten Textfragmenten im Dialog mit einem Chatbot eine Geschichte entwickelt und den Gang der Geschichte selbst steuert.

3.4.3 Leistungsschutzrechte

Neben dem bisher behandelten Schutz eines Werks als „persönlicher geistiger Schöpfung" ist in bestimmten Szenarien an einen urheberrechtlichen „Leistungsschutz" zu denken. Dabei handelt es sich um Schutzrechte, die dem Schutz eines Werkes verwandt sind (daher auch „Verwandte Schutzrechte"), aber nicht zwingend das Ergebnis menschlichen Schaffens sein müssen:

  • Fotos und Videos sind als „Lichtbilder" und „Laufbilder" unabhängig davon geschützt, ob sie Ausdruck menschlicher Kreativität sind. Allerdings ist hiernach eine menschliche Leistung vorausgesetzt. Der Schutz greift nicht bei rein technischen Erzeugnissen und kommt dafür bei generativer KI nicht in Betracht.
  • Bei Tonaufnahmen ist die technische und organisatorische Leistung geschützt, Klänge erstmalig aufzunehmen; geschützt wird die Leistung des Herstellens. Wird beispielsweise ein KI-generierter (und damit urheberrechtsfreier) Text vertont und hierfür organisatorischer und wirtschaftlicher Aufwand betrieben, so kann die Aufnahme geschützt sein – mit der Folge, dass über ihre Weitergabe Kontrolle geübt werden kann. Die organisatorische Leistung hinter der Aufnahme muss aber durch ein Unternehmen oder einen Menschen erfolgen. Gibt das KI-System eine fertige Tonaufnahme aus, ist dieses Kriterium nicht erfüllt.
  • Für KI-generierte Datenbanken – also das Organisieren und Strukturieren von Elementen – kommt Schutz in Betracht, wenn hierfür eine wesentliche Investitionsleistung erbracht wurde.
3.4.4 Konsequenz für die Auszeichnung abhängig nach Urheberrechtsschutz

Im Falle gemeinfreien KI-Outputs ist es empfehlenswert, beim Veröffentlichen und Teilen der Ergebnisse auch den Status kenntlich zu machen, dass der Output kein Urheberrecht genießt. Dies lässt sich mit Hinweisen wie der Public Domain Mark umsetzen. Mit dem Zusatz „Gemeinfrei, KI-generiert" ist außerdem einem ethischen Anspruch der Transparenz gedient. Urheberrechtlich geschützte Ergebnisse wie beim Stelfie Time Traveller können wie zu Beginn des Abschnitts beschrieben gegen Vergütung lizenziert werden; wer die Ergebnisse der Allgemeinheit freigeben möchte, kann hierfür freie Lizenzen wie die Creative-Commons-Lizenzen verwenden.

3.5 Technische Erfindungen als Patente schützen

Ein weiterer Aspekt, der hier nicht näher behandelt wird, sind technische Erfindungen. Sofern sie allein von einer KI stammen, können sie nicht patentiert werden. Denn wie im Urheberrecht setzt das Patentrecht voraus, dass Erfindungen von einem Menschen stammen. Ist die KI allerdings lediglich Hilfsmittel, kommen Patente in Frage – wie im Urheberrecht. Überlegungen auf internationaler Ebene, das Patentrecht auf KI-generierte Erfindungen auszuweiten, sind im Auge zu behalten.

4 Rechtspolitischer Ausblick – freies Training?

Kreative haben eine gesetzlich geschützte Einflussmöglichkeit auf kommerzielle KI-Anwendungen durch das KI-Opt-Out, das Betreiber achten müssen (siehe oben). Aber ist es sinnvoll, zu verhindern, dass eigene Werke zum Trainieren von KI-Modellen verwendet werden können?

Wenn das Bedenken darin liegt, als Künstlerpersönlichkeit „gekapert" zu werden, scheinen andere Kodizes als das Urheberrecht zielführender: Ein wettbewerbsrechtlicher Nachahmungsschutz existiert bereits. Er verbietet, mit KI-generierten Output „im Stil von" ohne Zustimmung des betroffenen Künstlers den Eindruck zu erzeugen, diese „Werke" wären unter Billigung des Künstlers entstanden. Deepfakes wiederum können mit Mitteln des Persönlichkeitsrechts angegriffen werden. Hingegen: Etwas im Stil von jemand anderem zu schaffen, liegt gerade außerhalb des Schutzzwecks des Urheberrechts.

Die rechtspolitische Forderung, ein zustimmungsfreies KI-Training zu unterbinden, ist auch aus folgenden Gründen problematisch: Primär werden Sprachen, Formen, Kulturgeschichte, Wissen aus bestehenden Inhalten gelernt. Es ist aber nicht Aufgabe des Urheberrechts, im Vorfeld Schutz vor bestimmten Technologien zu bieten oder bestimmte Einsatzszenarien zu unterbinden. Zugleich muss der Gesetzgeber Risiken auch generativer KI erkennen und eindämmen. Überlegt wird schließlich noch, dass die Verwertung fremder Werke durch KI-Systeme künftig vergütet werden muss – ohne dass absehbar ist, in welcher Weise eine Vergütung erhoben und verteilt werden soll.

Footnotes 1 Georg Fischer, „KI und OER: Wie gut passen sie zusammen?" OERinfo – Informationsstelle OER (blog), 19. April 2023, https://open-educational-resources.de/ki-und-oer /. Zuletzt geprüft am 06.12.2023. 2 Eric Voigt, dpa und AP. „Künstliche Intelligenz: Schriftsteller und Drehbuchautoren verklagen OpenAI." Die Zeit , 21. September 2023.https://www.zeit.de/digital/2023-09/openai-kuenstliche-intelligenz-klage-schriftsteller. Zuletzt geprüft am 06.12.2023. 3 Hugo Touvron u. a. „LLaMA: Open and Efficient Foundation Language Models" arXiv , 27. Februar 2023, http://arxiv.org/abs/2302.13971. Zuletzt geprüft am 06.12.2023. 4 § 16 Urheberrechtsgesetz, kurz UrhG. 5 § 44b Absatz 1 UrhG. 6 § 44b Absatz 2 UrhG. 7 Die nicht-kommerzielle Wissenschaft genießt hier Privilegien und darf länger speichern, vgl. § 60d UrhG. 8 § 44b Absatz 3 UrhG. 9 https://de.wikipedia.org/wiki/Wikipedia:Lizenzbestimmungen. Zuletzt geprüft am 06.12.2023. So auch das Verständnis der Organisation Creative Commons: Walsh, Kat. „Understanding CC Licenses and Generative AI." Creative Commons, 18. August 2023.https://creativecommons.org/2023/08/18/understanding-cc-licenses-and-generative-ai /. Zuletzt geprüft am 06.12.2023. Artikel 6 Absatz 1 f) DSGVO (EU-Datenschutz-Grundverordnung). „DSGVO: So grillen Datenschützer OpenAI." heise online , 1. Juni 2023.https://www.heise.de/news/DSGVO-So-grillen-Datenschuetzer-OpenAI-9159102.html. Zuletzt geprüft am 06.12.2023. https://www.whitehouse.gov/briefing-room/statements-releases/2023/07/21/fact-sheet-biden-harris-administration-secures-voluntary-commitments-from-leading-artificial-intelligence-companies-to-manage-the-risks-posed-by-ai /. Zuletzt geprüft am 06.12.2023. § 23 Absatz 1 Satz 2 UrhG. heise online. „KI spuckt Bilder echter Menschen und urheberrechtlich geschützte Inhalte aus." MIT Technology Review , 7. Februar 2023.https://www.heise.de/hintergrund/KI-spuckt-Bilder-echter-Menschen-und-urheberrechtlich-geschuetzte-Inhalte-aus-7486123.html. Zuletzt geprüft am 06.12.2023. Kreutzer, Till. „Der Pastiche im Urheberrecht – Gutachten über eine urheberrechtsspezifische Definition des Pastiche-Begriffs nach § 51a UrhG." o. J.https://freiheitsrechte.org/uploads/documents/Demokratie/Urheberrecht/Gutachten%5fKreutzer%5fPastiche.pdf. Zuletzt geprüft am 06.12.2023. Artikel 5 Absatz 1 c) DSGVO. Zum Beispiel https://diffusionbee.com/MODEL%5fLICENSE.txt , Section III. Ziffer 6. Zuletzt geprüft am 06.12.2023. https://docs.midjourney.com/docs/terms-of-service. Zuletzt geprüft am 06.12.2023. Bertelsmann Stiftung (Hg.), Kreutzer, Till und Per Christiansen. „KI in Unternehmen." Gütersloh: Bertelsmann Stiftung 2021.https://www.bertelsmann-stiftung.de/de/publikationen/publikation/did/ki-in-unternehmen-all. Zuletzt geprüft am 06.12.2023. Leschke, Jonas, Peter Salden. „Didaktische und rechtliche Perspektiven auf KI-gestütztes Schreiben in der Hochschulbildung." (Bericht). Bochum: Ruhruniversität 2023. https://doi.org/10.13154/294-9734. „Urheberrechte: US-Gericht lehnt Copyright auf KI-generierte Kunst ab." Golem.de , 21. August 2023, https://www.golem.de/news/urheberrechte-us-gericht-lehnt-copyright-auf-ki-generierte-kunst-ab-2308-176918.html. Zuletzt geprüft am 06.12.2023. „An AI artist explains his workflow." Youtube 2023.https://www.youtube.com/watch?v=K0ldxCh3cnI. Zuletzt geprüft am 06.12.2023. „An AI artist explains his workflow." ab 07:01. heise online. „Entscheidung: KI-generierter Comic kann Copyright erhalten – Einzelbilder nicht." Developer , 24. Februar 2023.https://www.heise.de/news/Entscheidung-KI-generierter-Comic-kann-Copyright-erhalten-Einzelbilder-nicht-7526295.html. Zuletzt geprüft am 06.12.2023. Auch dargestellt in Kreutzer, Christiansen 2021.

By Fabian Rack

Reported by Author

Fabian Rack

Titel:
Rechtsfragen zur generativen KI.
Autor/in / Beteiligte Person: Rack, Fabian
Link:
Zeitschrift: ABI Technik, Jg. 44 (2024-02-01), Heft 1, S. 39-47
Veröffentlichung: 2024
Medientyp: academicJournal
ISSN: 0720-6763 (print)
DOI: 10.1515/abitech-2024-0005
Schlagwort:
  • GENERATIVE artificial intelligence
  • COPYRIGHT
  • DATA protection
  • ARTIFICIAL intelligence
  • PERSONALLY identifiable information
  • Subjects: GENERATIVE artificial intelligence COPYRIGHT DATA protection ARTIFICIAL intelligence PERSONALLY identifiable information
  • AI art
  • copyright law
  • generative AI
  • Generative KI
  • KI-Kunst
  • Urheberrecht Language of Keywords: English; German
Sonstiges:
  • Nachgewiesen in: DACH Information
  • Sprachen: German
  • Alternate Title: Legal Questions Regarding Generative AI.
  • Language: German
  • Document Type: Article
  • Author Affiliations: 1 = FIZ Karlsruhe, Leibniz-Institut für Informationsinfrastruktur und iRights.Law, Hermann-von-Helmholtz-Platz 1 76344 Eggenstein-Leopoldshafen, Deutschland
  • Full Text Word Count: 5420

Klicken Sie ein Format an und speichern Sie dann die Daten oder geben Sie eine Empfänger-Adresse ein und lassen Sie sich per Email zusenden.

oder
oder

Wählen Sie das für Sie passende Zitationsformat und kopieren Sie es dann in die Zwischenablage, lassen es sich per Mail zusenden oder speichern es als PDF-Datei.

oder
oder

Bitte prüfen Sie, ob die Zitation formal korrekt ist, bevor Sie sie in einer Arbeit verwenden. Benutzen Sie gegebenenfalls den "Exportieren"-Dialog, wenn Sie ein Literaturverwaltungsprogramm verwenden und die Zitat-Angaben selbst formatieren wollen.

xs 0 - 576
sm 576 - 768
md 768 - 992
lg 992 - 1200
xl 1200 - 1366
xxl 1366 -