Auteursrechten in een AI-gedreven wereld

De opkomst van AI roept fundamentele vragen op over auteursrecht. Kunnen chatbots auteursrechtelijk beschermde werken creëren? En mogen taalmodellen zonder toestemming en vergoeding worden getraind met bestaande teksten en beelden? Het AI-tijdperk brengt een ingrijpende verschuiving teweeg in de manier waarop content wordt geproduceerd en gebruikt. Het wordt de komende tijd schipperen tussen technologische innovatie en de rechten van makers.

Charlotte Michils

De groei van trainingsdata heeft een plateau bereikt - er is tenslotte maar één internet. OpenAI-medeoprichter Ilya Sutskever vreest dat de explosieve toename van beschikbare data tot het verleden behoort. Wat dat betekent voor de verdere ontwikkeling van AI en de verwachtingen over Artificial General Intelligence (AGI), AI die menselijke cognitieve taken kan begrijpen en uitvoeren, daarover hebben we het hier even niet. Wel gaat het hier over het feit dat het internet massaal gevoed is aan AI-modellen.

Hebben AI-bedrijven al die auteurs dan om toestemming gevraagd? Toch niet. Nochtans zegt het auteursrecht dat wie beschermd werk wil gebruiken, de toestemming van de maker nodig heeft. Daarbovenop komt in veel gevallen ook een vergoeding. Iets creëren kost bloed, zweet en tranen; een vergoeding is je reddingsboei tijdens je volgende creatieve proces.

Is de werkwijze van de AI-bedrijven een staaltje van move fast and break things, het aloude leidmotief van Facebook-oprichter Mark Zuckerberg? Of was het net iets doordachter dan handel snel, de gevolgen zijn voor later?

AI & auteursrecht

Het auteursrecht omvat twee categorieën van rechten: vermogensrechten en morele rechten. Morele rechten beschermen de band tussen de auteur en zijn werk.

Vermogensrechten laten auteurs toe om inkomsten te putten uit hun werk. Wie een werk wil gebruiken, moet de auteur dus om toestemming vragen en daarvoor een vergoeding betalen. Het auteursrecht is niet absoluut. Citeren bijvoorbeeld is (voorwaardelijk) toegelaten. Parodiëren (opnieuw voorwaardelijk) ook. En zo zijn er nog enkele uitzonderingen. Gebruik dat niet gedekt wordt door een uitzondering, is dan weer niet toegelaten.

Wat nu precies een inbreuk vormt, is puzzelwerk. Een citaat van een hele pagina uit een werk van slechts anderhalve pagina? Schending van het auteursrecht. Een parodie zonder substantiële verschillen met het origineel? Kan niet.

Maar welke status heeft de output van een genAI-systeem op basis van een prompt? En hoe koosjer is het gebruik van beschermd werk om genAI-systemen te trainen?

Adaptatierecht

Kan een door AI gegenereerd beeld het auteursrecht schenden? Als de output neerkomt op een bewerking van het origineel, wellicht wel. Ook het overnemen van elementen uit een bestaand werk vereist immers toestemming van de maker.

Een bewerking of adaptatie kan binnen hetzelfde genre blijven (van een boek naar een artikel) of switchen naar een ander genre (van een film naar een game). Het adaptatierecht is een deelrecht van het reproductierecht.

Tekst- en datamining (TDM)

Quid gebruik van beschermd werk om genAI-systemen te trainen? Tekst- en datamining - het verzamelen, verwerken en analyseren van grote datasets – is recent doorgebroken. Aangedreven door krachtige computers en een schier eindeloze stroom aan data, blijft het niet langer vooral beperkt tot onderzoek maar wordt het nu ook uitgerold voor industriële en commerciële toepassingen.

Om tekst- en datamining te faciliteren, voegde Europa twee belangrijke bepalingen – artikel 3 en 4 – in de DSM-richtlijn (richtlijn inzake auteursrechten in de digitale eengemaakte markt). Artikel 3 regelt een uitzondering op het auteursrecht in wetenschappelijk onderzoek. Vermits ze alleen en onder voorwaarden van toepassing is op strikt gedefinieerde onderzoeksorganisaties, wordt het mogelijke nadeel voor de auteur als minimaal ingeschat. Om die reden hoeven lidstaten ook niet te voorzien in een compensatie. Ook een opt-out is niet mogelijk, het gaat om een verplichte uitzondering. Dat is anders voor artikel 4 dat een algemene gelding heeft. De opt-out onder artikel 4 moet uitdrukkelijk zijn en 'op passende wijze' gebeuren.

In beide gevallen – artikel 3 en 4 – kan tekst- en datamining enkel voor zover er rechtmatige toegang is tot data.

Nationale rechtspraak

Uit een recente case voor de rechtbank in Amsterdam die DPG Media en Mediahuis verloren tegen het inmiddels ter ziele gegane communicatiebureau HowardsHome, blijkt dat er nog erg veel ruis zit op de criteria 'rechtmatige toegang' en 'passende opt-out'.

Specifiek wat de opt-out betreft, suggereert de uitspraak dat de uitzondering slechts van toepassing was geweest als de uitgevers niet enkel bepaalde AI-scraping bots hadden uitgesloten maar ook HowardsHome. Nu waren DPG Media en Mediahuis gefocust op bepaalde AI-bots zoals GPTBot (OpenAI), ChatGPT-User (OpenAI), CCBOT (Common Crawl) en Claude (Anthropic). Deze zienswijze maakt een passend en uitdrukkelijk voorbehoud uitdagend. Er worden immers dagelijks nieuwe modellen ontwikkeld (en de bestaande worden permanent geüpdatet).

De vraag is hoe de interpretatie te rijmen valt met het restrictieve karakter van uitzonderingen. Het blijft afwachten hoe de zaak wordt beslecht in beroep.

AI-wet

Een groot knelpunt bij AI-modellen is het gebrek aan transparantie over de gebruikte trainingsdata. De recent ingevoerde Europese AI-wet (artikel 53) moet hier verandering in brengen. Aanbieders van generatieve AI-modellen worden verplicht een beleid te voeren dat auteursrechten respecteert. Daarnaast moeten ze een gedetailleerde en publiek toegankelijke samenvatting geven van de datasets waarmee hun AI is getraind.

Prompts

En wat met prompts? De kwaliteit van de prompt(s) bepaalt de kwaliteit van de output. Een gedetailleerde prompt kan aanwijzingen bevatten over de hoedanigheid van de bot persona. Zo kan je bijvoorbeeld zeggen dat je antwoord wil krijgen van een professionele journalist. Daarnaast kan je ook meegeven wie je publiek is. Is de output bedoeld voor professionals uit dezelfde sector of voor een doorsnede van de bevolking? Omschrijf wat de chatbot moet doen: samenvatten, becommentariëren, verduidelijken… Heb je een bepaald format voor ogen, specifieer dat dan: een stappenplan, een recept, een wiskundige formule.

Je kan zo ver gaan in je prompt als je maar wil. Hoe creatiever de insteek, hoe groter de kans dat je prompt in de buurt komt van een beschermd werk. Volgens de rechtspraak is bescherming mogelijk wanneer het idee een concrete en originele vorm heeft aangenomen. Essentieel daarbij is menselijke inbreng. Of dat het geval kan zijn bij prompts, moet de rechtspraak uitwijzen.

Journalisten

Inmiddels is bekend dat Mediahuis – recent gevolgd door DPG Media – in zijn herwerkte freelancecontracten een bepaling heeft opgenomen om journalistiek werk te gebruiken voor AI-training. Dit alles gebeurde zonder overleg met journalisten of hun vertegenwoordigers. VVJ maakt zich daar grote zorgen over.

Eerst en vooral is het onduidelijk voor welke AI-toepassingen journalistiek werk wordt gebruikt als trainingsdata, terwijl de specificatieplicht in aannemingsovereenkomsten dit toch vraagt. Evenmin is helder wat de impact zal zijn op werkgelegenheid. We schrijven volop over de creatieve sector, maar wat genAI zal brengen voor onszelf, daar blijft het erg stil over. Ook het argument als zou het erg moeilijk zijn om een gedetailleerde opsomming van de journalistieke AI-toepassingen te geven omdat ze bij manier van spreken morgen al zou gedateerd zijn, is erg mager.

Daar komt bij dat geen enkel contract voorziet in een financiële compensatie. Nochtans creëert AI-training op journalistieke content economische waarde. Volgens een recente bevraging van het Reuters Institute van de Oxford-universiteit willen uitgevers dit jaar fors meer inspanningen leveren om relaties op te bouwen met AI-platforms zoals ChatGPT en Perplexity. Beide zijn op zoek naar hoogwaardige content in ruil voor doorverwijzing en/of betalingen.

Hoe dan ook is dit te belangrijk om onder de tafel geregeld te worden. VVJ pleit dan ook voor een open debat, met respect voor de rechten van journalisten en in het volle besef van de uitdagende context internationaal.

(foto: pixabay.com)