Journalistieke auteursrechten & AI - nota | Vlaamse Vereniging van Journalisten

Journalistieke auteursrechten & AI (nota)

De auteursrechten in het geding zijn zowel die van morele als die van materiële aard. Morele auteursrechten zijn de rechten op auteursvermelding bij en eerbied voor het werk. Het respect daarvoor is ook cruciaal in het licht van de aansprakelijkheid voor mogelijke fouten. Materiële auteursrechten zijn de rechten op exploitatie van en vergoeding voor het werk. Het respect hiervoor is eveneens van vitaal belang voor elke auteur, mede gelet op de verwoestende werking die AI-technologie op hun werkgelegenheid dreigt te hebben.

Externe AI-ontwikkelaars en -exploitanten & journalistieke auteursrechten

AI-ontwikkelaars zoals OpenAI, Microsoft, Google en Meta maken massaal gebruik van online content om hun taalmodellen te voeden en te trainen. Bij die bronwerken zijn ook journalistieke werken, die auteursrechtelijk beschermd en licentieplichtig zijn.[1]

Als AI-output sterke gelijkenissen vertoont met eigen journalistiek werk, is er sowieso een inbreuk op het auteursrecht. AI-ontwikkelaars hebben als commerciële bedrijven geen citaatrecht. Bovendien rijzen dan grote vragen met betrekking tot morele auteursrechten, en met name het vader-/moederschapsrecht en het integriteitsrecht.

Ook wanneer AI-ontwikkelaars journalistiek werk ‘slechts’ als trainingsmateriaal gebruiken, doet zich een auteursrechtelijk probleem voor. Om te beginnen wordt zomaar informatie verzameld uit de databanken van nieuwsmedia. Dat wordt vervolgens opgeslagen en hergebruikt om het eigen AI-model te trainen.

AI-ontwikkelaars beroepen zich hiervoor op de wettelijke uitzondering op het auteursrecht voor TDM (tekst & data mining), opgenomen in de Europese DSM-richtlijn van 2019 en de Belgische Auteurswetgeving (artikel XI.190 WER[2]). Maar AI-ontwikkelaars gaan verder dan dat. Zij doen aan transformatief gebruik van beschermde inhoud, niet louter aan reproductie daarvan.

Kan het door derden trainen van AI-modellen met eigen werk ook voordelen hebben? Mogelijk, als het resultaat is dat er wordt doorverwezen naar eigen webfora van de klassieke nieuwsmedia. Maar op dit ogenblik is het risico toch vooral dat (nieuws)gebruikers voldoende kunnen hebben aan de AI-gegenereerde content, en geen nood meer hebben aan bijkomende informatie bij de oorspronkelijke bron.

Ten overstaan van externe AI-ontwikkelaars hebben journalisten en hun nieuwsbedrijven gelijklopende belangen. Het is dan ook aangewezen dat ze snel overleg plegen over een kordate aanpak van auteursrechtenschendingen door externe AI-ontwikkelaars en -exploitanten. Een bijkomende optie is om de actie open te trekken naar de volledige sector van auteursrechthebbenden, dus ook buiten de nieuwsmediasector, met Reprobel als uitvalsbasis.

Deze uitdaging is ronduit urgent. De uitrol van AI in de brede samenleving voltrekt zich sneller dan we vermoeden en dreigt ons binnen afzienbare tijd radicaal te confronteren met een informatiesamenleving die er heel anders uitziet dan die van vandaag.

Stappenplan

(1) Vaststelling inbreuken

De primaire uitdaging is het detecteren, registreren en inventariseren van auteursrechtelijke inbreuken. Daarvoor moeten de betrokken beroepsverenigingen en auteursmaatschappijen gecoördineerde surveys opzetten. Ze moeten hun leden intensief aanzetten tot het opsporen en melden van AI-gelieerde auteursrechtelijke inbreuken op hun werk.

Een platform zoals spawning.ai biedt de mogelijkheid tot het nagaan of je stock van beelden is gebruikt om een AI te trainen.

Als (delen van) teksten of beelden integraal te vinden zijn in de AI-output, is er sprake van ongeoorloofde reproductie van het werk en is de inbreuk op het auteursrecht manifest. Bij tekst of beeld die gelijkenissen vertonen met oorspronkelijk werk, is het zaak geval per geval te overwegen of een inbreuk kan worden aangevoerd.

(2) Gerechtelijke vordering tot staken + schadeclaim

In het buitenland, en met name in de VS, zijn intussen diverse processen aangespannen wegens onrechtmatig gebruik van auteursrechtelijk beschermd werk door AI-ontwikkelaars. [3]

Naar Belgisch recht is het eerste verweermiddel een verzoek tot onmiddellijke stopzetting van de inbreuk, desnoods via een rechter. Daarnaast behoort een schadeclaim voor het aangerichte nadeel tot de mogelijkheden. Een kwaadwillige of bedrieglijke inbreuk op het auteursrecht wordt bovendien strafrechtelijk beteugeld, als het misdrijf van namaak. ^[4]

(3) Verdere preventie inbreuken

De Belgische Auteurswetgeving bevat het recht om zich te verzetten tegen tekst- en datamining (artikel X.190 WER[5] ). Deze wettelijke opt-out mogelijkheid voor TDM moet wel in een machineleesbare vorm worden uitgeoefend.

Auteursrechtenmaatschappij SABAM oefende dit recht alvast uit voor al haar leden.

Een gangbare mogelijkheid voor websites is om in hun robots.txt file aan te geven dat AI-ontwikkelaars met hun crawlers niet welkom zijn. Om OpenAI te weren bijvoorbeeld geeft men dan als User-agent ‘GPTBot’ aan en daaronder ‘Disallow: /’. Deze vermelding kon vroeger ook al worden gebruikt om zoekmachines buiten te houden. OpenAI (met GPT Bot) liet alvast verstaan hiermee rekening te houden.

Kudurru.ai, dat is gelieerd met Spawning.ai, biedt technologie aan die webscrapers effectief blokkeert.

(4) Regeling auteursrechten via bijzondere licentie

Het Duitse mediabedrijf Axel Springer sloot eind 2023 een overeenkomst met OpenAI voor het gebruikmaken van diens publicaties (Bild, Die Welt, Politico, Business Insider…). [6] Er is sprake van een vergoeding van 5 à 20 miljoen dollar op jaarbasis. Pro memorie: The NYT eist miljarden dollars van OpenAI… Ook X (Elon Musk) maakt intussen aanspraak op een vergoeding voor het gebruikmaken van content.

Een alternatief is dat mediabedrijven en hun journalisten collectief handelen. Dat is ook een piste die Reprobel voorstelt aan haar leden, en die wij delen. “Een licentie voor generatieve AI op het meest centrale niveau van collectief rechtenbeheer is zinvol wegens het enorme aantal en de grote verscheidenheid van gebruikte tekst- en beeldwerken, en ook om de onderhandelingspositie van de rechthebbenden te versterken. Een klassiek techniek van technologiebedrijven is immers om de rechthebbenden proberen ut elkaar te drijven met een ‘verdeel en heers’ strategie.” [7]

(5) Wetgevende verbetering

De komende Europese AI-act heeft het summier over auteursrechten in de context van de creatie van AI-modellen. Een bepaling verplicht AI-ontwikkelaars om een overzicht ter beschikking te hebben van de content die ze gebruiken voor het trainen van hun modellen. [8] Een andere bepaling laat evenwel uitschijnen dat de EU het scrapen van internetcontent beschouwt als TDM, wat in principe geoorloofd is. Wel moeten contenthouders voldoende duidelijke en efficiënte mogelijkheden hebben om zich te verweren hiertegen. [9]

Te overwegen is de creatie van een nieuw, expliciet intellectueel recht dat de werken van auteurs beschermt tegen het schrapen door AI-ontwikkelaars. Mogelijk kan inspiratie worden gevonden in het nieuwe uitgevers- en journalistenauteursrecht dat sinds 1 augustus 2022 van kracht is (artikel XI.216 e.v. Wetboek Economisch Recht^[10]). Dit laat persuitgevers toe om hun producten efficiënter te valoriseren online. Platformen zoals Google en Facebook genereren allang massa’s online verkeer en reclame-inkomsten dankzij nieuwsberichten die ze overnemen van professionele nieuwsmedia. Het nieuwe uitgeversrecht maakt het persuitgevers nu expliciet juridisch mogelijk – en daardoor in de praktijk veel makkelijker – om hun content af te schermen van dat gebruik. Overname kan door Google en Facebook enkel nog mits de uitdrukkelijke toestemming van de uitgever, die zonder twijfel niet zal nalaten daar een gepaste vergoeding aan vast te koppelen. Journalisten krijgen bijzondere aandacht in de wet, want uitgevers moeten de vergoedingen die ze van big tech ontvangen ‘delen’ met hun auteurs. Zowel tussen big tech en uitgevers als tussen uitgevers en auteurs gelden overigens strakke transparantieregels. [11]

Interne AI-ontwikkelingen en journalistieke auteursrechten

Het ligt voor de hand dat mediabedrijven almaar meer zullen meesurfen op de AI-golf om eigen applicaties te ontwikkelen. Die kunnen worden ingezet voor slimme archivering en multipublishing onder meer. Ook op dit niveau rijzen er nieuwe auteursrechtelijke uitdagingen. Het gaat immers om nieuwe exploitatievormen met betrekking tot journalistiek werk die in principe niet zijn opgenomen in de licentie-overeenkomsten die de mediahuizen met hun journalisten hebben afgesloten.

Ook hier gaat zijn zowel de morele als vermogensrechten in het geding. Het respect voor morele auteursrechten zoals de rechten op naamsvermelding en eerbied voor het werk is overigens rechtstreeks gelinkt aan de aansprakelijkheidskwestie, aangezien in principe enkel de auteur aansprakelijk is voor werk dat aan hem kan worden toegeschreven. Een vermogensrechtelijke vergoeding voor hergebruik van het werk staat dan weer in functie van de bestaanszekerheid van de journalist.

To do

Er is dringend overleg nodig tussen mediamanagers en journalisten over de auteursrechtelijke aanpak van de AI-uitrol in de mediabedrijven.

Dit overleg kan plaatsvinden op bedrijfsniveau, en in dat geval worden samengevoegd met ander hoognodig overleg in verband met AI-ontwikkelingen, onder meer met betrekking tot AI-beleidskeuzes, impact op werkgelegenheid en redactiebezetting en vorming/bijscholing. De VVJ moet hier via haar mandatarissen in de mediabedrijven een grote rol spelen.

Overleg is ook mogelijk op sectoraal niveau, en dan is behalve de VVJ de JAM een mogelijke actor.

In het kader van dit overleg moet eveneens worden gesproken over een ‘passend aandeel’ voor auteurs/journalisten in de vergoedingen die mediabedrijven desgevallend verkrijgen bij externe AI-ontwikkelaars voor gebruik van hun media-inhoud.

Pol Deltour

26.01.2024

-----

[1] Volgens een onderzoek van De Groene Amsterdammer, gepubliceerd op 7 juni 2023, gebruikt OpenAI als bronnenmateriaal voor zijn Nederlandstalige variant ook veel ‘beschermde content’ van kwaliteitsmedia, zonder dat daarvoor is overlegd laat staan betaald. In de top-honderd van geripte websites staan onder meer de NRC (plek 4), de Volkskrant (17), De Standaard (57), De Telegraaf (59), De Groene Amsterdammer (61) en de NOS (81).

Zie ook The Washington Post, ‘Inside the secret list of websites that make AI like ChatGPT sound smart’, 19 april 2023 - https://www.washingtonpost.com/technology/interactive/2023/ai-chatbot-learning/

[2] Artikel XI.190 van het Wetboek Economisch Recht regelt als een van de uitzonderingen op het auteursrecht “20° de reproductie van rechtmatig toegankelijke werken met het oog op tekst- en datamining, op voorwaarde dat het gebruik van die werken door de auteur ervan niet op passende wijze uitdrukkelijk is voorbehouden. Bij content die online voor het publiek beschikbaar wordt gesteld, wordt het voorbehoud enkel als passend beschouwd indien hierbij machinaal leesbare middelen worden gebruikt. Deze reproducties mogen worden bewaard zolang dit nodig is voor tekst- en datamining”.

[3] https://copyrightalliance.org/education/artificial-intelligence-copyright/

https://originality.ai/blog/openai-chatgpt-lawsuit-list

[4] Artikel XI.193 WER: “Hij die kwaadwillig of bedrieglijk inbreuk pleegt op het auteursrecht en de naburige rechten, is schuldig aan het misdrijf van namaak.” Wie zich hieraan schuldig maakt, is strafbaar met een gevangenisstraf van één tot vijf jaar en een geldboete van € 500 tot € 100.000 euro (x 8) (Wet van 15 mei 2007 betreffende de bestraffing van namaak en piraterij van intellectuele eigendomsrechten).

[5] Artikel XI.190 WER: een uitzondering op het auteursrecht betreft “20° de reproductie van rechtmatig toegankelijke werken met het oog op tekst- en datamining, op voorwaarde dat het gebruik van die werken door de auteur ervan niet op passende wijze uitdrukkelijk is voorbehouden. Bij content die online voor het publiek beschikbaar wordt gesteld, wordt het voorbehoud enkel als passend beschouwd indien hierbij machinaal leesbare middelen worden gebruikt. Deze reproducties mogen worden bewaard zolang dit nodig is voor tekst- en datamining”.

[6] https://openai.com/blog/axel-springer-partnership

[7] Reprobel, Mogelijke licentieverstrekking in verband met generatieve artificiële intelligentie via Reprobel – eerste oriënterende discussienota voor de Raad van Bestuur, 17 oktober 2023

[8] Section 1(d): “draw up and make publicly available a sufficiently detailed summary about the content used for training of the general-purpose AI model, according to a template provided by the AI Office”.

[9] Section 1(c) vereist van AI-ontwikkelaars dat ze “put in place a policy to respect Union copyright law in particular to identify and respect, including through state of the art technologies where applicable, the reservations of rights expressed pursuant to Article 4(3) of Directive (EU) 2019/790”.

[10] Ingevoegd in het WER bij wet van 19 juni 2022. Deze wet is een uitloper van de Europese richtlijn uit 2019 over auteursrechten in de eengemaakte digitale markt (DSM-richtlijn).

[11]Jammer genoeg is de wet nog geen voldongen feit. Google en Meta, het moederhuis van Facebook, verzochten immers om de vernietiging van delen ervan bij het Grondwettelijk Hof. De gedaagde partij in deze rechtszaak is de Belgische Staat, maar de Belgische uitgevers en namens de journalisten de JAM interveniëren als tussenkomende partij.