Nuttige én verantwoorde AI-tools voor journalisten

Verslag Workshop AI-tools voor journalisten 14.12.2023

Generatieve AI brengt ook de journalistiek in een stroomversnelling. Drie journalisten met grote expertise ter zake kwamen op deze workshop hun kennis en ervaring delen.

Dominique Deckmyn (De Standaard) volgt als vaste journalist de sectoren technologie en nieuwe media. In zijn column De Technocraat fileert hij sinds kort ook de AI-revolutie.
Lars Anderson (DPG Media) is sinds 2019 innovatiemanager en begeleidt de uitrol van nieuwe AI-toepassingen in het bedrijf.
Tom Van de Weghe (VRT NWS) ging in 2018 in Stanford University (VS) onderzoek doen naar de impact van artificiële intelligentie op journalistiek.

Intro

In zijn inleiding stelde Pol Deltour (VVJ Academy) dat een journalistieke toekomst met AI zeer nabij is. Daarvoor verwees hij naar de nieuwszender Channel 1 waar het nieuws wordt gepresenteerd door nieuwsankers die zijn gecreëerd door middel van artificiële intelligentie. De nieuwslezer spreekt, volgens jouw instellingen, verschillende talen en je kan ook de nieuwslezer naar keuze selecteren. Op plaatsen waar camera’s niet aanwezig kunnen of mogen zijn, wordt aangepast beeldmateriaal gecreëerd door middel van AI.

Hoewel de hele nieuwsuitzending is gebaseerd op AI staat er wel een volwaardig redactieteam achter dat bronnen controleert en nieuwsfeiten checkt volgens de journalistieke principes. Zij waarborgen correctheid, accuraatheid en neutraliteit van het nieuws, weliswaar dankzij de inzet van AI. Channel 1 wordt operationeel in 2024.

AI en Journalistiek

Lars Anderson schetste het ontstaan van AI (van GPT1 in juni 2018 tot GPT4 in maart 2023), hoe het stilaan zijn plaats heeft verworven in de media en hoe er binnen DPG Media richtlijnen werden opgesteld voor het gebruik van generatieve artificiële intelligentie. Het ontstaan en de evolutie van AI werd gekaderd in de overschakeling van papieren krant naar digitale media en de doorbraak van mobiele story telling waarbij al ruim de helft van alle nieuwsverhalen wordt gelezen op de smartphone.

De snelheid waarmee ChatGPT de wereld veroverde in 2022 is indrukwekkend. In amper 5 dagen telde het meer dan 1 miljoen gebruikers. Om eenzelfde aantal gebruikers te tellen, was Netflix 3,5 jaar bezig, deed Twitter er 2 jaar over, had Facebook 10 maanden nodig en volstonden 75 dagen voor Instagram.

ChatGPT is inmiddels het grootste, door OpenAI ontwikkelde, AI-platform, waarmee je ook vlot kan chatten. Op de tweede plaats staat Bard dat wordt aangestuurd door Google en dat ook praktische tips geeft. Derde in de rij is Claude, gebaseerd op Anthropic dat sterk inzet op veiligheid en dat vooral in de kijker kwam na een reportage van Kevin Roose, AI-journalist bij The New York Times. Hij besteedde ook ruime aandacht aan de introductie van de inmiddels vierde grote speler, het door Microsoft gelanceerde Bing.

Bing wordt, volgens Lars Anderson, gezien als een ontwrichtende speler die de markt doelbewust wil verstoren. Zij willen dat het AI-model verandert en niet langer alleen steunt op informatie die – via Google – beschikbaar is op internet. Microsoft werkt voor Bing ondertussen samen met OpenAI waardoor het alleszins een leuk hulpmiddel is om vragen te beantwoorden.

Waar er aanvankelijk heel wat enthousiasme was voor de innovatie van AI en de mogelijkheden die de toepassing bood, is dat zeer snel geëvolueerd tot een grote desillusie wegens de vaak ronduit foutieve informatie die wordt verstrekt. Ondertussen zijn we gekomen tot een situatie waarin men AI gaat evalueren en gaat bekijken waarvoor men het functioneel en efficiënt kan gebruiken. Goed om weten is alvast dat je AI moet beschouwen als een gigantische rekenmachine die ziet wat het meeste voorkomt op internet en in allerhande gegevensbanken en die van daaruit gaat beslissen welk antwoord jij krijgt.

Vanuit dat opzicht werden binnen DPG Media onderstaande Do’s en Don’ts opgesteld:

DO’s
- AI Is een hulpmiddel. Controleer altijd de informatie die het genereert. De mediamaker blijft eindverantwoordelijk.
- Wees transparant naar je publiek en laat duidelijk weten wanneer je teksten of beelden gebruikt die door AI werden gegenereerd.
- Zet ‘chat history’ uit in ChatGPT, zoniet worden je prompts bewaard en verder gebruikt voor het trainen van het model.
DON’Ts
- Stuur geen interne, vertrouwelijke data en gegevens naar AI-diensten.
- Gebruik de output van AI niet direct als content voor je publiek of product.
- Koop niet zelf licenties voor AI op naam van DPG Media.

Voor de journalistiek worden er drie grote valkuilen gedefinieerd:

Journalisten gaan feitelijke onjuistheden publiceren door generatieve AI omdat AI een grote foutenmarge heeft.
De nieuwsstroom kan manipulatief zijn voor de journalist. De creatie van fake news als afleiding en de concurrerende snelheid in de nieuwsvoorziening vergroot de kans op fouten.
AI vergroot het wantrouwen in de journalistiek door de grote foutenmarge in AI modellen. De chatbot geeft nu al verwijzingen naar nieuwstitels die nooit zijn gemaakt, zoals The Guardian vaststelde.

Tegenover de valkuilen staan er evenwel ook zes opportuniteiten voor de journalistiek. De eerste twee situeren zich op het vlak van de creatie van een artikel of reportage, de volgende vier op het vlak van de publicatie.

1. Journalisten kunnen AI gebruiken als onderzoekshulp omdat AI het denk- en onderzoeksproces versterkt.

Formuleren van onderzoeksvragen
Bedenken van relevante interviewvragen
Opzetten van verhaallijnen
Uitvoeren van data-analyse (bv Pinpoint van Google)
Verkrijgen van publieksinzichten: welke vragen leven er bij jouw lezer?

2. Journalisten kunnen AI gebruiken als schrijfhulp.

Schrijven van artikelkoppen en intro’s
Bedenken van invalshoeken
Bedenken van follow-ups op basis van het model voor publieksbehoeften
Geautomatiseerd schrijven van live blogs

3. AI kan visuele content maken en illustraties of foto’s en video’s genereren die veel beter bij de reportage passen dan de klassieke ‘stock’-foto’s. De ontwikkeling ter zake gaat zeer snel. Probleemsituaties doen zich evenwel vaak voor bij de afbeelding van mensen (armen, handen, vingers, ogen, …)

Voorbeelden: Dall-E, Midjourney

4. AI kan helpen bij vertalingen van de content en zeer snel en slim vertalen naar de taal die de voorkeur heeft. Relevant omdat we dit hiermee alle groepen van de samenleving kunnen bereiken, expats, migranten, toeristen. Een translator kit kan eenvoudig worden ingebouwd in een app - waarmee een gebruiker een taal van voorkeur kan instellen. Nu kan dat al met een een-op-een standaard translator kit, die bij de Ship IT hackaton al werd toegepast in de freemium-app (HLN/AD) onder de naam Tik Tolk. Met gen AI kun je de kwaliteit verhogen, en de toon en stijl aanpassen.

5. AI kan helpen bij samenvattingen van content en lange artikels toegankelijker maken door die in te korten. Lange artikelen toegankelijk maken naar kortere content. Handig omdat je snel ingewikkelde onderzoeken kunt samenvatten. Bovendien relevant omdat we dit kunnen gebruiken om o.a. jongere doelgroepen te bereiken. Van langere kwalitatieve artikelen naar voor jongeren toegankelijke ‘snippets’ van die journalistieke verhalen. Bij de Ship IT hackaton werd hier al een demo van gegeven, onder de naam Nibble. Gen AI zal de kwaliteit van deze verkortingen verhogen.

6. AI kan communicatie en interactie bevorderen met het publiek en kan geautomatiseerd vragen beantwoorden voor je lezer. Je kan gaan zoeken naar de beste artikels over een bepaald onderwerp of wie de expert op de redactie is rond een bepaald thema en die artikels zoeken. Verhalen kunnen beter tot bij het publiek worden gebracht door hen boven het artikel of de inleiding te voorzien van een door AI gegeneerde samenvatting door middel van enkele bullet points. Geef wel aan dat AI die samenvatting heeft gemaakt en dat je die als journalist/redactie hebt gecheckt.

SmartOcto is een toepassing die je adviseert hoe je een artikel aantrekkelijker kan maken, welke titels je erop kan plaatsen, hoe je de leesbaarheid van moeilijke paragrafen of lange woorden kan verbeteren. Dat wil niet meteen zeggen dat je automatisch gemaakte titels moet gebruiken. Als mediamaker blijf je uiteraard verantwoordelijk voor de koppen die je boven een artikel plaatst.

AI Tools

Als journalist moeten wij ons, aldus Dominique Deckmyn, zorgen maken over generatieve AI omdat er heel wat misverstanden de ronde doen. Het probleem van generatieve AI zijn de zogenaamde ‘hallucinaties’ waarbij het AI-platform gaat dwalen en foute informatie verstrekt; het is een fundamenteel gebrek van die generatieve AI-tools en het geraakt maar niet opgelost. Verder heersen er aardig wat verkeerde vooronderstellingen bij uitgevers; men denkt dat generatieve AI een aantal dingen kan, maar die zijn absoluut niet veilig. Bovendien wil iedereen generatieve AI proberen maar gaandeweg ontdekt men talloze problemen.

Wij weten op dit ogenblik hoe wij Google en Wikipedia moeten gebruiken maar hebben er hoegenaamd geen idee van hoe wij ChatGPT moeten hanteren. Het is een nieuwe manier om te interageren met informatie en eigenlijk zou elke journalist enkele tientallen uren moeten doorbrengen met uiteenlopende generatieve AI-toepassingen om het enigszins te door te hebben, te weten dat het grondig mis kan lopen.

Ook moeten wij ons als journalisten realiseren dat uitgevers ermee willen werken. Alleen rijzen er daaromtrent aardig wat vragen: wie beslist er hoe wij generatieve AI moeten gebruiken, wie krijgt er controle over, wie geeft de journalist toelating om AI te gebruiken en wie is er verantwoordelijk wanneer er wat fout loopt door het gebruik van generatieve AI?

(1) Interessant zijn zonder meer de transcriptietools waarmee je een interview snel kan laten uittikken. Het volstaat om interviews op te nemen via een smartphone, die doorgaans een betere opnamekwaliteit garandeert dan de klassieke dictafoons en die – afhankelijk van het toestel – ook achtergrondgeluiden neutraliseert. Soms negeren dergelijke transcriptietools zelfs automatisch stopwoordjes als ‘euh’.

Whisper: open-source transcriptieserver van OpenAI

Wanneer je interviews online opneemt via Teams of Zoom kan je in de instellingen automatisch transcriptie activeren en word je interview uitgetikt tijdens de opname ervan.

Aanbevolen transcriptietools zijn:

Sterkte: erg goed voor Vlaamse accenten

Zwakte: interface. Je krijgt een blok tekst terug (met tijdcodes)

Microsoft 365 beschikt over een ingebouwde transcriptie-tool. Het volstaat om een nieuw Word-document te openen, te klikken op het microfoontje bovenaan en te kiezen voor transcriberen. Let wel, het gaat om de betalende of abonnementsformule van Office 365!

Sterkte: goede interface, voor iedereen beschikbaar, snel

Zwakte: matige kwaliteit, geen Belgisch Nederlandse optie

Trint: commerciële transcriptieserver

Sterkte: goede interface

Toegang: aanvragen.

Wanneer het interview te lang is, kan het zijn dat het niet integraal wordt aanvaard voor transcriptie. In dat geval is het aanbevolen om het interview in stukken te knippen via Audacity. Weet dat transcriptie kan fout lopen bij namen van personen of organisaties, bij afkortingen en bij vakjargon. Best noteer je die gegevens schriftelijk tijdens het interview. Controleer de transcriptie meteen na het interview om er zeker van te zijn dat alles is omgezet.

Aanvankelijk vergt het gebruik van transcriptie-tools misschien wat tijd. Eens je het routinematig kan gebruiken en je niet meer hoeft na te denken over het gebruik ervan, levert het je een flinke tijdsbesparing op bij het uittikken van interviews. Leuk is alvast dat je quotes nu ook echt letterlijk kan citeren.

(2) AI Chat is vooral een nieuwe manier om te interageren met informatie. Belangrijk om weten is dat ChatGPT niet weet waar die informatie vandaan komt. Soms is de informatie verouderd omdat zij wordt gehaald uit een verouderde database. Zo baseert de gratis versie van ChatGPT zich bijvoorbeeld op een oudere database uit 2022, waardoor zij bijvoorbeeld niet op de hoogte is van het conflict tussen Israël en de Palestijnen (oktober 2023). Hoewel er geen actuele informatie wordt gegeven, kan de achterliggende bron voor toelichting Wikipedia, Reddit of zelfs één of andere obscure blog zijn.

Trainingsfase: unsupervised learning (op databases als CommonCrawl)

Nederlandstalig gebruik je best ChatGPT4 in plaats van ChatGPT 3.5 omdat de nieuwe versie meer aankan en ook beter overweg kan met onze taal.

Realiseer je ook dat alle generatie AI-toepassingen draaien op uiteenlopende databases waardoor het respectieve antwoord ook anders kan zijn. Wij weten bijgevolg niet welke CommonCrawl-database het platform voedt; het trainingsmateriaal van de meeste taalmodellen is een zootje. Hoe meer informatie het trainingsmateriaal bevat, hoe beter het antwoord.

Maar, het trainingsmateriaal wordt niet geüpdatet en leert bijgevolg nooit bij! Je weet dus niet waar de antwoorden vandaan komen. Het trainingsmateriaal wordt getraind op vier manieren:

Correctiefase: reinforcement learning with human feedback (RLHF) (bias verwijderen)
Bijtrainen op kleiner, gespecialiseerd corpus: bijvoorbeeld de redactiesearch van De Standaard
De informatie die je zelf hebt meegegeven in de ‘prompt’ of opdracht.

De AI Chat is bijgevolg goed voor:

Het verkennen van een onderwerp, maar beschouw dit niet als research. Het kan wel de beginfase zijn om je research aan te vatten.
Het genereren van ideeën en benaderingen, het verzinnen van vragen voor een interview (brainstorm).
Het zoeken van alternatieve formuleringen voor titels, omschrijvingen van moeilijke begrippen, inleidingen.
Het ‘ondervragen’ van een specifiek (lang) document ‘ondervragen’ zoals een pagina’s lang gelekt rapport of wetsvoorstel.

Hou alleszins de ‘AP-regel’ in gedachten: beschouw ChatGPT als ‘unvetted source’. De ultieme test bestaat erin om de chatbot te vragen om je eigen biografie te genereren en te zien wat er daaruit voortkomt en vervolgens wat details op te vragen. Ga bijvoorbeeld ook verder in op foutieve informatie die wordt gegeven en vraag daarover wat aanvullende informatie. Je zal vaststellen dat de chatbot volop gaat ‘hallucineren’ en allerlei op het eerste gezicht ‘realistisch ogende’ en ‘zelfverzekerde hallucinaties’ gaat spuien.

Deze hallucinaties zijn onjuiste, maar statistisch waarschijnlijke ‘feiten’. De cijfers hoe vaak chatbots hallucineren, zijn zo goed als onvindbaar maar er wordt uitgegaan van 15% tot 20% of omgerekend één op de zes tot één op de vijf antwoorden. De hallucinaties doen zich het vaakst voor bij onderwerpen waarvan weinig bronnen in het trainingsmateriaal van de chatbot zitten. De chatbot ‘vult aan’ op basis van typische patronen. Dergelijke hallucinaties kunnen zich voordoen bij elk gebruik van generatieve AI. Er is geen sluitende oplossing en die zal er in de nabije toekomst ook niet zijn.

Probeer alleszins dezelfde of gelijkaardige vraag in een andere chatbot voor generatieve AI. Het kan zijn dat die chatbot een beter antwoord genereert. Zo draait Bard sinds kort op Gemini Pro in plaats van Palm 2! Naast Bard is er ook Google Generative Search Experience (GSE), maar dat is nog niet toegankelijk vanuit België.

Goede resultaten worden ondertussen (december 2023) genoteerd voor Bing dat met Bing Chat Enterprise/Copilot over een, betalende, zakelijke toepassing beschikt en dat ook wordt gestuurd door het meer recente ChatGPT4. Daarom is het ook aangewezen om voor generatieve AI-toepassingen over te schakelen op Microsoft Edge in plaats van Google Chrome; je kan probleemloos alle plug-ins van Chrome overzetten naar Microsoft Edge.

De Bing ‘sidebar’ in de Microsoft Edge browser is op dit ogenblik ideaal voor het ‘ondervragen’ van een tekst. Bovenaan rechts bevindt zich een icoontje waarmee je terecht komt op Copilot. Wie beschikt over Windows 11 kan de Copilot ook activeren vanuit de toolbar.

Copilot laat je toe om teksten samen te vatten, te vertalen of inhoudelijke vragen te stellen. Je chat over de inhoud van de respectieve webpagina maar het werkt ook voor een PDF-document dat je online kan uploaden of dat zich op je harde schijf (rechtermuisklik en ‘openen’ met Edge) bevindt. Let wel op, niet alle antwoorden komen uit het document! Controleer dat altijd!

Waarvoor is ChatGPT nu goed voor? Het voordeel ervan is dat de toepassing nooit moe wordt. Daar tegenover staat dat de meest voor de hand liggende antwoorden of ideeën steeds als eerste komen. Probeer daarom altijd om extra elementen toe te voegen aan je vraag waardoor ChatGPT dieper moet gaan graven.

Langere prompts werken vaak beter, hoe meer woorden, hoe meer context. Preciseer het soort antwoord dat je zoekt of de stijl.
Doorvragen! Als het antwoord niet voldoet, preciseer dan. De tweede of derde doorvraag is vaak de goeie. ‘Leg het eenvoudiger uit, aan een achtjarige’. ‘Geef meer details en enkele voorbeelden’.
Probeer van nul opnieuw met een andere formulering
Probeer in een andere taal want daarvoor worden vaak andere bronnen doorzocht. Wanneer je een vraag in het Nederlands stelt, worden doorgaans eerst Nederlandstalige bronnen doorzocht, die vaak schaarser zijn van bijvoorbeeld Engelstalige.

Hoedanook, weet dat het risico dat ChatGPT gaat ‘hallucineren’ één op de zes tot één op de vijf is. Wanneer je niet meteen doorhebt dat ChatGPT aan het ‘hallucineren’ is en je verder doorvraagt, blijft de toepassing verder ‘hallucineren’. Stel dan je vraag opnieuw in een andere chatbot! Ga een tekst die je via ChatGPT hebt ontvangen nooit rechtstreeks ‘copy-pasten’, want dat wordt vrij snel opgemerkt door de lezer.

AI en de ‘workflow’

Heel veel generatieve AI-toepassingen die zich de voorbije jaren nog in een onderzoeksfase bevonden, worden stilaan geïmplementeerd bij onder meer de VRT, aldus Tom Van de Weghe. Vanuit dat oogpunt participeert de VRT in het Europese ‘AI for News’-project waarin onder meer wordt gewerkt aan een ‘Zwitsers zakmes’ dat verschillende AI-tools bundelt ten behoeve van nieuwsredacties.

Zo is er onder meer VRT Newsify waarin allerhande statistische data worden opgeladen om er vervolgens een nieuwswaardig verhaal uit te distilleren. Een andere, fact-checking, toepassing is het van origine Noorse Tank Classifier dat foto’s van legertanks en artillerie analyseert en je bijvoorbeeld verduidelijkt of het om een Russische, Oekraïense of andere tank gaat.

De Smart News Assistant draait op dit ogenblik nog in een testfase maar kan worden ingezet vanaf de brainstorming voor een reportage tot en met de creatie van de volledig uitgewerkte reportage. AI Butler is een recente toepassing die video’s gaat genereren bij een tekst en die er ook aanvullende informatie en tekst bij verstrekt. Curator Video gaat nog een stap verder en bewerkt een video naarmate het uitgeschreven verhaal vordert.

VRT zet vanuit die context een eigen toepassing op die wordt gevoed door de eigen video-database en die van daaruit ‘nieuwe’ video’s gaat samenstellen met betrekking tot een persoon of onderwerp. Artificiële intelligentie maakt er ook atomaire inhoudsdelen van die vervolgens automatisch kunnen worden omgezet in titels, inleidingen of bullet points die eventueel verder kunnen worden gebruikt om te communiceren via social media-kanalen zoals Instagram en Tiktok.

Mimir genereert teksten en videobeelden op basis van quotes en maakt daarvan zonodig ook snelle montages. Het herkent gezichten van bekende personen en gaat beelden ook automatisch labelen om die nadien verder te kunnen gebruiken. Daarom worden alle nieuwe opnamen automatisch getranscibeerd en gelabeld. Vergelijkbare toepassingen zijn onder andere Ject en Television.

Geneea ontwikkelde een AI-toepassing die grote hoeveelheden tekst en social media analyseert en die van daaruit verhalen creëert.

Notion is zo goed als een virtueel notaboekje dat je onderweg kan gebruiken en waarin je info kan noteren. Het kan ook de nodige samenvattingen genereren.

Pinpoint is onderdeel van Googles Journalist Studio en geeft je de mogelijkheid om een eigen werkruimte te creëren waarbinnen je allerlei interessante, vergrendelde, documenten kan openen en opslaan met het oog op latere reportages.

Tot slot zijn er nog tal van andere AI-toepassingen zoals Deepl voor vertalingen, Adobe Voice Enhancer, Krisp om geluidsopnamen te ontdoen van overbodige achtergrondgeluiden of Eleven Labs dat tekst omzet in spraak. Specifiek voor beeldmateriaal zijn er Leonardo, Topaz en Dall-E waarmee je originele en rechtenvrije foto’s kan maken.

Rechtenvrije muziek en deuntjes worden dan weer gecomponeerd door Soundraw.

Binnen ChatGPT kan je een specifieke Journalist Toolbox aanmaken waarin je de nodige, strakke, parameters kan ingeven voor het maken van ‘eigen’ teksten. Wanneer je daarvan gebruik maakt, is en blijft het alleszins aangewezen om de gegenereerde teksten dubbel te checken en te verifiëren of informatie en tekst wel degelijk bruikbaar zijn.

Slot

De workshop toonde aan dat wij als journalisten dankzij generatieve AI kunnen beschikken over een ‘super power’ die onder andere toelaat om saaie en vaak tijdrovende taken over te nemen. Wel staat vast dat het probleem van desinformatie gaat toenemen en dat de rol die journalisten opnemen als ‘gatekeeper’ veel belangrijker gaat worden.

De vraag is of wij altijd bekend moeten maken of inhoud werd gegenereerd via AI. Op termijn zal dat steeds moeilijker worden wanneer je ziet hoeveel zaken nu al kunnen worden uitgewerkt met behulp van generatieve AI. Een workshop, zoals die heden werd gegeven, zal in de nabije toekomst mogelijk overbodig zijn omdat AI overal in de ‘workflow’ wordt geïntegreerd.

Wij zullen ermee moeten leren leven en werken maar wij moeten ons wel voldoende realiseren dat mensen nog altijd beter reageren op inhoud die is gemaakte door menselijke journalisten dan door AI-robots.

Verslag: Geert Van Lierde