Waar ik me de afgelopen week over verwonderd heb, als het gaat om generatieve AI (deel 2)

Ook de afgelopen week heb ik me weer verwonderd over nieuwe mogelijkheden en de toegenomen kracht van generatieve AI-toepassingen. Het gaat daarbij om zeven zaken.

Claude voor het onderwijs

Anthropic heeft een nieuwe versie van Claude gelanceerd, speciaal voor het onderwijs: Claude for Education. Zij willen hiermee lerenden helpen om kritisch te leren denken, in plaats van simpelweg kant-en-klare antwoorden te leveren. Claude for Education kent daarom de “Learning Mode”. In deze modus geeft Claude geen directe oplossingen, maar stelt het juist vragen. Zo begeleidt de AI lerenden bij het denkproces en ligt de focus op begrip van de stof. Daarnaast biedt Claude for Education praktische hulpmiddelen, zoals sjablonen voor werkstukken of studieplanners, en kan het fungeren als een soort digitale tutor. Anthropic wil zich hiermee, net als OpenAI, profileren als partner van het onderwijs bij het ontwikkelen van denkvaardigheden. Een aantal functionaliteiten, zoals het ontwikkelen van een studieplanner, zie je ook terug in Google Notebook LM. Ik beschik over een Professional Plan, en niet over een Education plan. Ik heb er dus zelf niet mee kunnen werken. Het ziet er m.i. wel veelbelovend uit.

OpenAI’s ChatGPT 4.5 slaagt voor de Turing-test

Kan een computer ons overtuigen dat hij menselijk is in een gesprek? Dat is de vraag achter de beroemde Turing Test. Onderzoekers aan de UC San Diego hebben onlangs aangetoond dat AI-systemen consistent slagen voor Alan Turings bekende test op het gebied van machine-intelligentie. Zij lieten mensen vijf minuten chatten met zowel een andere persoon als een AI-systeem. Daarna moesten ze raden wie de computer was. OpenAI’s GPT-4.5 werd in bijna driekwart van de gevallen aangezien voor een mens. Dat is significant vaker dan de echte mensen in de test. Een ander geavanceerd model, LLaMa-3.1, presteerde vergelijkbaar met mensen (56% als mens gezien), terwijl oudere modellen zoals ELIZA en GPT-4o duidelijk door de mand vielen. Dit is m.i. een duidelijke illustratie van de toenemende kracht van GenAI.

AI-chatbot als therapeut?

Kan een AI-chatbot helpen bij psychische klachten? Onderzoekers van Dartmouth ontwikkelden Therabot, een chatbot getraind in cognitieve gedragstherapie (CGT). De resultaten zijn opvallend. In deze klinische studie met ruim 100 deelnemers met depressie, angst of eetstoornissen, bleek het gebruik van Therabot via een app de symptomen significant te verminderen. Depressieve klachten namen gemiddeld met 51% af, angst met 31%, en zorgen over eetpatronen en gewicht met 19%. Opmerkelijk was ook het vertrouwen dat deelnemers in de chatbot stelden; dit was vergelijkbaar met het vertrouwen in een menselijke therapeut. Deelnemers gebruikten de app actief, vaak ook buiten kantoortijden wanneer reguliere hulp minder beschikbaar is. De onderzoekers benadrukken trouwens dat Therabot een aanvulling is op bestaande therapie, geen vervanging. Twee dingen zijn zijn namelijk hierbij van belang: de chatbot is specifiek getraind op bewezen CGT-technieken, niet op algemene data. Bovendien was er constant menselijk toezicht om de veiligheid en kwaliteit van de AI-reacties te waarborgen. Hoewel AI zoals Therabot de toegang tot ondersteuning kan vergroten, blijft deskundige menselijke begeleiding volgens de onderzoekers van groot belang. Dit onderzoek laat zien dat AI gebruikt kan worden voor terreinen die tot voor kort alleen door mensen werden ‘betreden’. AI-toepassingen worden dus niet alleen krachtiger, maar ook veelomvattender.

Hoe je betere afbeeldingen kunt laten genereren met behulp van ChatGPT

Verleden week schreef ik over de verbeterde mogelijkheden van ChatGPT 4o om afbeeldingen te genereren. Ik heb daar deze week verder mee geëxperimenteerd. Ik vroeg mij onder meer af of het mogelijk was om een bekende foto wat betreft kwaliteit dicht te benaderen met behulp van ChatGPT 4o. Ik heb daarvoor de volgende bekende foto van Charles Clyde Ebbets uit 1932 gebruikt (deze kun je namelijk rechtenvrij gebruiken).

Lunc at top of Skycraper — Door: Charles Clyde Ebbets, Public domain, via Wikimedia Commons

Ik heb de volgende prompt gebruikt:

Maak een afbeelding en wel een foto-realistische afbeelding van een groep bouwvakkers die bovenop een in aanbouw zijnde wolkenkrabber lunchen.

Dit was het resultaat:

Jij bent een ervaren fotograaf en recensent voor de World Press Photo. Bijgevoegd tref je een beroemde originele zwart-witfoto aan en een kleuren reproductie. Beargumenteer op basis van jouw expertise waarom de zwart-wit foto kwalitatief beter is dan de kleurenfoto.

Claude kwam met diverse opmerkingen die te maken hadden met compositie en uitsnede, contrast en details, authenticiteit, historische context, en ’tonale nuances’. Ik heb deze opmerkingen gekopieerd en ben weer naar ChatGPT gegaan. Ik heb vervolgens de vraag gesteld:

Maak hier een zwart-witfoto van waarbij je rekening houdt met de volgende opmerkingen:

Vervolgens heb ik de opmerkingen geplakt, met als resultaat:

Je ziet nog steeds duidelijke verschillen met het origineel. Gelukkig voor de professionele fotografen. Toch benadert deze foto het origineel m.i. best goed. En dat binnen enkele minuten op basis van een vergelijking die -in dit geval- Claude 3.7 Sonnet maakt van het origineel en een eerste AI-gegenereerde versie.

Video samenvatten dankzij Google Notebook LM

Verleden week blogde ik ook over de nieuwste mogelijkheden van Google Notebook LM. Deze week stuitte ik op de video Jesse Klaver vs. Jesse Frederik – Waarom wint links geen verkiezingen? Het onderwerp gaat me aan het hart. Maar een video van bijna twee uur kijken, trek ik niet. Daarom heb ik binnen Google Notebook LM een nieuw Notebook aangemaakt, en de URL van deze YouTube-video als bron toegevoegd. Ik kreeg al snel een korte samenvatting en heb vervolgens een mindmap en een lijst met veelgestelde vragen laten maken. Op deze manier heb ik toch de belangrijkste informatie tot mij kunnen nemen.

Hoe gebruiken OU-studenten en docenten AI?

Bij mijn voormalige werkgever de Open Universiteit hebben ze onderzocht hoe studenten en docenten AI gebruiken. ChatGPT domineert het GenAI-landschap binnen de Open Universiteit, met gebruikscijfers van 96% onder studenten en 95% onder docenten.Alternatieve tools zoals Gemini, Claude en Perplexity worden beduidend minder benut. Studenten passen GenAI voornamelijk toe voor schrijfondersteuning en kennisverwerving, terwijl docenten deze technologie inzetten voor het maken van samenvattingen, examenvragen en lesmateriaal. Beide groepen gebruiken GenAI zelden voor activerende leeractiviteiten zoals reflectie, leerdoelen formuleren of het ontwerpen van interactieve leercomponenten. Studenten en docenten geven overigens aan dat ze weinig vertrouwen hebben in de informatie die de AI-tools genereren. Er bestaat een duidelijke behoefte aan meer ondersteuning, richtlijnen en verbetering van AI-geletterdheid. De online cursus ‘AI4OU – Slimmer met AI: basisvaardigheden voor de toekomst’ vormt hiervoor een eerste aanzet.

AI-modellen verhullen hun redeneerprocessen

Een recent onderzoek van het Alignment Science Team van Anthropic laat zien dat AI-modellen vaak hun werkelijke redeneerprocessen verbergen wanneer ze antwoorden uitleggen aan gebruikers. De onderzoekers hebben gekeken naar Claude 3.7 Sonnet en DeepSeek R1. De modellen kregen hints zoals gebruikerssuggesties en visuele patronen. Daarna werd gecontroleerd of ze eerlijk toegaven deze hints te gebruiken in hun uitleg. Daarbij viel op dat nieuwere large language modellen weliswaar beter presteerden dan eerdere versies, maar dat deze nieuwe versies nog steeds tot 80% van hun werkelijke redeneringen tijdens tests verbergt. Bovendien bleken de modellen minder transparant bij het uitleggen van complexere vraagstukken. Deze resultaten wijzen erop dat het monitoren van gedachteprocessen een veelbelovende methode is om ongewenst gedrag tijdens training en evaluaties te signaleren. Dit is echter niet voldoende om ongewenst gedrag volledig uit te sluiten. Als deze modellen hun werkelijke redenering niet betrouwbaar weergeven, kun je je afvragen in hoeverre je kunt vertrouwen op hun verklaringen bij complexere taken.

Mijn bronnen over (generatieve) artificiële intelligentie

Deze pagina bevat al mijn bijdragen over (generatieve) artificiële intelligentie, zoals ChatGPT.

This content is published under the Attribution 3.0 Unported license.

Geef een reactie