Forestil dig en tom tavle. Hvis den skal udfyldes, er det bedre at få tre rigtige og to forkerte ting på tavlen end nul ting overhovedet.
Men hvad, hvis tavlen allerede er fyldt og så får tilføjet flere ting – hvor nogle er rigtige og nogle forkerte? Er det så stadig en fordel?
Billedet stammer fra Carsten Bergenholtz. Sammen med kolleger fra Aarhus Universitet (AU) står han bag et nyt studie, der peger på, at brug af ChatGPT kan have flere negative effekter på, hvordan højtpræsterende studerende klarer sig til eksamenen – og faktisk også på deres kognitive proces.
Studiet er foretaget af fire forskere fra Institut for Virksomhedsledelse og Department of Management på Aarhus Universitet. De udførte forsøget med 141 business-studerende i slutningen af 2023, et år efter lanceringen af ChatGPT. I den periode talte forskerne om, at AI ville have en demokratiserende effekt på vores præstationer: At alle ville blive stærkere. Imidlertid havde de svært ved at genkende den teori fra deres eget undervisningslokale.
“Vi studsede især over, at de eksamensopgaver, de studerende skulle løse i andre AI-studier, var så velstrukturerede. Det elsker en sprogmodel, men det er sjældent den slags opgaver, vores studerende skal løse – og det er sjældent den slags opgaver, man skal løse inden for vidensarbejde generelt,” fortæller Carsten Bergenholtz.
Forskellig belastning
Derfor opstillede forskerne en ny eksamenssituation. De business-studerende, der deltog i forsøget, skulle løse to tidspressede og dårligt strukturerede opgaver: først én, hvor de ikke måtte bruge AI; derefter én, hvor de skulle bruge ChatGPT. Begge opgaver fik de 22 minutter til.
Resultaterne viste to meget forskellige mønstre.
Hvor de lavt præsterende studerende klarede sig væsentligt bedre i testen med ChatGPT, blev de bedst præsterende studerende udfordret af ChatGPT-assistenten.
For de lavt præsterende studerende hjalp ChatGPT med struktur, eksempler, sprog og en grundlæggende sammenhæng at arbejde ud fra. For de højt præsterende studerende var effekten modsat: De oplevede en øget arbejdsbyrde ved at skulle sammenligne, filtrere og integrere store mængder AI-genereret tekst med deres egen viden. Det betød, at de ofte endte med bare at kopiere svarene ind og således præstere dårligere end i første test.
Imidlertid var det ikke kun de studerendes performance, der påvirkedes forskelligt. Det gjorde også deres cognitive load, altså den mentale belastning, det kræver at bearbejde information.
”De lavt præsterende studerende oplevede stor belastning i den første test, men mindre i den anden. Modsat oplevede de højt præsterende studerende højere load i den anden test, fordi deres domæneviden og sammenligningsgrundlag var større. Det forstyrrede deres proces og kognitive bearbejdning,” fortæller Franziska Günzel-Jensen, medforfatter til studiet.
Ifølge Franziska Günzel-Jensen hænger den effekt sammen med sprogmodellens struktur:
“Måske kender du følelsen af at blive træt, når du arbejder sammen med en chatbot. Det kræver virkelig meget arbejde at vurdere, om det, den producerer, faktisk passer, fordi den er så velformuleret.”