English version of this page

Ville GPT UiO måtte gå av som utdanningsminister?

I disse dager er statsråder i hardt vær for å klippe andres arbeid litt ukritisk inn i egne oppgaver. Men ville stastråd GPT UiO måtte gå av som minister for høyere utdanning? Superenkel forskning viser at svaret er ja.
(English version of this article)

Bildet kan inneholde: produkt, erme, font, halsbånd, elektrisk blå.

Redigert bilde av VGs artikkel om Sandra Borchs avgang som forsknings- og høyere utdanningsminister. Bildet er ment humoristisk.

Hva er fusk?

For å kunne svare på hvorvidt GPT UiO ville bli tatt i fusk, må vi først diskutere hva fusk er for noe. Dette står beskrevet på UiOs nettside om fusk, men for meg virker det som om denne siden er mer opptatt av å fortelle hva som kan gi "mistanke" om fusk, heller enn hva fusk faktisk er. Kanskje er dette etter hensikt, fordi hva som er fusk er en skjønnsmessig beslutning fra fag til fag og kontekst til kontekst. Men slik jeg leser disse retningslinjene, virker det som fusk er en av tre ting (mine sammenfattede punkter):

1: Plagiat

Dette er når du presenterer andres tekst og resultater som dine egne. Det er i utgangspunktet lov å vise til andres arbeid, men da skal alltid skillelinjene framgå mellom hva som er ditt, og hva som er andres, arbeid.

2: Ukorrekt kildehåndtering

Dette er når du oppgir kilder på en ukorrekt måte* eller presenterer ikke-eksisterende kilder for påstander i din tekst.

3: Bruk av ikke-tillatte hjelpemidler i vurderingssituasjonen

Ulike vurderingssituasjoner har ulike regler for hva som er tillatt. I noen situasjoner er lærebok, samarbeid eller GPT UiO tillatt, og andre ikke. Dersom du benytter GPT UiO i en situasjon hvor dette ikke er et godkjent hjelpemiddel, er det juks, ferdig snakka.

*Skillelinjen mellom hva som er slurv og hva som er fusk er nok ikke krystallklar. I utgangspunktet vil nok noen som bedømmer hvorvidt en oppgave er fusk kunne se mellom fingrene på ukorrekt kildehåndtering dersom det virker å være uten ond hensikt. Samtidig vil jeg ikke tro at man kan gjemme seg bak unnskyldning om slurv dersom hele det skriftlige arbeidet er preget av systematisk ukorrekt kildehåndtering. Problemet her er vel at hva som er fusk faktisk ikke er så lett å definere, noe som kommer tydelig til syne når universitetsansatte blir nødt til å diskutere dette på nasjonal debatt.

Undersøkelsen

Det mer interessante spørsmålet er dermed: Hvis GPT UiO er tillatt som hjelpemiddel, kan du da ende opp med å fuske ved et uhell? For å teste dette, skrev jeg seks tekster på ca. 200 ord hver om mitt fagfelt - fysikk - på løpende bånd: "Fotoelektrisk effekt", "Kollisjoner", "Kvantefysikk", "Magnetisme", "Termofysikk" og "Tidsdilatasjon". Hver tekst ble skrevet svært ukritisk på ca. 5 minutter.

Deretter sendte jeg alle tekstene inn i GPT UiO med instruksen: "Forbedre denne teksten." etterfulgt av [mellomrom], tittel og tekst.

Bildet kan inneholde: font, skjermdump, parallell. — Figur 1: bruk av GPT UiO for å forbedre min tekst.

Deretter ga jeg GPT UiO, i en ny chatsesjon, følgende prompt: "Skriv en tekst på ca. 200 ord om det fysiske temaet: [TEMA]". Dermed fikk jeg totalt 3 tekster per tema: min egen, GPT UiOs forbedrede versjon, og GPT UiOs egen. Alle tekstene er vedlagt denne artikkelen, nederst.

Deretter sendte jeg alle dokumentene inn i copyleaks [1,2] for å se hvilken plagiatprosent den oppdaget på alle de ulike variantene. Da jeg først så oversikten, ble jeg overasket over tallene: flere av oppgavene så ut til å komme ut med opptil 80 og 90% plagiat! Nærmere undersøkelse viste at de høye prosentene kom fra likheter innad i de tekstene jeg hadde lastet opp. F.eks. viste det seg at "termofysikk - uiogpt forbedret" hadde en plagiatprosent på 96%, men at denne stammet fra "termofysikk - min tekst", som jo ikke er urimelig. Etter å ha filtrert bort disse treffene endte jeg opp med nærmest ingen plagiat på noen av tekstene. Forundret og noe mistenksom over resultatet valgte jeg å gjenta prosessen etter å ha oversatt alle tekstene til engelsk (også vedlagt). Denne gangen slo plagiatkontrollen ut med mange treff [3], og resultatet er gitt under.

Bildet kan inneholde: rektangel, skråningen, font, parallell, mønster. — Figur 2: Plagiat og parafrasering ved bruk av GPT UiO.

Jeg har valgt å skille mellom Plagiat og Parafrasering. Copyleaks skiller mellom tre kategorier: "Identical", "Minor changes" og "Paraphrased", og for enkelthets skyld har jeg plassert de to første kategoriene under "Plagiat".

Parafrasering

Parafrasering likner veldig på det mange av oss millenials gjorde på ungdomsskolen i internettets spede barndom; nemlig ta en kilde fra internett og parafrasere slik at vi ikke kunne bli "tatt" av læreren. Under er et eksempel, hvor copyleaks har fargekodet med oransje det den anser som parafrasering.

Bildet kan inneholde: produkt, font, skjermdump, programvare, nettside. — Figur 3: Parafrasering i GPT UiOs egen tekst om magnetisme. Copyleaks kvantifiserer dette som at 39.8% av teksten er parafrasert fra kilden som er vist til høyre. Inkludert de andre treffene konkluderte copyleaks med at 52.5% av denne teksten var parafrasert av andre kilder.

Er parafrasering fusk? Parafrasering vil ikke nødvendigvis utløse en sanksjonsreaksjon, men man er ute på tynn is. I utgangspunktet, dersom du parafraserer en kilde, kreves det at man oppgir den kilden, og brudd på dette kan ligge i et grenseland mellom punkt 1 og 2 av hva som er fusk. Men skillelinjene er ikke supertydelige - og skjønn kommer inn i bildet. I eksempelet ovenfor, ser vi et eksempel på en parafrasering av definisjonen av magnetisme - noe som kanskje er generelt nok til å være innafor. Dersom du parafraserer meninger, eller mindre generelt aksepterte sannheter, kan parafrasering uten kildehenvisning bli et mer alvorlig problem. I eksempelet ovenfor er det dessuten tydelig at GPT UiO har "lånt" språklige bilder av denne internettkilden, og at dersom jeg hadde sett dette i mitt arbeid som sensor, ville det definitivt gitt negativt utslag på helhetsinntrykket - og kanskje karakteren.

Plagiat

Det som derimot er mer klart, er at plagiat er fusk. Dersom du kopierer andres ord inn i ditt eget arbeid uten anførselstegn og kildehenvising, er det fusk. Men også her må det anvendes noe skjønn. For eksempel ser vi at selv i den lille teksten jeg skrev for denne undersøkelsen, ble noen av formuleringene tatt til å være plagiat. Nærmere undersøkelser viste at noen av disse var ekstremt lett reproduserte setninger, for eksempel denne.

Bildet kan inneholde: font, skjermdump, rektangel, parallell. — Figur 4: Eksempel på plagiat i min tekst om kollisjoner. Eksempelet viser at "plagiat" ikke nødvendigvis er plagiat.

Du skal lete lenge før du finner en sensor anser denne åpenbare setningen som et spesielt alvorlig tilfelle av plagiat. Noen få prosenter utslag på en plagiat-test kan dermed være uproblematisk - spesielt hvis temaet er så generelt som "kollisjoner". I GPT UiOs egen tekst om kollisjoner, derimot, ser vi et mer alvorlig eksempel:

Figur 5: Når GPT UiO plagierer, blir det fort at det faktisk er plagiat.

I dette tilfellet ville mine sensorbriller blitt noe mer duggete.

Noen råd til oppgaveskriving

Fra disse undersøkelsene slår det meg at utdanningsminister GPT UiO hadde vært ute i hardt vær - og hadde sannsynligvis blitt avsatt. Men hva skal en stakkars skrivelei student tenke? Avslutningsvis vil jeg gi tre skriveråd i språkmodellenes tid.

1. Tenk på din oppgave som rakfisk

Rakfisk er stort sett trygt å spise, men i sjeldne tilfeller kan den skrekkelige bakterien Clostridium botulinum gro og forårsake botulisme, en potensielt dødelig sykdom. Denne bakterien gror dersom rakfisken blir forurenset av jord og blir lagret på en uegnet plass [4,5].

Din oppgave er som rakfisk. Dersom du først lefler med å kopiere inn andres tekst (forurenset jord) direkte i oppgaven, selv med hensikt om å "fjerne det senere", kan det gi problemer lengre nede i veien. Hold derfor rakfisken din ren for slike bakterier - sørg for at du aldri limer andres tekst rett inn i ditt arbeid og ikke skriv i ditt dokument samtidig mens du leser en annen kilde.

2. Bruk GPT UiO som skrivecoach, ikke sekretær

Fra det vi har sett, er det tydelig at det å be GPT UiO om å forbedre en tekst per dags dato ikke medfører stor fare for plagiering eller parafrasering. Å få den til å skrive hele teksten for deg, derimot, kan som vi har sett resultere i en økt sjanse for plagiat eller hodeløs parafrasering. For å redusere sjansen for fusk, forsøk derfor å ikke falle for fristelsen å la den skrive for deg "fra scratch".

3. Ha eierskap til hele teksten

Det viktigste rådet er at du må ha eierskap til hele teksten. Selv om du bruker GPT UiO til å hjelpe deg å skrive, må du fortsatt stå inne for innholdet og kontinuerlig spørre deg selv "er dette en ukontroversiell påstand?", "har jeg faglig dekning for å hevde dette?", "føles dette som mine egne ord?" Dersom svaret på noen av disse spørsmålene er "nei", bør du gå en runde og sjekke om det finnes kilder som kan bygge opp under det du skriver og vise tydelig til disse. Da er kanskje ikke jobben som forsknings og høyere utdanningsminister ute av rekkevidde, allikevel.

Tekstene

Dersom du ønsker å gjøre din egen analyse på tekstene, så finner du alle vedlagt her.

Mappe med de norske tekstene.

Mappe med de engelske tekstene.

Fotnoter og kilder

[1] Man kan lure på hvorfor jeg ikke brukte UiOs egne verktøy "Ouriginal" her, og svaret er følgende. Ouriginal er forbeholdt sensorer og administrativt ansatte for å sjekke faktisk plagiat ved innlevering. Grunnen er til dels at filene som lastes opp her legges i en kildebase som fremtidige verk testes opp imot, slik at reglene for hva som lastes opp dit er strenge.

[2] Copyleaks er et verktøy utenfor organisasjonen UiO, men ettersom jeg kun sendte inn grønne data (se UiOs side for klassifisering av data), anser jeg bruken som rettferdiggjort i dette tilfellet.

[3] Hvorfor copyleaks gir nesten ingen treff på plagiat på norsk er jeg ikke sikker på, men her er det flere mulige forklaringer. Kanskje plagierer GPT UiO mindre på norsk enn på engelsk fordi det finnes mindre treningsdata. Kanskje har copyleaks mindre tilgang til norske sider å sjekke plagiat mot eller er dårligere til å detektere norsk plagiat. Jeg oppfordrer nysgjerrige lesere til å utforske saken videre.

[4] Eldrid Borgan, Slik unngår du å bli syk av rakfisken, forskning.no. Hentet 24.01.24. https://www.forskning.no/mat-og-helse-mikrobiologi-naturvitenskap/slik-unngar-du-a-bli-syk-av-rakfisken/1610995

[5] Matilsynet, Botulisme. Hentet 24.01.24. https://www.mattilsynet.no/mat-og-drikke/matproduksjon/lokalmat/lokalmat-innlandsfisk/botulisme-hos-innlandsfisk

Av Vidar Skogvoll - førstelektor ved KURT

Publisert 24. jan. 2024 15:41 - Sist endret 28. juni 2024 15:08