generativ kunstig intelligens – Store norske leksikon

BERJAYA — Generative modeller trenes opp ved at de konsumerer store mengder data. Det mest klassiske eksempelet er bilder og tekst, hvor modellen lærer sammenhengen mellom tekst og bilde. Dette kan utnyttes senere til å genere nye bilder, ved at en bruker spesifiserer en tekst.

Axel Tidemann.

Lisens: CC BY SA 3.0

Generativ kunstig intelligens er teknikker innen maskinlæring der målet ikke bare er å analysere data, men også å lage nye data, for eksempel i form av tekst, bilder, lyd, video eller programmeringskode. Den mest utbredte bruken av generativ kunstig intelligens er gjennom samtaleroboter, som for eksempel ChatGPT.

Faktaboks

Etymologi: fra engelsk generative artificial intelligence
Også kjent som: generativ KI, generativ AI, GenAI

Generativ kunstig intelligens bygger på statistiske modeller som beregnes fra svært store mengder dataeksempler, som tekst og bilder samlet fra internett. Modellene kan deretter generere nye tekster, bilder eller andre typer data ut fra statistiske mønstre i dataene og instruksjoner fra brukeren.

ChatGPT og andre dialogbaserte KI-assistenter lar brukeren generere ulike typer data som tekst, lyd, video, bilder og programmeringskode.

Utviklingen innen generativ kunstig intelligens går svært raskt, og det er mye usikkerhet knyttet til hvilke effekter teknologien vil ha på sikt. Det finnes mange ulike spådommer knyttet til mulige effekter på forskjellige samfunnssektorer som arbeidsmarked, utdanning, forskning og medisin, og det er mange kontroverser knyttet til utfordringer som opphavsrett, regulering, klimaavtrykk og mer.

Les mer om kunstig intelligens

Begreper

Generativ KI er ikke én bestemt teknologi, men en samlebetegnelse for ulike typer KI-systemer som kan lage nye data. Det er to grunnleggende begreper som brukes om generativ kunstig intelligens: maskinlæring og treningsdata.

Maskinlæring er en samlebetegnelse på metoder der et dataprogram lærer mønstre fra data, i stedet for å bli programmert med faste regler for å løse hver enkelt oppgave. Generativ kunstig intelligens bygger vanligvis på kunstige nevrale nettverk, som er en type maskinlæringsmodeller som er løst inspirert av hvordan biologiske nerveceller fungerer.

Les mer om dyplæring.

Eksempeldataene som maskinlæringsmodeller lærer fra kalles treningsdata, og man sier gjerne at modellene trenes på disse dataene. Gjennom treningen lærer en generativ KI-modell å gjenkjenne statistiske regelmessigheter og mønstre i dataene. Et eksempel på dette er hvordan like ord vanligvis følger etter hverandre eller hvordan bilder av ulike motiver bygges opp av mindre deler. Gitt en instruksjon fra brukeren kan den generative modellen så lage nye tekster eller bilder basert på disse mønstrene. Modellen vil oftest ikke direkte gjengi bestemte eksempler fra treningsdataene, men vil lage nye sammensetninger ut fra mønstrene den har lært.

Data laget av en generativ KI-modell, for eksempel tekst eller bilder, kalles noen ganger for syntetiske data, i motsetning til data som ikke er kunstig fremstilt, for eksempel ekte fotografier eller tekster forfattet av mennesker. I noen sammenhenger brukes også syntetiske data som del av treningsdataene til KI-systemene.

Bruk

Det store kommersielle gjennombruddet for generativ kunstig intelligens kom i november 2022 med lanseringen av ChatGPT, en nettbasert tjeneste utviklet av det amerikanske selskapet OpenAI. ChatGPT er et av de mest kjente eksemplene på det som gjerne kalles en KI-assistent eller en samtalerobot (fra det engelske chatbot) der brukeren kan ha dialog med et datasystem gjennom et naturlig språk, som engelsk eller norsk, for å få utført ulike oppgaver. Eksempler på bruk kan være å få svar på spørsmål, oversette mellom språk, få utført korrektur, lage sammendrag av dokumenter, skrive programmeringskode eller få hjelp til å forfatte tekster.

Kjernen i samtaleroboter som ChatGPT er en språkmodell. Dette er en type generativ KI som trenes på store mengder tekst, og som lærer mønstre for hvordan ord og setninger vanligvis henger sammen og følger hverandre. Etter hvert har disse systemene blitt utvidet til å også håndtere andre typer data enn tekst, slik at de også kan analysere og lage bilder, lyd og video. Mange KI-assistenter har også blitt utvidet til å kunne søke etter informasjon på internett, og gjøre bruk av dette i svarene de genererer.

Spesialisert bruk

Det finnes også andre og mer spesialiserte typer generativ KI utover det man finner i vanlige samtaleroboter, for eksempel systemer som lager musikk eller 3D-modeller, eller som bistår med simulering og analyse i vitenskapelige eksperimenter.

Utfordringer

Både utvikling og bruk av generativ kunstig intelligens er forbundet med mange utfordringer.

Hallusinasjoner

Språkmodeller kan lage svar som høres riktige ut, men som likevel inneholder feil. Dette skyldes at modellen først og fremst beregner hva som er en sannsynlig sammensetning av ord ut fra mønstre i treningsdataene, uten noen sikker mekanisme for å avgjøre om svaret faktisk er sant. Slike feilaktige eller oppdiktede svar kalles ofte hallusinasjoner. Det er derfor svært viktig å være kritisk til påstander som genereres av språkmodeller og å selv verifisere informasjonen, selv om formuleringene høres troverdige og overbevisende ut.

Desinformasjon og manipulasjon

Etter hvert som generative KI-modeller har blitt bedre til å lage troverdig tekst, lyd, bilder og video, har det også blitt vanskeligere å avgjøre om noe har blitt laget av et menneske eller en maskin. Dette kan bevisst misbrukes på ulike måter. Syntetiske bilder, videoer eller lydopptak som etterligner virkelige personer, omtales gjerne som deepfakes, og kan brukes til svindel, trakassering, politisk manipulasjon eller spredning av desinformasjon.

Søk og kildebruk

Mange KI-assistenter har etter hvert fått integrert en søkemotor som kan finne relevant informasjon på nettet eller i lokale dokumentsamlinger før de svarer. Med en ren språkmodell er det vanskelig å spore hvor informasjonen kommer fra, og modellen har heller ikke kunnskap om hendelser som har funnet sted etter at modellen ble trent. En integrert søkemotor kan redusere disse problemene, ved at systemet kan bruke og henvise til oppdatert informasjon som ikke inngår i treningsdataene.

Det er imidlertid viktig å være klar over feil og hallusinasjoner fortsatt kan forekomme på tross av integrert søk. Dette gjelder også selve kildehenvisningene i seg selv, og man risikerer at systemet henviser til en kilde som ikke finnes, gjengir innholdet i kilden på en feilaktig måte, viser til kilder som ikke støtter påstandene i svaret, eller baserer seg på et lite balansert utvalg av kilder.

Kombinasjonen av generativ KI og integrerte søk gjør det altså svært viktig å være kildekritisk. Samtidig er det en klar tendens til at informasjonssøk via generativ KI i økende grad tar over for tradisjonelle søketjenester.

Opphavsrett og personvern

Det er en rekke utfordringer knyttet til opphavsrett for generativ KI. Ofte brukes materiale hentet fra internett som treningsdata uten at opphavspersonene har samtykket eller hatt mulighet til å reservere seg. En annen utfordring er at modellene kan ende med å reprodusere treningsdata, for eksempel ved å generere et bilde som er tilnærmet identisk i innhold eller stil med bilder fra treningsdataene, eller gjengi tekster ord for ord.

Man kan dermed risikere å plagiere eksisterende materiale, selv når dette ikke er intensjonen. På liknende vis finnes det også utfordringer knyttet til personvern og sikkerhet, fordi modellene kan risikere å gjengi sensitiv informasjon eller personopplysninger hvis dette finnes i treningsmaterialet. Kommersielle tilbydere av KI-assistenter kan også forbeholde seg retten til å la data fra brukerne inngå i treningen av fremtidige versjoner av modellene sine.

Energiforbruk

Store generative modeller krever mye datakraft, både når de blir utviklet og når de brukes. Dette krever store datasentre med høyt strømforbruk. I noen tilfeller krever datasentrene også betydelige vannressurser til kjøling. Samlet sett kan utvikling og bruk av store generative KI-modeller derfor ha et betydelig klima- og miljøavtrykk.

Maktkonsentrasjon

De mest avanserte generative KI-modellene er svært ressurskrevende å utvikle og drive. Det kreves svært store mengder data og regnekraft, i tillegg til teknisk ekspertise. Dette har ført til at utviklingen domineres av en liten håndfull store teknologiselskaper som besitter den nødvendige kapitalen. Utviklingen bærer preg av et kappløp, både mellom selskapene selv, og mellom Kina og USA som teknologiske stormakter innen feltet.

Den tilspissede konkurransen blant kommersielle aktører har ført til at de proprietære systemene er lukket for innsyn fra utenforstående, slik at man ikke har tilgang til dataene, kildekoden eller prosessene som inngår i treningen av systemene. På denne bakgrunnen er mange bekymret for maktkonsentrasjon, manglende åpenhet og demokratisk kontroll, teknologisk avhengighet og digital suverenitet, spesielt for mindre land og språksamfunn som Norge.

Den akademiske forskningen innen feltet utgjør her en viktig motvekt, gjennom å etterstrebe løsninger basert på åpen kildekode, åpne modeller og åpne data. Samtidig er finansieringen som tilfaller den uavhengige forskningen langt mindre enn investeringene i de store teknologiselskapene.

Les mer i Store norske leksikon

Kommentarer (2)

29. april skrev Lucas Strabac

Er det bare jeg som mener at eksempelet gitt til hallusinasjoner er dårlig? Hallusinasjoner er i all hovedsak et problem når det er meningen at det KIen skal generere, skal samsvare med virkeligheten. I dette tilfellet ble modellen bedt om å generere noe som ikke samsvarer med virkeligheten, og da er det ikke et problem at resultatet ikke samsvarer med virkeligheten. Jeg tror at et bedre eksempel kunne vært en KI generert plakat med faktafeil.

30. april svarte Erik Velldal

Hei Lucas, det er helt korrekt – eksemplet her er misvisende og vil bli fjernet/endret som del av en større opprydning i denne artikkelen.

Kommentarer til artikkelen blir synlig for alle. Ikke skriv inn sensitive opplysninger, for eksempel helseopplysninger. Fagansvarlig eller redaktør svarer når de kan. Det kan ta tid før du får svar.

Du må være logget inn for å kommentere.

Fagansvarlig for Kunstig intelligens

Erik Velldal

Professor i språkteknologi, Ph.d., Universitetet i Oslo