AI er noe mange snakker om for tiden, og forkortelsen står for “Artificial Intelligence” på engelsk. På norsk heter det “Kunstig Intelligens”, ofte forkortet til KI. De fleste har kanskje hørt om dette gjennom ulike medier, i filmer eller sett eksempler fra den virkelige verden, som når Tesla-biler kjører nesten av seg selv, eller når vi bruker programmer som ChatGPT for å få svar på spørsmål. Men hvordan fungerer egentlig AI, og hva menes med at en datamaskin kan være «intelligent»?

I denne artikkelen skal vi utforske hva AI er, hvordan data samles inn, og hvordan denne informasjonen bearbeides i modeller som lærer av eksempler. Vi skal også se på grunnprinsippene bak AI og forklare dem på en så enkel måte som mulig.

Selve begrepet “kunstig intelligens” kan høres veldig komplisert ut, men det dreier seg i bunn og grunn om at maskiner eller dataprogrammer forsøker å gjøre oppgaver som vanligvis krever menneskelig intelligens. For eksempel å forstå språk, kjenne igjen ansikter i bilder, styre en bil på veien uten at en sjåfør styrer rattet, eller gi forslag til hvilken film du bør se basert på hva du har sett før. Alt dette handler om at maskinen “lærer” av data. På den måten kan den ta avgjørelser eller komme med løsninger som er nyttige for oss i hverdagen. Et spesielt populært eksempel er ChatGPT, som er et verktøy som svarer på spørsmål og skriver tekst slik det har lært at mennesker vanligvis formulerer seg.

Hva betyr AI, og hvordan brukes det?

Som nevnt står AI for “Artificial Intelligence”, og betyr rett og slett at vi prøver å lage intelligente systemer. På norsk kaller vi det KI, “Kunstig Intelligens”. Men ordet “intelligent” kan lure oss litt, fordi AI ikke nødvendigvis tenker slik vi mennesker gjør. I stedet følger systemet kompliserte matematiske modeller basert på store datamengder.

Her er noen dagligdagse eksempler på AI:

  • ChatGPT: Svarer på spørsmål og hjelper oss med å finne informasjon eller formulere ideer basert på enorme tekstmengder den har lært av.
  • Tesla-biler: Har selvkjørende funksjoner som bruker sensorer og kameraer for å oppdage hindringer og styre bilen.
  • Netflix-anbefalinger: Forslår filmer og serier basert på hva du har sett før, og hva andre lignende brukere liker.
  • Ansiktsgjenkjenning på mobiltelefon: Låser opp telefonen din ved å kjenne igjen ansiktstrekkene dine.
  • Talestyring (f.eks. Siri eller Google Assistent): Lytter til stemmekommandoer og utfører oppgaver eller svarer på spørsmål.

Selv om alt dette kan virke veldig “magisk”, skjer det via datamaskiner som gjør store mengder beregninger i bakgrunnen. ChatGPT, for eksempel, er trent på en enorm samling av tekst fra internett. Når du stiller et spørsmål, bruker ChatGPT denne kunnskapen til å lage et svar som (forhåpentligvis) virker logisk og lett å forstå. Men hvordan får disse AI-modellene tak i all informasjonen de trenger for å lære?

Data: Råstoffet for AI

For å kunne “tenke” eller “lære” trenger en AI-modell masse data. Tenk på data som informasjon eller kunnskap hentet fra ulike kilder. Jo mer data systemet har, desto bedre kan det lære mønstre. Et barn lærer for eksempel å gjenkjenne en katt ved å se mange katter i virkeligheten, i bøker eller på TV. På samme måte lærer AI å kjenne igjen katter i bilder ved å studere tusenvis eller millioner av kattebilder.

Data kan samles inn fra svært forskjellige kilder, for eksempel:

  • Nettsteder, blogger og sosiale medier (tekst, bilder, videoer)
  • Sensordata fra biler (radar, kamera, ultralydsensorer)
  • Offentlige databaser (f.eks. statistikk, værobservasjoner)
  • Bedrifters interne logger og systemer (kundedata, salgstall, brukeratferd)
  • Databaser med merkelapper (bilder eller tekst med beskrivelser som forteller hva det forestiller)

Når all denne informasjonen samles inn, ender vi opp med store databunter, ofte kalt “datasett”. Datasettet kan være tekst (som ChatGPT fikk), bilder (til et system som gjenkjenner objekter) eller lydfiler (som systemer for talegjenkjenning bruker). Deretter brukes disse datasettene til å “trene” modellen.

Hvordan “lærer” en AI-modell?

En AI-modell lærer ved å se på mange eksempler og prøve å finne mønstre. For oss mennesker kan det å finne mønstre virke naturlig: Når vi leser en bok, kan vi fort se at ordet “katt” brukes når det er snakk om et dyr med pels som maler og har hale. Datamaskinen har imidlertid ingen forhåndsforståelse av hva en katt er. Den får bare tall og bokstaver som input. Så den må lære steg for steg ved å regne seg gjennom datamaterialet, gjette løsninger, og deretter justere seg selv når den tar feil.

Tenk på det som å lære å sykle. Første gangen du prøver, detter du kanskje av. Du justerer balansen litt, prøver igjen, og etter hvert klarer du å holde deg oppe på to hjul. AI-modeller fungerer på et lignende vis, men i stedet for muskler og balanse bruker de avansert matematikk. De tester mange ganger, justerer seg, og lærer så gradvis hva som er “riktig svar” og hva som er “feil svar”.

De tekniske grunnprinsippene

Det er mange måter å forklare de tekniske grunnprinsippene bak AI på, men la oss bruke ChatGPT som et eksempel. ChatGPT er basert på en type modell som kalles et “nevralt nettverk”, inspirert av hvordan menneskehjernen er bygget opp. Et nevralt nettverk består av mange noder, kalt «nevroner», som er koblet sammen i flere lag. Hvert lag prøver å trekke ut ulike typer informasjon fra dataene.

Når ChatGPT ble trent, ble den gitt enorme mengder tekst. Teksten ble brutt opp i biter og oversatt til tallverdier slik at datamaskinen kan regne på dem. Nettverket prøver deretter å forutsi hvilken tekstbit (for eksempel ord eller tegn) som mest sannsynlig følger etter en annen. Hvis nettverket gjetter feil, justerer det vektene – som er tallene som bestemmer hvor mye hver forbindelse i nettverket betyr. Etter ekstremt mange runder med prøving og feiling, blir modellen gradvis bedre til å forutsi neste ord. Dermed oppstår illusjonen av at ChatGPT forstår og svarer på spørsmål, men i realiteten finner den mest sannsynlig fortsettelse basert på mønstre den har sett før.

Å bygge en AI-modell steg for steg

La oss si at vi vil lage en enkel AI-modell som kan gjenkjenne om et bilde inneholder en katt eller ikke. Hvordan gjør vi det?

  1. Samle data: Vi finner massevis av bilder av katter og bilder uten katter.
  2. Merk data: Vi forteller datamaskinen hvilke bilder som har en katt, og hvilke som ikke har det.
  3. Trening: Modellen ser på alle bildene, prøver å gjette hvilke som har katt. Hver gang den tar feil, får den en liten «smekk på fingrene» via en justering i de matematiske vektene.
  4. Validering: Vi tester modellen på noen nye bilder for å se om den kan kjenne igjen katter den ikke har sett før.
  5. Justere og forbedre: Hvis modellen ikke gjenkjenner katt godt nok, kan vi justere forskjellige parametere eller legge til flere data.

Når modellen endelig gjenkjenner katter med god treffprosent, har vi en fungerende AI som kan si “Her er det en katt” eller “Nei, ingen katt her”.

En enkel teori bak modeller som ChatGPT

For å forstå ChatGPT og lignende språkmodeller bedre, kan vi se på en liten tabell som viser tre hovedelementer i treningsprosessen:

Element Forklaring Eksempel
Data Teksten som modellen leser og lærer fra Millioner av nettsider, bøker, artikler
Arkitektur Selve oppbyggingen av det nevrale nettverket Lag på lag med “nevroner” som bruker matematikk
Optimalisering Hvordan modellen justeres når den tar feil Modellen gjettet feil ord, så den endrer vektene litt

Det viktigste å huske her, er at hver gang modellen gjetter feil, får den en form for tilbakemelding. Deretter oppdaterer den seg litt og prøver på nytt. Gjennom tusenvis, millioner eller til og med milliarder av slike justeringer, blir modellen gradvis bedre til å forutsi hva som kommer neste gang i en tekst, eller hvilke ord som hører sammen. Dette er selve kjernen i hvordan ChatGPT klarer å skrive fornuftige setninger.

Hvorfor virker AI “smart”?

Når vi ser at en bil kan kjøre av seg selv, eller at ChatGPT kan svare på spørsmål om nesten alt mulig, er det lett å tro at maskinen virkelig tenker. Men mye av “intelligensen” kommer fra to ting: enorme datamengder og rask databehandling.

Datamaskiner kan regne ekstremt fort og håndtere mye mer data enn det et menneske klarer. ChatGPT for eksempel, har lest millioner av bøker og nettsider på én gang (i figurativ forstand). Den kan se mønstre i teksten som vi mennesker kanskje ikke en gang legger merke til. Likevel betyr ikke det at ChatGPT “forstår” verden på samme måte som et menneske gjør. Den er avhengig av mønstre og statistikk, og hvis den ikke har sett en viss type spørsmål før, må den likevel gjette basert på lignende eksempler i treningsmaterialet.

AI på et litt dypere nivå – men fortsatt enkelt forklart

På et litt mer avansert nivå består AI ofte av mange lag med det vi kaller lineære og ikke-lineære funksjoner. “Lineær” betyr at det er et enkelt forhold mellom to størrelser, mens “ikke-lineær” betyr at forholdet kan være mer komplisert (for eksempel buede funksjoner og annen matematikk). Når man setter sammen mange av disse funksjonene, kan systemet fange opp mer intrikate sammenhenger i dataene.

I ChatGPT er dette tatt til et eksepsjonelt nivå, med milliarder av slike beregninger som foregår. Men husk at alt dette bare er tall og koblinger inni en datamaskin. Når du spør ChatGPT om noe, leter systemet i modellen etter mønstre som passer best med spørsmålet og setter sammen et svar.

Hvordan brukes data fra forskjellige kilder i en AI-modell?

Du lurer kanskje på hvordan man kobler sammen forskjellige typer data i en AI-modell. For eksempel kan en bil bruke kameraer, radarer og GPS for å finne ut hvor den befinner seg og hva som er rundt den. Disse datakildene blir gjerne behandlet hver for seg først, for så å bli samlet i et felles system som tar en endelig avgjørelse.

For et tekstbasert system som ChatGPT handler det mer om å hente tekst fra mange kilder, slik at det får et stort og variert ordforråd. Nettopp fordi ChatGPT har “lest” så mange ulike tekster, kan den svare på spørsmål om alt fra vitenskap, historie, geografi og mye annet. I en bil er poenget å finne ut hvordan veien ser ut, hvor fort andre biler kjører, og hvor fotgjengere befinner seg.

Datakvalitet er viktig

Kvaliteten på dataen som brukes for å trene en AI, er veldig avgjørende. Hvis dataen er skjev eller har mye feil, kan AI-modellen lære gale ting. For eksempel, hvis vi kun gir en modell kattebilder som alle er tatt i sterke sollys, kan den slite med å gjenkjenne en katt i skyggen eller om natten. Eller hvis ChatGPT bare hadde lest skjønnlitteratur, ville den kanskje hatt problemer med å svare på tekniske spørsmål. Derfor legger de som bygger AI-modeller ofte mye tid og krefter i å finne gode og varierte datasett.

Hva skjer under panseret – teknisk sett?

Selv om vi prøver å forklare AI på en veldig enkel måte, kan det være greit å vite litt om hva som skjer under panseret. AI, eller KI, kan grovt deles opp i følgende byggeklosser:

  • Maskinlæring (ML): Teknikker hvor datamaskiner finner mønstre i data uten å bli programmert til å gjøre en spesifikk oppgave manuelt.
  • Dyp læring (DL): En form for maskinlæring som bruker nevrale nettverk med mange lag.
  • Nevrale nettverk: Etterligning av hjernens nevroner, med vektede koblinger som justeres når modellen lærer.
  • Algoritmer: Steg-for-steg-instruksjoner som forteller datamaskinen hva den skal gjøre med dataen.

Som i et stort puslespill, blir alt dette satt sammen for å lage et ferdig AI-system. ChatGPT bruker en form for dyp læring som kalles “transformer-arkitektur”. Denne arkitekturen gjør at modellen kan se store sammenhenger i teksten og ikke bare fokusere på ordet rett ved siden av. Dette gir mer flytende og logiske svar.

Hvilke utfordringer finnes for AI?

Selv om AI har kommet langt, er det fortsatt utfordringer og begrensninger. For det første trenger modeller store mengder data, og det kan være dyrt og tidkrevende å samle inn og prosessere disse dataene. For det andre kan AI ta feil eller bli “lurt” av data den ikke forstår. For eksempel kan ChatGPT oppgi feil informasjon hvis den ikke har lært riktig svar, eller hvis spørsmålet er formulert på en måte som forvirrer den.

Et annet område med utfordringer er etikk. Hva skjer når AI-modeller får tilgang til personlig informasjon? Hvordan sikrer vi at dataen er innhentet på en trygg og rettferdig måte? Hvordan unngår vi at AI forsterker skjevheter eller diskriminerer enkelte grupper? Dette er spørsmål som både forskere, politikere og samfunnet som helhet må finne gode svar på.

Oppsummering

Når vi spør “Hvordan fungerer AI?”, er svaret at AI i bunn og grunn handler om å finne mønstre i store mengder data. Maskinen prøver, feiler og lærer over tid. ChatGPT er et godt eksempel, siden den er trent på enorme mengder tekst og bruker en dyp læringsmetode for å generere setninger som ligner på det mennesker ville skrevet. Samtidig er AI avhengig av data fra mange forskjellige kilder, og kvaliteten og mengden av data har veldig mye å si for hvor bra resultatet blir.

Teknisk sett handler AI om kompliserte matematiske modeller, nevrale nettverk og algoritmer som justerer seg selv når de gjetter feil. Likevel kan vi forklare det veldig enkelt: AI er som et lite barn som lærer ved å se, lese eller lytte til mange eksempler – bare at AI kan gjøre dette mye raskere og med mye mer data enn et menneske. På denne måten kan den utføre oppgaver som før var forbeholdt oss, alt fra å forstå språk til å kjøre bil.

I fremtiden vil vi se AI i enda flere sammenhenger – ikke bare i Tesla-biler eller ChatGPT. Kanskje vil vi ha roboter som hjelper til hjemme, eller enda mer avanserte dataprogrammer som kan forutsi naturkatastrofer eller oppdage sykdommer tidlig. Uansett er grunnsteinen den samme: datamengder, mønstergjenkjenning og et system som justerer seg selv til det blir dyktig. Og selv om AI kan virke mystisk og intelligent, er det egentlig matematiske regler på høyt nivå som ligger bak – satt sammen for å etterligne noe av det vi mennesker kan gjøre på en naturlig måte.

Håpet med denne artikkelen er å vise at kunstig intelligens ikke er så “magisk” som det kanskje kan virke ved første øyekast. Det er et verktøy som samler inn data fra mange kilder, bygger kompliserte modeller, og på den måten lærer seg å gjøre nyttige oppgaver. Eksemplet med ChatGPT er i dag et av de mest synlige eksemplene, fordi den kan skrive på mange ulike språk og om nesten alle tema. Men under overflaten er prinsippene de samme for det meste av AI: Læring gjennom data, statistiske mønstre og kontinuerlig forbedring.

Dermed har vi forhåpentligvis gitt en lettfattelig forklaring på hvordan AI, eller KI, egentlig fungerer. Tenk på en AI-modell som en ekstremt flittig elev som aldri blir lei av å studere. Den kan pugge side opp og side ned med tekst, bilder eller andre typer data, og over tid vil den bli flinkere til å gjenkjenne mønstre og sammenhenger. Resultatet er et system som kan løse oppgaver som en gang var helt utenkelige for datamaskiner, og som gjør hverdagen vår enda litt enklere.