Hver uke får vi den samme telefonen. En daglig leder eller produktansvarlig som lurer på om de burde bruke AI til noe. Som regel er det ærlige svaret «til en liten del av det, ja, og til den delen du tror, nei».
Dette er ikke et innlegg mot AI. Vi har jobbet med språkteknologi siden lenge før ChatGPT, og vi leverer det fortsatt til kunder hvert kvartal. Det er et innlegg mot å late som om teknologien er noe den ikke er. Den teaterforestillingen gjør det vanskeligere å bruke de delene som faktisk virker.
Hva AI faktisk er god til akkurat nå
De interessante tingene AI gjør for norske bedrifter i dag er lite glamorøse.
Den leser lange dokumenter og oppsummerer dem godt nok til at noen kan bestemme om de skal lese hele. Den skriver et førsteutkast av strukturert tekst, en produktbeskrivelse, et e-postsvar, et notat, som et menneske retter på en fjerdedel av tiden. Den kategoriserer rotete input. Den transkriberer møter. Den henter ut data fra fakturaer i femten ulike formater. Den driver søkegrensesnitt som endelig forstår hva folk spør om.
Dette er ikke saker for forsiden av Finansavisen. Det er små, godt avgrensede oppgaver der det å være åttifem prosent riktig med en menneskelig sjekk er vesentlig bedre enn null prosent uten.
En liten endring i én av disse arbeidsflytene kan spare timer hver dag for et helt kundesenter eller en hel økonomiavdeling. Samlet over et år blir det reelle penger og reell tid. Det er bare ikke en pressemelding.
Hva AI er dårlig til akkurat nå
Den er dårlig til å være eneste fasit på noe som ikke kan bli feil. Juridiske vurderinger. GDPR-tolkninger. Tall som havner i årsregnskapet. Alt der en selvsikker løgn ender opp hos en kunde eller en revisor.
Den er dårlig til å erstatte skjønn i ekte tvilssituasjoner. Spørsmål der svaret avhenger av å kjenne bedriften og tre år med kontekst, kan ikke fikses med en lengre prompt.
Den er dårlig til å holde seg stabil. Modeller endrer seg. Prompter som virket i forrige måned oppfører seg annerledes denne måneden. Infrastrukturen krever vedlikehold på samme måte som ethvert annet produksjonssystem. Leverandører som leverer en chatbot og forsvinner, har satt deg opp til å oppdage dette på den vanskelige måten.
Det norske perspektivet
Det er noen forhold som gjør AI-prosjekter i Norge litt annerledes enn i USA eller Storbritannia.
Data om kunder, ansatte og pasienter ligger ofte under regler som gjør sky-leverandører utenfor EU lite aktuelle. Microsoft, Google og AWS har EU-regioner som løser mye, men ikke alt. For helsedata, kommunale data og enkelte typer personopplysninger må du av og til kjøre modellen et sted du kontrollerer fullt ut.
Det er der egne installasjoner kommer inn. Vi har satt opp modeller på leide servere hos norske leverandører, og vi har satt dem opp på maskiner som står hos oss selv. Begge deler er fullt mulig i dag, og det er ikke nødvendigvis dyrere enn skyalternativet hvis bruken er stabil.
Norsk språk er også sin egen sak. Generelle store modeller forstår norsk ganske bra, men de gjør fortsatt rare ting. Bokmål og nynorsk blandes. Tonen blir lett amerikansk i kantene. En finjustert modell på egne norske data løser dette, og det er ikke et stort prosjekt.
Hva du bør se etter i et tilbud
Vi vurderer ganske ofte AI-tilbud fra andre leverandører på vegne av kunder. Det er noen mønstre som dukker opp i de dårlige.
Tilbudet er fullt av forkortelser og kort på resultater. Hvis det ikke kan forklares i én setning hva en konkret person vil gjøre annerledes etter at systemet er på plass, vet ikke tilbudet hva det er til.
Kostnaden er umulig å verifisere. Tokenforbruk, modellavgifter, hosting, retrening, dette legger seg opp på måter som er lette å underrapportere ved signering. Be om en typisk måned og en verstefall-måned, i kroner, på papir.
Leverandøren vil eie integrasjonen, men ikke resultatet. Hvis de ikke vil binde seg til en kvalitetsterskel du kan måle, betaler du for et forskningsprosjekt.
Arkitekturdiagrammet har femten bokser for et problem som trenger tre. Kompleksitet i dette feltet er som regel et tegn på at den som tegner det, ikke har bygget det før.
En kort liste over ting du bør hoppe over
Noen konkrete ting som mest er støy akkurat nå:
- Å bygge en chatbot når en bedre organisert FAQ ville løst oppgaven.
- Å pakke en offentlig modell i et tynt lag og kalle det ditt eget AI-produkt.
- Å finjustere på et lite datasett i håp om en oppførselsendring som krever en helt annen modell.
- Å erstatte et fungerende regelbasert system med en LLM «fordi det er fremtiden».
I de fleste tilfeller er det riktige svaret en liten, godt målrettet modell som gjør én ting, integrert i en arbeidsflyt folk allerede bruker, med en tydelig måte å måle om den virker.
Det første steget
Hvis du vurderer AI for bedriften din, er det første nyttige steget sjelden «finn en leverandør». Det er to timer med en som har levert dette før, der dere går gjennom den faktiske driften og ender med en kort liste over steder der en modell kan fjerne reell friksjon.
Hvis tre av disse stedene står seg under press, bygg ett av dem. La det kjøre et kvartal. Bestem så hva du gjør med de to andre.
De norske bedriftene som faktisk får utbytte av AI akkurat nå, er ikke de som lager mest PR av det. Det er de som tok ett konkret problem og leverte en grundig løsning. Kjedelig som det høres ut, er det der pengene ligger.