Logg inn English

Danner nytt nasjonalt fellesskap for forskning på språkmodeller

Nasjonalbiblioteket går sammen med Universitetet i Oslo og NTNU om å etablere Språkmodellklynge Norge. Samarbeidet skal styrke koordineringen av forskning og utvikling på språkmodeller i Norge.

Representanter fra de ulike instansene som danner Språkklynger Norge
Fra venstre: Erik Velldal (LTG), Svein Arne Brygfjeld (NB), Nina Teigland (Språkrådet), Lilja Øvrelid (LTG), Gunnar Bøe (Sigma2), Benjamin Kille (NorwAI), Stephan Oepen (LTG), Kerstin Bach (NorwAI), Yngvil Beyer (NB), Kristine Eide (LCN), Javier de la Rosa (NB), Jon-Atle Gulla (NorwAI). Foto: Lilja Øvrelid

Bakgrunnen for initiativet er et tydelig behov for bedre samordning av forskning på store språkmodeller. I dag foregår mye av arbeidet ved norske institusjoner hver for seg, uten en felles struktur for langsiktig metodeforskning og prioriteringer på nasjonalt nivå.

Et annet sentralt formål med Språkmodellklynge Norge er å styrke rammer og finansiering for forskning på språkmodeller.

– Det er stort behov for at arbeidet med språkmodeller i større grad bygger på forskningsdrevet utvikling og evaluering. Samtidig mangler det i dag robuste finansieringsmodeller for denne typen forskning, sier avdelingsdirektør Hege Stensrud Høsøien i Nasjonalbiblioteket.

Selv om det er gjort investeringer i infrastruktur, datatilgang og modelltrening, mangler det i dag dedikerte ordninger for langsiktig og grunnleggende språkmodellforskning i Norge. Klyngen skal bidra til å synliggjøre dette behovet og legge grunnlag for mer robuste finansieringsmodeller.

Forpliktende samarbeid
Språkmodellklyngen samler sentrale norske fagmiljøer innen språkteknologi og kunstig intelligens, og skal legge til rette for et mer forpliktende samarbeid mellom institusjonene. Klyngen skal ledes på omgang av UiO, NTNU og Nasjonalbiblioteket. I 2026 ledes arbeidet av UiO. På sikt forutsetter et slikt samarbeid tilgang til langsiktig og ekstern forskningsfinansiering.

For Nasjonalbiblioteket er deltakelsen en videreføring av arbeidet med å utvikle og tilgjengeliggjøre språklige data og språkmodeller for det norske samfunnet. Biblioteket bidrar særlig med kompetanse innen datatilrettelegging, prosessering og trening av språkmodeller i stor skala.

Språkmodellklynge Norge bygger videre på eksisterende samarbeidsprosjekter mellom partene, blant annet MIMIR-prosjektet, der det ble undersøkt hvordan bruk av ulike typer datagrunnlag påvirker kvaliteten på norske språkmodeller. Erfaringene herfra har bidratt til økt kunnskap om hva som kreves for å utvikle språkmodeller tilpasset norske språk og bruksområder.

Gjennom Språkmodellklynge Norge vil partene arbeide for å styrke rammene for grunnleggende forskning på språkmodeller, blant annet knyttet til små språk, språklige og kulturelle normer, evaluering i en norsk kontekst og effektiv bruk av begrensede treningsdata.

Initiativet er tidligere omtalt i Uniforum, Khrono og Universitetsavisa.