Talegjenkjenning på norsk

Onsdag 18. september 2019, kl. 10:00 – 15:00

Legg til i kalender

Nasjonalbiblioteket – Store Auditorium

Henrik Ibsens gate 110, 0254 Oslo

Innspillseminar om talegjenkjenning og maskinlæring på norsk.

Det finnes i dag store mengder digitalt materiale i statlige institusjoner. Dette materialet kan brukes til å lage akustiske modeller og språkmodeller for norsk talegjenkjenning. Hvordan kan dette arbeidet gjennomføres, og kan en slik satsing hjelpe markedsaktører til å lage bedre taleteknologiske tjenester for norsk? Hvem kan ta ansvaret? Er det statens oppgave å sikre norsk talegjenkjenning? Språkrådet og Nasjonalbiblioteket ønsker med dette seminaret å løfte frem og diskutere disse problemstillingene.

Påmelding til arne.lindstad@nb.no innen 16. september.

Arrangeres i samarbeid med Språkrådet.

Mer om seminaret

Flere offentlige virksomheter vurderer nytten av å ta i bruk talegjenkjenning. Noen av dem har store mengder digitalt materiale som kan brukes til å lage akustiske modeller og språkmodeller for norsk talegjenkjenning. Utfordringen er at dette materialet i dag ofte er utilgjengelig for utviklere. Denne og andre utfordringer vil det være fornuftig å møte i fellesskap.

Språkrådet og Språkbanken ved Nasjonalbiblioteket ønsker å belyse og diskutere disse problemstillingene, og inviterer derfor til seminar om talegjenkjenning. Seminaret er delt i tre. Først gir vi en grunnleggende innføring i hvordan talegjenkjenning virker, og hvilke ressurser som brukes. Vi har invitert Peter Dirix fra Nuance, et av verdens ledende firmaer innen taleteknologi, og Lilja Øvrelid, førsteamanuensis ved Institutt for informatikk ved Universitetet i Oslo.

Deretter har vi invitert offentlige virksomheter som vurderer å ta i bruk talegjenkjenning, til å dele sine erfaringer.

Til slutt vil vi diskutere hvordan aktuelle prosjekter kan dra nytte av hverandre, og hvilke utfordringer vi kan samarbeide om:

Hvordan er det mest hensiktsmessig å legge til rette for gjenbruk av offentlige data i fremtiden?
Hvordan kan offentlige data hjelpe markedet til å lage bedre taleteknologiske tjenester for norsk?
Hvilke dataressurser er det bruk for?
Hvem tar ansvaret for at ressurser som er utviklet i forbindelse med statlige bestillinger, eller som finnes andre steder (for eksempel hos NRK), finner veien til Språkbanken?

Program

09.30–10.00: Kaffe

DEL I: INNFØRING I TALEGJENKJENNING OG FORSTÅELSE AV NATURLIG SPRÅK (NLU)

10.00–10.10: Velkommen ved Nasjonalbiblioteket og Språkrådet

10.10–11.10: Peter Dirix: om talegjenkjenning

Peter Dirix har lang fartstid som leder for et av Nuance Communications’ mest prestisjetunge talegjenkjenningsteam, og det finnes få personer i bransjen som har bedre oversikt. Teknologien til Nuance ligger bak svært mange av produktene vi omgir oss med som støtter taleteknologi.

11.10–11.20: Beinstrekk

11.20–12.00: Lilja Øvrelid: om forståelse av naturlig språk (NLU)

Lilja Øvrelid er førsteamanuensis ved Institutt for informatikk ved Universitetet i Oslo og arbeider med maskinlæring og prosessering av naturlig språk. Hun er medlem av forskergruppen for språkteknologi.

12.00–12.40: Lunsj

DEL II: VIRKSOMHETER SOM VURDERER TALEGJENKJENNING

12.40–13.00: Egil Ljøstad, NRK

13.00–13.20: Trond Almås, Domstoladministrasjonen

13.20–13.40: Bodil Kvamme Erlandsen, Stortinget

DEL III: RESSURSUTVIKLING FOR FREMTIDEN

13.40–14.00: Språkbanken

14.00–15.00: Diskusjon