Hopp til innhold

NST uttaleleksikon for svensk

Dette uttaleleksikonet for svensk vart opphavleg produsert av Nordisk språkteknologi (NST), og inneheld om lag 927.000 oppslag. Ordlista tek utgangspunkt i dei 100.000 mest frekvente ordformene i det svenske tekstkorpuset til NST.

Heile leksikonet ligg føre som ei stor fil i rein tekst-format. Kvart oppslag er på ei line, det er 51 postar tilgjengeleg på kvar line, og postane er skilde med semikolon. Ikkje alle postane er like relevante for alle føremål, men gitt formatet er det lett å hente ut den informasjonen ein treng.

Leksikonet inneheld mellom anna informasjon om dekomponeringsledd i samansettingar og ein eller flere fonetiske transkripsjon.ar Denne transkripsjonen er delvis gjort manuelt, men det meste er gjort automatisk ved hjelp av ein inflektor, og dette er delvis stikkprøvekontrollert. Sjølve inflektoren, og anna leksikalsk verktøy som kan nyttast til å handsame leksikonet, kan lastast ned som ein eigen zip-fil.

Transkripsjonsformatet er SAMPA (Speech Assessment Methods Phonetic Alphabet).

Dette uttaleleksikonet for svensk vart opphavleg produsert av Nordisk språkteknologi (NST), og inneheld om lag 927.000 oppslag. Ordlista tek utgangspunkt i dei 100.000 mest frekvente ordformene i det svenske tekstkorpuset til NST.

Heile leksikonet ligg føre som ei stor fil i rein tekst-format. Kvart oppslag er på ei line, det er 51 postar tilgjengeleg på kvar line, og postane er skilde med semikolon. Ikkje alle postane er like relevante for alle føremål, men gitt formatet er det lett å hente ut den informasjonen ein treng.

Leksikonet inneheld mellom anna informasjon om dekomponeringsledd i samansettingar og ein eller flere fonetiske transkripsjon.ar Denne transkripsjonen er delvis gjort manuelt, men det meste er gjort automatisk ved hjelp av ein inflektor, og dette er delvis stikkprøvekontrollert. Sjølve inflektoren, og anna leksikalsk verktøy som kan nyttast til å handsame leksikonet, kan lastast ned som ein eigen zip-fil.

Transkripsjonsformatet er SAMPA (Speech Assessment Methods Phonetic Alphabet).

Utvidet metadata

Last ned ressurser

Last ned metadata