Dette uttaleleksikonet for dansk vart opphavleg produsert av Nordisk språkteknologi (NST), og inneheld om lag 238.000 oppslag. Ordlista tek utgangspunkt i dei 100.000 mest frekvente ordformene i det danske tekstkorpuset til NST.
Heile leksikonet ligg føre som ei fil i rein tekst-format. Kvart oppslag (line) inneheld 51 postar, skilde med semikolon. Ikkje alle postane er like relevante for alle føremål, men gitt formatet er det lett å hente ut den informasjonen ein treng.
Leksikonet inneheld mellom anna informasjon om dekomponeringsledd i samansettingar og ein eller flere fonetiske transkripsjon.ar Transkripsjonsarbeidet er gjort manuelt. Diverse leksikalsk verktøy som kan nyttast til å handsame leksikonet, kan lastast ned som ein eigen zip-fil.
Transkripsjonsformatet er SAMPA (Speech Assessment Methods Phonetic Alphabet).
Dette uttaleleksikonet for dansk vart opphavleg produsert av Nordisk språkteknologi (NST), og inneheld om lag 238.000 oppslag. Ordlista tek utgangspunkt i dei 100.000 mest frekvente ordformene i det danske tekstkorpuset til NST.
Heile leksikonet ligg føre som ei fil i rein tekst-format. Kvart oppslag (line) inneheld 51 postar, skilde med semikolon. Ikkje alle postane er like relevante for alle føremål, men gitt formatet er det lett å hente ut den informasjonen ein treng.
Leksikonet inneheld mellom anna informasjon om dekomponeringsledd i samansettingar og ein eller flere fonetiske transkripsjon.ar Transkripsjonsarbeidet er gjort manuelt. Diverse leksikalsk verktøy som kan nyttast til å handsame leksikonet, kan lastast ned som ein eigen zip-fil.
Transkripsjonsformatet er SAMPA (Speech Assessment Methods Phonetic Alphabet).
Dette uttaleleksikonet for dansk vart opphavleg produsert av Nordisk språkteknologi (NST), og inneheld om lag 238.000 oppslag. Ordlista tek utgangspunkt i dei 100.000 mest frekvente ordformene i det danske tekstkorpuset til NST.
Heile leksikonet ligg føre som ei fil i rein tekst-format. Kvart oppslag (line) inneheld 51 postar, skilde med semikolon. Ikkje alle postane er like relevante for alle føremål, men gitt formatet er det lett å hente ut den informasjonen ein treng.
Leksikonet inneheld mellom anna informasjon om dekomponeringsledd i samansettingar og ein eller flere fonetiske transkripsjon.ar Transkripsjonsarbeidet er gjort manuelt. Diverse leksikalsk verktøy som kan nyttast til å handsame leksikonet, kan lastast ned som ein eigen zip-fil.
Transkripsjonsformatet er SAMPA (Speech Assessment Methods Phonetic Alphabet).