I samarbeid med
CANS v.3.1 - amerikanordisk talespråkskorpus - er et talespråkskorpus med informanter fra USA og Canada. Informantene snakker norsk og svensk, og de fleste lærte språket som barn hjemme hos …
LIA norsk er et talespråkskorpus med gamle opptak (1939 - 1996) fra fire norske universitet: NTNU, UiB, UiO og UiT. Opptakene er gjort for dialektforskning og navneforskning, og handler ofte om …
BigBrother-korpuset er et talespråkskorpus som består av den første sesongen av realityserien BigBrother som ble sendt på TVNorge våren 2001. Deltakerne i BigBrother er i alderen 23-36 år og …
Alle transkripsjoner fra LIA norsk kan lastes ned i tekstformat. 553 transkripsjoner i ELAN-format fra LIA norsk er sammen med tilhørende lydfiler dessuten samla i ei mappe for nedlasting. Dette er …
Dette uttaleleksikonet for nynorsk er opphavleg utvikla av Lingit AS for bruk i deira tekst-til-tale-stemmer som vart lanserte i 2008. Leksikonet er samansett av leksikalske einingar (ei eining per …
The Abkhaz National Corpus is a comprehensive and open, grammatically annotated text corpus. It makes the Abkhaz language accessible to scientific investigations from various perspectives …
NoTa-Oslo er et talespråkskorpus bestående av intervjuer og samtaler med 166 informanter født og oppvokst i Oslo og Oslo-området. Informantene er representative med hensyn til alder, kjønn, …
The «Corona texts from NRK» treebank is a syntactically annotated corpus. It is based on data transcribed from the two newscasts Dagsrevyen and Supernytt produced by the Norwegian Broadcasting …