Leksikon  28.09.2021

ONOMASTICA uttaleleksikon 2

ONOMASTICA versjon 2 er ein oppdatert versjon av ONOMASTICA. For å gjere uttaleleksikonet enklare tilgjengeleg, har Språkbanken parsa dei originale .on-filene og generert ei fil i .csv-format. Fila …

 • Språk: Norwegian
 • Opphav: Språkbanken
 • Lisens: Creative_Commons-BY (CC-BY)
Tale  09.09.2021

Stortingskorpuset

Dette er den første stabile versjonen (versjon 1.0) av Stortingskorpuset (engelsk forkorting NPSC). Korpuset er utvikla ved Språkbanken på Nasjonalbiblioteket. NPSC er sett saman av lydopptak av …

 • Språk: Norwegian
 • Opphav: Språkbanken
 • Lisens: Creative_Commons-ZERO (CC-ZERO)
Tekst  29.06.2021

LIA-trebanken

LIA-trebanken består av 5250 talemålssegment og 55 410 ord/token frå talespråkskorpuset LIA norsk. Trebanken er annotert morfologisk og syntaktisk og manuelt korrigert. Trebanken er tilgjengelig …

 • Språk: Norwegian, Norwegian Nynorsk
 • Opphav: CLARINO Text Laboratory Centre
 • Lisens: Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Tale  14.06.2021

NST dansk ATG-database (16 kHz) – reorganisert

Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på dansk. I denne versjonen er dataene strukturert på nytt, slik at databasen enklere kommer …

 • Språk: Danish
 • Opphav: Språkbanken
 • Lisens: Creative_Commons-ZERO (CC-ZERO)
Tale, Tekst  04.05.2021

TAUS – Talemålsundersøkelsen i Oslo

Materialet fra Talemålsundersøkelsen i Oslo (TAUS) er basert på uformelle intervjuer med folk fra Oslo, som ble gjort i 1971-73. Informantene er hovedsakelig fra to østlige bydeler (Vålerenga og …

 • Språk: Norwegian, Norwegian Bokmål
 • Opphav: CLARINO Text Laboratory Centre
 • Lisens: CLARIN_ACA-NC-LOC-PRIV-ND-*
Tekst  04.05.2021

TAUS – nedlastbare transkripsjoner

TAUS (Talemålsundersøkelsen i Oslo) v.3 er et talespråkskorpus med 86 talere og 387 551 tokens. Denne nedlastbare versjoner inneholder transkripsjonene, cirka 44 300 tokens. Alle transkripsjonene …

 • Språk: Norwegian, Norwegian Bokmål
 • Opphav: CLARINO Text Laboratory Centre
 • Lisens: Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Tekst  21.04.2021

The Abkhaz National Corpus

The Abkhaz National Corpus is a comprehensive and open, grammatically annotated text corpus. It makes the Abkhaz language accessible to scientific investigations from various perspectives …

 • Språk: Abkhaz
 • Opphav: CLARINO Bergen Centre
 • Lisens: CLARIN_PUB-BY-NC-ND
Tale, Tekst, Video  16.04.2021

Norsk talespråkskorpus – Oslodelen

NoTa-Oslo er et talespråkskorpus bestående av intervjuer og samtaler med 166 informanter født og oppvokst i Oslo og Oslo-området. Informantene er representative med hensyn til alder, kjønn, …

 • Språk: Norwegian, Norwegian Bokmål
 • Opphav: CLARINO Text Laboratory Centre
 • Lisens: CLARIN_ACA-NC-LOC-PRIV-ND-*
Tale, Tekst, Video  16.04.2021

Nordisk dialektkorpus v. 4.0

Nordic Dialect Corpus v.4.0 is a corpus of Norwegian, Swedish, Danish, Faroese, Icelandic and Övdalian spoken language. It consists of spontaneous speech data from dialects of the North Germanic …

 • Språk: Norwegian Bokmål (the orthographic transcriptions), Swedish (Övdalien included), Danish, Icelandic, Faroese
 • Opphav: CLARINO Text Laboratory Centre
 • Lisens: CLARIN_ACA-NC-LOC-PRIV-ND-*
Tekst  16.04.2021

Text material from Forskning.no (1998 – 2017)

Data set containing texts from the popular science website forskning.no from the period 1998 - 2017. The text material is constituted by articles published by Forskning.no belonging to the following …

 • Språk: Norwegian, Norwegian Bokmål
 • Opphav: CLARINO Bergen Centre
 • Lisens: CLARIN_RES-DEP