Hopp til innhold
Nasjonalbiblioteket
Språkbanken
English
Språkbanken
Ressurskatalog
I samarbeid med
Tekst
23.12.2022
Omsetjingsminne frå Målfrid
Dette korpuset spring ut frå Målfrid-korpuset, og inneheld omsetjingsminne basert på tekst frå 132 statlege domene. Dataa ligg føre i tmx-format for språkpara engelsk-bokmål, engelsk-nynorsk …
Språk: engelsk, bokmål, nynorsk
Opphav: Språkbanken
Lisens: Norwegian Licence for Open Government Data (NLOD)
Tekst
22.12.2022
ParlaMint-NO
ParlaMint-NO er den norske delen av ParlaMint-prosjektet, et EU-finansiert prosjekt støttet av CLARIN-ERIC. Prosjektets mål er å lage sammenlignbare og likt annoterte korpus basert på møtereferat …
Språk: bokmål, nynorsk
Opphav: Språkbanken
Lisens: Creative_Commons-ZERO (CC-ZERO)
Tekst
21.12.2022
Norsk aviskorpus bokmål
The Norwegian Newspaper Corpus (NNC) Bokmål version is a large monitor corpus representing contemporary Norwegian language in the written variety Norwegian Bokmål. A corresponding corpus is …
Språk: norsk, bokmål
Opphav: CLARINO Bergen
Lisens: Creative_Commons-BY-NC (CC-BY-NC)
Tekst
21.12.2022
N-grammer fra NBdigital 2022
Dette korpuset inneholder n-grammer – unigrammer, bigrammer og trigrammer – fra alle bøker og aviser som var blitt digitalisert ved Nasjonalbiblioteket per 15. juli 2022. N-grammene er laget på …
Språk: bokmål, nynorsk, nordsamisk, sørsamisk, lulesamisk, kvensk
Opphav: Språkbanken
Lisens: Creative_Commons-ZERO (CC-ZERO)
Tale, Tekst
15.12.2022
Norsk talestyringskorpus
Norsk talestyringskorpus (engelsk forkorting NVCC) er eit tekst- og talekorpus som består av skrivne og innlesne setningar (spørjingar). Dette er spørjingar ein typisk nyttar til å styre t.d. …
Språk: norsk
Opphav: Språkbanken
Lisens: Creative_Commons-ZERO (CC-ZERO)
Tale, Tekst
01.12.2022
LIA-trebanken
LIA-trebanken består av 7536 talemålssegment og 77 701 ord/token frå talespråkskorpuset LIA norsk. Trebanken er annotert morfologisk og syntaktisk og manuelt korrigert. LIA-trebanken er …
Språk: norsk, nynorsk
Opphav: CLARINO Tekstlaboratoriet
Lisens: Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Tale, Tekst, Video
01.12.2022
NDC-trebanken
NDC-trebanken inneholder 4637 talemålssegment og 66 042 ord/token fra den norske delen av Nordisk dialektkorpus. Segmentene er hentet fra 30 transkriberte intervjuer fra 17 stader i Noreg. Trebanken …
Språk: norsk, bokmål
Opphav: CLARINO Tekstlaboratoriet
Lisens: Creative_Commons-BY-NC-SA (CC-BY-NC-SA)
Tekst
05.10.2022
META-NORD Sofie Danish Treebank
The Danish part of the META-NORD Sofie Parallel Treebank. This treebank is a syntactically annotated parallel corpus based on the first chapters of the novel “Sofies verden” (Sophie's World) by …
Språk: dansk
Opphav: CLARINO Bergen
Lisens: unspecified
Tekst
05.10.2022
Text material from Forskning.no (1998 – 2017)
Data set containing texts from the popular science website forskning.no from the period 1998 - 2017. The text material is constituted by articles published by Forskning.no belonging to the following …
Språk: norsk, bokmål
Opphav: CLARINO Bergen
Lisens: CLARIN_RES-DEP
Tekst
07.09.2022
Stortingsforhandlinger 1814-2000
Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene ble digitalisert, OCR-lest og prosessert ved …
Språk: norsk
Opphav: Språkbanken
Lisens: Norwegian Licence for Open Government Data (NLOD)