Norske idiomer

Dette datasettet består av 3537 norske idiomer og fraser som forekommer flere enn 100 ganger i Nettbiblioteket. Det er 3455 idiomer på bokmål og 88 på nynorsk. I fremtiden vil vi prøve å legge til flere idiomer for nynorsk. Se dokumentasjonsfilen for en beskrivelse av datasettet. Dataene kan brukes til å måle ein generativ språkmodells evne til å fullføre kjente idiomer eller som en ‘masked language modelling’-oppgave.

Last ned ressurser

Utvidet metadata

Last ned metadata (CMDI XML)

Last ned metadata (CMDI XML) https://www.nb.no/sprakbanken/oai?verb=GetRecord&identifier=oai:nb.no:sbr-96&metadataPrefix=cmdi

dc:type	corpus
dc:title	Norske idiomer
dc:identifier	oai:nb.no:sbr-96
dc:description	Dette datasettet består av 3537 norske idiomer og fraser som forekommer flere enn 100 ganger i Nettbiblioteket. Det er 3455 idiomer på bokmål og 88 på nynorsk. I fremtiden vil vi prøve å legge til flere idiomer for nynorsk. Se dokumentasjonsfilen for en beskrivelse av datasettet. Dataene kan brukes til å måle ein generativ språkmodells evne til å fullføre kjente idiomer eller som en 'masked language modelling'-oppgave.
dc:publisher
dc:format	downloadable
dc:date
dc:date	2024-10-10
dc:rights	Public
dc:rights	Creative Commons (CC)
dc:rights	Creative_Commons-ZERO (CC-ZERO)
dc:rights	https://creativecommons.org/publicdomain/zero/1.0/
dc:creator	Tita Enstad
dc:lang	bokmål
dc:lang	nynorsk

Norske idiomer

Last ned ressurser

Utvidet metadata

Dublin Core (DC)

Last ned metadata (CMDI XML)