.
I mars 2011 inngjekk Nasjonalbiblioteket ei avtale med Kaldera språkteknologi AS om å få laga ordvevar ("wordnets") for nynorsk og bokmål.
- Versjon 1.0.0 av Norsk ordvev er no tilgjengeleg for nedlasting: gå til sida for leksikalske ressursar .
- Ein nettversjon av ordvevane er tilgjengeleg på nettsidene til Kaldera språkteknologi.
Språkbanken har sett i gang arbeidet med å lage ordvevar for bokmål og nynorsk. Det vil innehalde 50.000 omgrep, såkalla synset. Kvart synset kan innehelde fleire ord. Orda (eller rettare sagt: ordtydingane) skal ha same denotasjon, altså kjernetyding. For eksempel "hest", "øyk" og "gangar". Omgrepa vil verte koda med ei rekkje ulike relasjonar, til dømes hyponymi (ein "hest" er eit "dyr"), meronymi (ein "finger" er ein del av ei "hand"), stad (ein "oase" ligg i ein "ørken") og så bortetter.
Ordvevar er viktige ressursar for utviklinga av språkteknologiske program – til dømes automatisk omsetjing, informasjonsattfinning og grammatikk-kontroll - men òg innanfor språkforsking, særleg datalingvistikk.
Arbeidet med dei norske ordvevane er basert på eit skandinavisk samarbeid. Hovudstrukturen i ordvevane tek utgangspunkt i den danske ordveven DanNet, som i sin tur er basert på Den Danske Ordbog, og prosjektet dreg nytte av at dansk og norsk er nærståande språk, reint historisk. Sjølv om det er skilnader i mellom anna morfologi, syntaks og lydsystem (spesielt når det gjeld nynorsk og dialektane), er tydingsforskjellane mellom språka ofte eit spørsmål om ulike nyansar av orda, eller ulik bruk. Slike ulikskapar er ikkje reflekterte i ordveven, som ikkje kodar korkje sidetydingar (konnotasjonar) eller valens (avgrensingar i argumentstruktur).
Like fullt vil ei rekkje ord frå DanNet verte utelatne fordi dei hovudsakleg er relevante for danske tilhøve, mens ein del norske ord som manglar, vert tekne med (som døme kan ein ta ord som har med skiidrett å gjere). Eit omfattande redigeringsarbeid skal sikre at ordvevane reflekterer norsk, ikkje dansk, semantisk struktur.
Ei viktig utfordring for utviklinga av ordvevar er å halde kodinga konsistent. Til dømes kan "kappgang" vere eit hyponym til "idrett", men viss det eksisterer ei klasse "friidrett" der til dømes "spydkast" er kategorisert, bør ”kappgang” verte kategorisert under ”friidrett”. Eit av måla med samarbeidet med DanNet-prosjektet er at konsistensen kan verte svært høg ved at ein arbeider med det same materialet.
Prosjektet vert gjennomført av Kaldera språkteknologi AS.
- Ordvevar for bokmål og nynorsk
- Korpus med gullstandard
- Ein akustisk-fonetisk taledatabase for norsk



