Hopp til innhold

Norsk koreferansekorpus

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset annotert med anaforiske relasjonar mellom substantivfrasar for norsk. Annoteringa berikar den eksisterande annoteringa til Norsk dependenstrebank (NDT), og inneheld totalt 15 742 setningar og 245 515 «tokens» for bokmål, og 12 481 setningar og 206 660 «tokens» for nynorsk.

Den vedlagde artikkelen av Mæhlum et al. frå CRAC 2022 skildrar annoteringsarbeidet i detalj.

Norwegian-BokmaalNARC og Norwegian-NynorskNARC er konverteringar av høvesvis bokmåls- og nynorskdelen av Norwegian Anaphora Resolution Corpus (NARC), det første offentleg tilgjengelege korpuset annotert med anaforiske relasjonar mellom substantivfrasar for norsk. Annoteringa berikar den eksisterande annoteringa til Norsk dependenstrebank (NDT), og inneheld totalt 15 742 setningar og 245 515 «tokens» for bokmål, og 12 481 setningar og 206 660 «tokens» for nynorsk.

Den vedlagde artikkelen av Mæhlum et al. frå CRAC 2022 skildrar annoteringsarbeidet i detalj.

Utvidet metadata

Last ned ressurser

Last ned metadata