Norsk dependenstrebank er to separate trebankar, med tekster på bokmål og nynorsk, annotert morfologisk og syntaktisk. Kvar trebank innheld om lag 300.000 «tokens» (ordformer inkl. teiknsetjing). Den morfologiske analysen følgjer Norsk referansegrammatikk, medan dependensgrammatikk vert nytta for den syntaktiske analysen. Annoteringa er gjort maskinelt, men er kvalitetssjekka og manuelt korrigert av to lingvistar, og held såleis ein «gullstandard».
Norsk dependenstrebank er to separate trebankar, med tekster på bokmål og nynorsk, annotert morfologisk og syntaktisk. Kvar trebank innheld om lag 300.000 «tokens» (ordformer inkl. teiknsetjing). Den morfologiske analysen følgjer Norsk referansegrammatikk, medan dependensgrammatikk vert nytta for den syntaktiske analysen. Annoteringa er gjort maskinelt, men er kvalitetssjekka og manuelt korrigert av to lingvistar, og held såleis ein «gullstandard».
Utvidet metadata
resource Common Info:
resource Type: corpus
identification Info:
resource Name: Norsk dependenstrebank (NDT)
resource Name: Norwegian Dependency Treebank
description: Norsk dependenstrebank er to separate trebankar, med tekster på bokmål og nynorsk, annotert morfologisk og syntaktisk. Kvar trebank innheld om lag 300.000 "tokens" (ordformer inkl. teiknsetjing). Den morfologiske analysen følgjer Norsk referansegrammatikk, medan dependensgrammatikk vert nytta for den syntaktiske analysen. Annoteringa er gjort maskinelt, men er kvalitetssjekka og manuelt korrigert av to lingvistar, og held såleis ein "gullstandard".
description: The Norwegian Dependency Treebank (NDT) consists of text which is manually annotated with morphological features, syntactic functions and hierarchical structure. The formalism used for the syntactic annotation is dependency grammar. With a few exceptions, the syntactic analysis follows Norsk referensegrammatikk ‘Norwegian Reference Grammar'.
The treebank consists of two parts, containing 300.000 tokens (words and punctuation) each for Norwegian Bokmål and Nynorsk, respectively.
non Standard Conditions Of Use: * NORED * No redistribution * The original third-party contents are not included in this CC-0 license, and these individual works may not be republished as stand-alone texts.
Norsk dependenstrebank er to separate trebankar, med tekster på bokmål og nynorsk, annotert morfologisk og syntaktisk. Kvar trebank innheld om lag 300.000 "tokens" (ordformer inkl. teiknsetjing). Den morfologiske analysen følgjer Norsk referansegrammatikk, medan dependensgrammatikk vert nytta for den syntaktiske analysen. Annoteringa er gjort maskinelt, men er kvalitetssjekka og manuelt korrigert av to lingvistar, og held såleis ein "gullstandard".