N-grammer fra NBdigital

CLARINO NB – Språkbanken

Lisens: Creative_Commons-ZERO (CC-ZERO)

Oppdatert: 2016-02-24

Denne ressursen inneholder n-grammer - unigram, bigram og trigram - fra alle bøker og aviser som er blitt digitalisert ved Nasjonalbiblioteket frem til september 2013. De er laget på basis av et materiale på ca. 220.000 bøker og 540.000 aviser.

N-grammene finnes i to formater, CSV og SQlite: Førstnevnte vil antakeligvis være mest interessant for de fleste utviklere, da det er veldig lett å importere disse inn i bestående løsninger. SQLite-filene inneholder ferdig indekserte SQL-databaser som brukes i tjenesten NB N-gram. Brukere som ønsker å bidra til utviklingen av NB N-gram, kan laste ned kildekoden på GitHub og SQLite-databasene herfra.

Vis utvidede metadata

The link will take you to an external site: We take no responsibility whatsoever for the content of external links.