N-gram – svensk

Med utgangspunkt i dei svenske tekstene i tekstkorpuset til Nordisk språkteknologi holding AS er det produsert n-gram (n=1-6) for ei tekstmengd på ca. 400 millionar ord. I denne versjonen er alle n-gramma samla og sorterte alfabetisk og etter frekvens. I tillegg ligg materialet føre i eit format der ein kan velje kva type tekster ein ønskjer å ta med. Denne versjonen innheld nokre fleire tekster og er til saman på ca. 437 millionar ord. Det er òg publisert ein "lett" versjon, der dei 1000 mest frekvente n-gramma er lista.

Med utgangspunkt i dei svenske tekstene i tekstkorpuset til Nordisk språkteknologi holding AS er det produsert n-gram (n=1-6) for ei tekstmengd på ca. 400 millionar ord. I denne versjonen er alle n-gramma samla og sorterte alfabetisk og etter frekvens. I tillegg ligg materialet føre i eit format der ein kan velje kva type tekster ein ønskjer å ta med. Denne versjonen innheld nokre fleire tekster og er til saman på ca. 437 millionar ord. Det er òg publisert ein "lett" versjon, der dei 1000 mest frekvente n-gramma er lista.

Utvidet metadata

Last ned ressurser