Norsk Aviskorpus (nynorsk) er eit ope tilgjengeleg tekstkorpus som representerer moderne norsk i skriftvarianten nynorsk. Per i dag inneheld korpuset ca. 21 millinonar ord fra 1998 til 2020, og du kan søkje i løpande ord (tokens) og sortere på kjelde (avisnamn), år og dato.
Korpuset byggjast gjennom dagleg innhausting og omarbeiding av publiserte tekstar frå nettutgåva av 11 store norske aviser, og vart oppretta gjennom prosjektet Norsk aviskorpus ved Universitetet i Bergen (1998–2012). Sjølv om prosjektet er avslutta, blir korpuset jamleg oppdatert i søkjegrensesnittet Korpuskel med nytt materale som ein del av drifta i CLARINO, og er såleis eit dynamisk, veksande korpus.
Eit tilsvarande korpus er òg tilgjengeleg for norsk bokmål.
Norsk Aviskorpus (nynorsk) er eit ope tilgjengeleg tekstkorpus som representerer moderne norsk i skriftvarianten nynorsk. Per i dag inneheld korpuset ca. 21 millinonar ord fra 1998 til 2020, og du kan søkje i løpande ord (tokens) og sortere på kjelde (avisnamn), år og dato.
Korpuset byggjast gjennom dagleg innhausting og omarbeiding av publiserte tekstar frå nettutgåva av 11 store norske aviser, og vart oppretta gjennom prosjektet Norsk aviskorpus ved Universitetet i Bergen (1998–2012). Sjølv om prosjektet er avslutta, blir korpuset jamleg oppdatert i søkjegrensesnittet Korpuskel med nytt materale som ein del av drifta i CLARINO, og er såleis eit dynamisk, veksande korpus.
Eit tilsvarande korpus er òg tilgjengeleg for norsk bokmål.
Utvidet metadata
resource Common Info:
resource Type: corpus
identification Info:
resource Name: Norwegian Newspaper Corpus Nynorsk
resource Name: Norsk aviskorpus nynorsk
description: The Norwegian Newspaper Corpus (Nynorsk) is a freely accessible text corpus representing modern Norwegian in the written variety Norwegian Nynorsk. As of today, the material contains texts from 1998 to 2020, and the corpus contains 21 million running words (tokens). Through the search interface Corpuscle, you may search for all running words in the text (tokens) and sort by source (newspaper name), year and date. The corpus has been compiled through daily harvesting and processing of published texts from the online editions of 11 major Norwegian newspapers, and was created through the project Norwegian Newspaper Corpus at the University of Bergen (1998–2012). Although the project has ended, the corpus is regularly updated via the search interface Corpuscle with new material, and is thus a dynamic, growing corpus. A similar corpus is also available for Norwegian Bokmål.
description: Norsk Aviskorpus (nynorsk) er eit ope tilgjengeleg tekstkorpus som representerer moderne norsk i skriftvarianten nynorsk. Per i dag inneheld korpuset ca. 21 millinonar ord fra 1998 til 2020, og du kan søkje i løpande ord (tokens) og sortere på kjelde (avisnamn), år og dato.
Korpuset byggjast gjennom dagleg innhausting og omarbeiding av publiserte tekstar frå nettutgåva av 11 store norske aviser, og vart oppretta gjennom prosjektet Norsk aviskorpus ved Universitetet i Bergen (1998–2012). Sjølv om prosjektet er avslutta, blir korpuset jamleg oppdatert i søkjegrensesnittet Korpuskel med nytt materale som ein del av drifta i CLARINO, og er såleis eit dynamisk, veksande korpus.
Eit tilsvarande korpus er òg tilgjengeleg for norsk bokmål.
document Unstructured: Andersen, Gisle, and Knut Hofland. 2012. “Building a Large Corpus Based on Newspapers from the Web.” In Exploring Newspaper Language: Using the Web to Create and Investigate a Large Corpus of Modern Norwegian, edited by Gisle Andersen, 1–28. Studies in Corpus Linguistics 49. Amsterdam/Philadelphia: John Benjamins Publishing Company
title: The Newspaper corpus is compiled of text from the following ten newspapers that were incuded from the start on October 13 1998 (listed by newspaper code in the NCC and the full name of the newspaper):
AA – Adresseavisen
AP – Aftenposten
BT – Bergens Tidende
DA – Dagsavisen
DB – Dagbladet
DN – Dagens Næringsliv
FV – Fædrelandsvennen
NL – Nordlys
OD – Odin (public information)
SA – Stavanger Aftenblad
VG – Verdens Gang
linguality Info:
linguality Type: monolingual
language Info:
language Id: no
language Name: Norwegian
language Info:
language Id: nn
language Name: Norwegian Nynorsk
modality Info:
modality Type: writtenLanguage
size Info:
size: 21 089 194
size Unit: tokens
size Info:
size: 21 010 885
size Unit: words
annotation Info:
annotation Type: other
annotation Format: Annotated with newspaper title and date.
classification Info:
genre Info:
genre Type: textGenre
genre: newspaper and magazines
time Coverage Info:
time Coverage: 1998–2020
dc:type
corpus
dc:title
Norsk aviskorpus nynorsk
dc:identifier
oai:clarino.uib.no:avis-nno
dc:description
Norsk Aviskorpus (nynorsk) er eit ope tilgjengeleg tekstkorpus som representerer moderne norsk i skriftvarianten nynorsk. Per i dag inneheld korpuset ca. 21 millinonar ord fra 1998 til 2020, og du kan søkje i løpande ord (tokens) og sortere på kjelde (avisnamn), år og dato.
Korpuset byggjast gjennom dagleg innhausting og omarbeiding av publiserte tekstar frå nettutgåva av 11 store norske aviser, og vart oppretta gjennom prosjektet Norsk aviskorpus ved Universitetet i Bergen (1998–2012). Sjølv om prosjektet er avslutta, blir korpuset jamleg oppdatert i søkjegrensesnittet Korpuskel med nytt materale som ein del av drifta i CLARINO, og er såleis eit dynamisk, veksande korpus.
Eit tilsvarande korpus er òg tilgjengeleg for norsk bokmål.