Hopp til innhold

Frekvensordliste (bokmål) fra ord i norsk avisspråk

Frekvensordliste fra Norsk aviskorpus (bokmål). Frekvensordlisten er en liste av de 10.000 mest frekvente ordene i Norsk aviskorpus, sortert på frekvens fra høyest til lavest. Norsk aviskorpus inneholder tekst fra elleve store aviser med materiale fra 1998 til 2022.
Frekvensordlisten kan f.eks. bruke for å luke ut «stoppord» (vanlige ord med antatt lav informasjonsverdi) i språkteknologisk prosessering av tekst, eller for å tallfeste hva som er «vanlige» ord og ordforråd. Listen inneholder både språklige ord og tegnsetting, og skiller mellom store og små bokstaver. På toppen av listen finner du bl.a.: «.», «som», «det», og «Det». Merk at de mest frekvente ordene fra avisspråk, som her, kan være annerledes enn de mest frekvente ord fra skjønnlitteratur, ungdomsspråk eller barnespråk. Blant de 100 mest frekvente ordene finner du bl.a. «VG» og «Foto» (fordi ordet «Foto» ofte går igjen i avistekster med bildekreditering).
Frekvensordlisten er generert 25.08.2025, og du kan alltid hente en nyere liste direkte fra Norsk aviskorpus via clarino.uib.no/korpuskel. Du kan da også hente flere ord enn de 10.000 som er nedlastbare her.

Frekvensordliste fra Norsk aviskorpus (bokmål). Frekvensordlisten er en liste av de 10.000 mest frekvente ordene i Norsk aviskorpus, sortert på frekvens fra høyest til lavest. Norsk aviskorpus inneholder tekst fra elleve store aviser med materiale fra 1998 til 2022.
Frekvensordlisten kan f.eks. bruke for å luke ut «stoppord» (vanlige ord med antatt lav informasjonsverdi) i språkteknologisk prosessering av tekst, eller for å tallfeste hva som er «vanlige» ord og ordforråd. Listen inneholder både språklige ord og tegnsetting, og skiller mellom store og små bokstaver. På toppen av listen finner du bl.a.: «.», «som», «det», og «Det». Merk at de mest frekvente ordene fra avisspråk, som her, kan være annerledes enn de mest frekvente ord fra skjønnlitteratur, ungdomsspråk eller barnespråk. Blant de 100 mest frekvente ordene finner du bl.a. «VG» og «Foto» (fordi ordet «Foto» ofte går igjen i avistekster med bildekreditering).
Frekvensordlisten er generert 25.08.2025, og du kan alltid hente en nyere liste direkte fra Norsk aviskorpus via clarino.uib.no/korpuskel. Du kan da også hente flere ord enn de 10.000 som er nedlastbare her.

Last ned ressurser

Utvidet metadata

Last ned metadata (CMDI XML)