Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).
Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).
Dette korpuset inneholder publiserte historiske stortingsforhandlinger fra Stortinget for perioden 1814-2000. De til sammen 2136 bindene er digitalisert, OCR-lest og prosessert ved Nasjonalbiblioteket, og ble tilgjengeliggjort på nett i 2014.
Denne nedlastbare versjonen tilgjengeliggjøres slik dataene foreligger, uten videre korrektur eller redigering. Det er viktig å være oppmerksom på at OCR-lesningen kan være av dårlig kvalitet, særlig for de eldre protokollene (før 1950).
Korpuset publiseres på formatet JSONL (JSON lines), se mer om dette i dokumentasjonsfilen. Det er en jsonl-fil per bind, til sammen 2136 filer, og omlag 1,5 milliarder ord (tokens).