2024-03-28T17:34:17.989Z
https://www.nb.no/sprakbanken/oai
nb:Nasjonalbiblioteket¦nn:Nasjonalbiblioteket¦en:National Library of Norway
2021-06-24
https://www.nb.no/sprakbanken/oai?verb=GetRecord&identifier=oai:nb.no:sbr-54&metadataPrefix=cmdi
clarin.eu:cr1:p_1407745711925
Språkbanken NB
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/ADB_NOR_0463.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/ADB_NOR_0464.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/ADB_OD_Nor.NOR.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_1_a.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_1_b.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_1_c.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_1_d.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_2_a.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_2_b.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_2_c.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_2_d.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_begge_a.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_begge_b.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_begge_c.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/lydfiler_16_begge_d.tar.gz
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/no-16khz_reorganisert_norsk.pdf
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/no-16khz_reorganized_english.pdf
Resource
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/metadata_no_csv.zip
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
describes
corpus
NST norsk ATG-database (16 kHz) - reorganisert
NST Norwegian ASR Database (16 kHz) - Reorganized
Denne databasen er laget av Nordisk språkteknologi som datagrunnlag for talegjenkjenning og diktering på norsk. I denne versjonen (fra 2022) er dataene strukturert på nytt, slik at databasen enklere kommer til anvendelse.
Datasettet ble gjennomgått på nytt i desember 2023; duplikater ble fjernet, det ble ryddet i metadataene og filnavn ble standardisert. Se dokumentasjonsfilen for detaljer.
I den opprinnelige versjonen av materialet var filene organisert i en bestemt mappestruktur der mappenavnene var meningsbærende. Filnavnene var imidlertid ikke meningsbærende, og det fantes også tilfeller av filer med samme navn i forskjellige mapper. Dette viste seg å være upraktisk, siden brukerne måtte beholde den opprinnelige mappestrukturen for å kunne benytte seg av dataene.
Filene har fått nye navn, slik at alle filnavn er unike og meningsbærende uavhengig av mappestrukturen. De opprinnelige metadatafilene var i spl-format; disse er konvertert til JSON-format. Metadatafilene er anonymisert, og tekstkodingen er endret fra ANSI til UTF-8. Metadata og transkripsjoner foreligger også som CSV-filer.
Se dokumentasjonsfilen for en full beskrivelse av dataene og endringene som er gjort.
This database was created by Nordic Language Technology for the development of automatic speech recognition and dictation in Norwegian. In this version (from 2022), the organization of the data has been altered to make the database more user friendly.
The data set was reviewed again in December 2023; duplicates were removed, metadata was cleaned up and filenames were standardized. See the documentation file for details.
In the original version of the material, the files were organized in a specific folder structure where the folder names were meaningful. However, the file names were not meaningful, and there were also cases of files with identical names in different folders. This proved to be impractical, since users had to keep the original folder structure in order to use the data.
The files have been renamed, such that each file name is unique and meaningful regardless of the folder structure. The original metadata files were in spl format; these have been converted to JSON format. The metadata files are anonymized, and the text encoding has been converted from ANSI to UTF-8. Metadata and transcriptions are also available as CSV files.
See the documentation file for a full description of the data and the changes that have been made to the database.
https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-54/
hdl:21.11146/54
sbr-54
Public
downloadable
https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-54/
Creative Commons (CC)
Creative_Commons-ZERO (CC-ZERO)
https://creativecommons.org/publicdomain/zero/1.0/
organization
Licensor
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
organization
Distribution Rights Holder
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
organization
Contact
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
2020-10-21
English
en
2024-01-23
person
Metadata Creator
Lindstad
Arne Martinus
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
2
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/no-16khz_reorganized_english.pdf
2023-12-19
true
content
mixed
Change of file formats, change of text encoding.
partial
person
Resource Validator
Solberg
Per Erik
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
documentation
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/no-16khz_reorganisert_norsk.pdf
documentation
https://www.nb.no/sbfil/talegjenkjenning/16kHz_2020/no_2020/no-16khz_reorganized_english.pdf
1998-01-05
2023-12-19
organization
Resource Creator
Nordic Language Technology AS
Nordisk språkteknologi AS
NST
NST
person
Resource Creator
Johnsen
Lars
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
person
Resource Creator
Solberg
Per Erik
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
sprakbanken@nb.no
https://www.nb.no/sprakbanken/
P.O. Box 2674 Solli
0203
Oslo
Oslo
Norway
person
Resource Creator
Tungland
Lars Magne
National Library of Norway
Nasjonalbiblioteket
NLN
NB
The Language Bank
Språkbanken
Multimodal Corpus
audio
171,8
gb
12
files
audio/wav
text
application/json
6,3
mb
3
files
UTF-8
monolingual
no
Norwegian
dialect
Norwegian dialects
spokenLanguage
manuscript read
171,8
gb
speechAnnotation-orthographicTranscription
word
manual