NST tekst-til-tale-datasett
Utvidet metadata
- resource Common Info:
- resource Type: corpus
- identification Info:
- resource Name: NST tekst-til-tale-datasett
- resource Name: NST Text-to-Speech Dataset
- description: Dette datasettet består av omlag 8 timer opptak med manuskriptlest tale av en mannlig, østnorsktalende innleser. De fleste segmentene er setninger, men det er også noen tall og fragmenter mindre enn en setning. Manuskriptene er på bokmål. En tidligere distribusjon av dette datasettet var vanskelig å benytte seg av på grunn av formatet på lyd- og metadatafilene, og mangel på dokumentasjon. Vi har derfor laget denne varianten med oppdaterte lyd- og metadatafiler. (Den opprinnelige versjonen kan finnes ved å søke på "sbr-15" i søkefeltet i ressurskatalogen.) Datasettet består av en metadatafil (nst_tts_dataset.jsonl) og to kataloger, channel_1 og channel_2, som inneholder 5.363 lydfiler hver med lyden fra de to kanalene til originalopptakene. Det er én lydfil per segment. Metadatafilen inneholder én linje per segment, og angir varigheten til lydfilen i sekunder, transkripsjon, og den relative filstien til de to lydfilene. Lydfilene er i wav-format (22kHz).
- description: This dataset consists of close to 8 hours of recordings of a male speaker of Eastern Norwegian reading from a manuscript. Most of the segments are sentences, but there are also some numbers and other non-sentences utterances. Everything is in Norwegian Bokmål. An earlier distribution of this dataset was difficult to make use of due to the format of the audio and metadata files, as well as the lack of documentation. We have therefore made this new release with updated audio and metadata files. (The original release can be found by hitting "sbr-15" in the search box in the resource catalogue.) This release consists of a metadata file (nst_tts_dataset.jsonl) and two directories, channel_1 and channel_2, containing 5,363 audio files each with the audio from the two channels of the original recordings. There is one audio file per segment. The metadata file contains one line per segment with the duration of the audio file in seconds, the transcription, and the relative path to the channel one and channel two recordings. The audio format is 22kHz wav.
- url: https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-87/
- P I D: hdl:21.11146/87
- identifier: sbr-87
- distribution Info:
- licence Info:
- user Category: Public
- distribution Access Medium: downloadable
- download Location: https://www.nb.no/sprakbanken/ressurskatalog/oai-nb-no-sbr-87/
- licence:
- licence Family: Creative Commons (CC)
- licence Name: Creative_Commons-ZERO (CC-ZERO)
- licence Url: https://creativecommons.org/publicdomain/zero/1.0/
- licensor:
- actor Info:
- actor Type: organization
- role: Licensor
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbanken
- department Name: The Language Bank
- communication Info:
- email: sprakbanken@nb.no
- url: https://www.nb.no/sprakbanken/
- address: P.O Box 2674 Solli
- zip Code: 0203
- city: Oslo
- region: Oslo
- country: Norway
- contact
- actor Info:
- actor Type: organization
- role: Contact
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbannken
- department Name: The Language Bank
- communication Info:
- email: sprakbanken@nb.no
- url: https://www.nb.no/sprakbanken/
- address: P.O. Box 2674 Solli
- zip Code: 0203
- city: Oslo
- region: Oslo
- country: Norway
- actor Info:
- actor Type: organization
- role: Metadata Creator
- organization Info:
- organization Name: Nasjonalbiblioteket
- organization Name: National Library of Norway
- organization Short Name: NB
- organization Short Name: NLN
- department Name: Språkbanken
- department Name: The Language Bank
- actor Info:
- actor Type: organization
- role: Resource Creator
- organization Info:
- organization Name: Nordisk språkteknologi AS
- organization Name: Nordic Language Technology AS
- organization Short Name: NST
- organization Short Name: NST
- corpus Info:
- corpus Type: Multimodal Corpus
- corpus Part Info:
- media Type: audio
- corpus Audio Info:
- audio Size Info:
- size Info:
- size: 10726
- size Unit: files
- size Info:
- size: 8
- size Unit: hours
- size Info:
- size: 1,7
- size Unit: gb
- duration Of Effective Speech Info:
- size: 8
- duration Unit: hours
- duration Of Audio Info:
- size: 8
- duration Unit: hours
- audio Format Info:
- mime Type: audio/wav
- sampling Rate: 22
- number Of Tracks: 2
- corpus Part Info:
- media Type: text
- corpus Text Info:
- text Format Info:
- mime Type: application/jsonl
- size Per Text Format:
- size Info:
- size: 5363
- size Unit: entries
- character Encoding Info:
- character Encoding: UTF-8
- corpus Part General Info:
- linguality Info:
- linguality Type: monolingual
- language Info:
- language Id: nb
- language Name: Norwegian Bokmål
- size Per Language:
- size Info:
- size: 1
- size Unit: files
- size Info:
- size: 1,7
- size Unit: gb
- language Variety Info:
- language Variety Type: other
- language Variety Name: Standard Eastern Norwegian
- modality Info:
- modality Type: spokenLanguage
- modality Type Details: Standard Eastern Norwegian
- annotation Info:
- annotation Type: speechAnnotation-orthographicTranscription
dc:type | corpus |
dc:title | NST tekst-til-tale-datasett |
dc:identifier | oai:nb.no:sbr-87 |
dc:description | Dette datasettet består av omlag 8 timer opptak med manuskriptlest tale av en mannlig, østnorsktalende innleser. De fleste segmentene er setninger, men det er også noen tall og fragmenter mindre enn en setning. Manuskriptene er på bokmål. En tidligere distribusjon av dette datasettet var vanskelig å benytte seg av på grunn av formatet på lyd- og metadatafilene, og mangel på dokumentasjon. Vi har derfor laget denne varianten med oppdaterte lyd- og metadatafiler. (Den opprinnelige versjonen kan finnes ved å søke på "sbr-15" i søkefeltet i ressurskatalogen.) Datasettet består av en metadatafil (nst_tts_dataset.jsonl) og to kataloger, channel_1 og channel_2, som inneholder 5.363 lydfiler hver med lyden fra de to kanalene til originalopptakene. Det er én lydfil per segment. Metadatafilen inneholder én linje per segment, og angir varigheten til lydfilen i sekunder, transkripsjon, og den relative filstien til de to lydfilene. Lydfilene er i wav-format (22kHz). |
dc:publisher | |
dc:format | downloadable |
dc:date | 1998-01-05 |
dc:date | 2023-08-25 |
dc:rights | Public |
dc:rights | Creative Commons (CC) |
dc:rights | Creative_Commons-ZERO (CC-ZERO) |
dc:rights | https://creativecommons.org/publicdomain/zero/1.0/ |
dc:creator | Nordisk språkteknologi AS |
dc:creator | Nasjonalbiblioteket |
dc:lang | bokmål |