Hopp til innhold

NST tekst-til-tale-datasett

Dette datasettet består av omlag 8 timer opptak med manuskriptlest tale av en mannlig, østnorsktalende innleser. De fleste segmentene er setninger, men det er også noen tall og fragmenter mindre enn en setning. Manuskriptene er på bokmål.

En tidligere distribusjon av dette datasettet var vanskelig å benytte seg av på grunn av formatet på lyd- og metadatafilene, og mangel på dokumentasjon. Vi har derfor laget denne varianten med oppdaterte lyd- og metadatafiler. (Den opprinnelige versjonen kan finnes ved å søke på «sbr-15» i søkefeltet i ressurskatalogen.)

Datasettet består av en metadatafil (nst_tts_dataset.jsonl) og to kataloger, channel_1 og channel_2, som inneholder 5.363 lydfiler hver med lyden fra de to kanalene til originalopptakene. Det er én lydfil per segment. Metadatafilen inneholder én linje per segment, og angir varigheten til lydfilen i sekunder, transkripsjon, og den relative filstien til de to lydfilene. Lydfilene er i wav-format (22kHz).

Dette datasettet består av omlag 8 timer opptak med manuskriptlest tale av en mannlig, østnorsktalende innleser. De fleste segmentene er setninger, men det er også noen tall og fragmenter mindre enn en setning. Manuskriptene er på bokmål.

En tidligere distribusjon av dette datasettet var vanskelig å benytte seg av på grunn av formatet på lyd- og metadatafilene, og mangel på dokumentasjon. Vi har derfor laget denne varianten med oppdaterte lyd- og metadatafiler. (Den opprinnelige versjonen kan finnes ved å søke på «sbr-15» i søkefeltet i ressurskatalogen.)

Datasettet består av en metadatafil (nst_tts_dataset.jsonl) og to kataloger, channel_1 og channel_2, som inneholder 5.363 lydfiler hver med lyden fra de to kanalene til originalopptakene. Det er én lydfil per segment. Metadatafilen inneholder én linje per segment, og angir varigheten til lydfilen i sekunder, transkripsjon, og den relative filstien til de to lydfilene. Lydfilene er i wav-format (22kHz).

Utvidet metadata

Last ned ressurser

Last ned metadata