.
I januar 2012 starta Lingit AS i Trondheim arbeidet med å etablere ein grunnleggjande akustisk-fonetisk taledatabase for norsk av høg teknisk og fagleg kvalitet. Databasen skal primært nyttast i forskings- og utviklingsarbeid knytt til automatisk taleattkjenning, men han vil òg vere verdifull innanfor fonetisk forsking om norsk talespråk.
Bidra i innlesinga av taledata! Les meir hos Lingit .
Taledatabasen skal dekkje fonologisk variasjon i norsk. Det vil ikkje vere mogleg å dekkje alle detaljar frå norske dialektar innanfor dei tidsrammene som står til rådvelde, men hovudtrekka skal dokumenterast, omtrent på same måten som det har vorte gjort i TIMIT-korpuset for amerikansk engelsk. Leveransen vil dekkje det grunnleggjande norske foneminventaret og dei mest sentrale intonasjonsmønstra.
Talematerialet vil vere basert på manuskript som vert lesne på den måten som er mest naturleg for innlesarane. Derfor vert det lagt nokså omfattande ressursar i å utarbeide manuskript som dekkjer den fonologiske uttalevariasjonen vi er på jakt etter. Akustisk variasjon er òg vesentleg, og opptaka skal derfor vere balanserte med omsyn til alder og kjøn. Utvalet av talarar er konsentrert rundt større byar som dekkjer det definerte foneminventaret. Når det gjeld koplinga mellom lydopptak og nynorsk skriftspråk, vert innsatsen konsentrert til dei nynorske kjerneområda i Hordaland, Sogn og Fjordane, og Møre og Romsdal.
Opptaka vert gjennomførde i profesjonelle lydstudio med nærfeltsmikrofon og studiomikrofon. På denne måten sikrar ein at det er god kontroll på relevante akustiske parametrar, primært med tanke på å minimere bakgrunnsstøy. Alle setningane vert transkriberte i X-SAMPA. Det mest tidkrevjande arbeidet er tidsmerking av alle setningane, det vil seie at det vert markert kor fonem og ord startar og sluttar. Merkinga skal ha eit maksimalt avvik på gjennomsnittleg 20 millisekund. For grenser som involverer lukkelydar vil avviket typisk vere vesentleg mindre enn 20 ms, mens avviket kan vere større i vokalovergangar (til dømes Eia) og visse konsonant-vokal-sambindingar (til dømes ha).
Materialet vert lagra i ukomprimert WAVE-format (Waveform Audio File Format) med 48 kHz punktprøvingsfrekvens og minst 16 bit oppløysing. Dette formatet kan enkelt verte konvertert til kva ein måtte ønskje av andre format. Metadata vert koda i XML eller eit liknande format som er enkelt å arbeide med og lett å konvertere til andre format.
- Ordvevar for bokmål og nynorsk
- Korpus med gullstandard
- Ein akustisk-fonetisk taledatabase for norsk



