Hopp til innhold

ONOMASTICA uttaleleksikon 2

ONOMASTICA versjon 2 er ein oppdatert versjon av ONOMASTICA. For å gjere uttaleleksikonet enklare tilgjengeleg, har Språkbanken parsa dei originale filene og generert ei fil i csv-format. Fila inneheld totalt 556.281 dataliner, ei line per namn. Sjå dokumentasjonsfila for ei beskriving av denne versjonen (onomastica_2.pdf), og den originale dokumentasjonen for meir detaljert informasjon om dei ulike datafelta (onomastica.pdf).

Databasen ONOMASTICA var opphavleg eit uttaleleksikon med data frå den norske delen i ONOMASTICA-prosjektet, eit europeisk forskingsprosjekt som hadde som mål å lage uttaleleksika for eigennamn for fleire europeiske språk. Databasen inneheld fonetiske transkripsjonar av fornamn, etternamn, namn på selskap, gatenamn, stadnamn og utanlandske namn. Totalt inneheldt den opprinnelege databasen 556.499 namn. Namna er automatisk transkriberte, men delar av materialet er manuelt sjekka av fonetikarar. Materialet er transkribert i SAMPA.

Databasen vert publisert med løyve frå Telenor, og kan nyttast fritt og utan vederlag. Telenor skal krediterast når databasen vert brukt eller distribuert.

ONOMASTICA versjon 2 er ein oppdatert versjon av ONOMASTICA. For å gjere uttaleleksikonet enklare tilgjengeleg, har Språkbanken parsa dei originale filene og generert ei fil i csv-format. Fila inneheld totalt 556.281 dataliner, ei line per namn. Sjå dokumentasjonsfila for ei beskriving av denne versjonen (onomastica_2.pdf), og den originale dokumentasjonen for meir detaljert informasjon om dei ulike datafelta (onomastica.pdf).

Databasen ONOMASTICA var opphavleg eit uttaleleksikon med data frå den norske delen i ONOMASTICA-prosjektet, eit europeisk forskingsprosjekt som hadde som mål å lage uttaleleksika for eigennamn for fleire europeiske språk. Databasen inneheld fonetiske transkripsjonar av fornamn, etternamn, namn på selskap, gatenamn, stadnamn og utanlandske namn. Totalt inneheldt den opprinnelege databasen 556.499 namn. Namna er automatisk transkriberte, men delar av materialet er manuelt sjekka av fonetikarar. Materialet er transkribert i SAMPA.

Databasen vert publisert med løyve frå Telenor, og kan nyttast fritt og utan vederlag. Telenor skal krediterast når databasen vert brukt eller distribuert.

Utvidet metadata

Last ned ressurser

Last ned metadata