BigBrother-korpuset er et talespråkskorpus som består av den første sesongen av realityserien BigBrother som ble sendt på TVNorge våren 2001. Deltakerne i BigBrother er i alderen 23-36 år og snakker ulike dialekter.
BigBrother-korpuset inneholder lyd- og videoopptak av nesten alle de 100 sendingene som ble vist på tv, cirka 44 300 tokens. Materialet er ortografisk transkribert og lenket til lyd og video. Transkripsjonene er også tagget morfologisk.
BigBrother-korpuset er et unikt talespråkskorpus der deltakerne arbeider sammen, diskutere, argumenterer, krangler, gråter, ler, roper og elsker. I motsetning til kontrollerte talespråksinnspillinger som ofte er begrenset til intervjuer og dialog, har BigBrother-materialet samtaler om alle mulige temaer og innen ulike genre. Noen ganger er sterke følelser i sving, og dette kan tenkes å innvirkning på språket.
Transkripsjonene er nedlastbare.
BigBrother-korpuset er et talespråkskorpus som består av den første sesongen av realityserien BigBrother som ble sendt på TVNorge våren 2001. Deltakerne i BigBrother er i alderen 23-36 år og snakker ulike dialekter.
BigBrother-korpuset inneholder lyd- og videoopptak av nesten alle de 100 sendingene som ble vist på tv, cirka 44 300 tokens. Materialet er ortografisk transkribert og lenket til lyd og video. Transkripsjonene er også tagget morfologisk.
BigBrother-korpuset er et unikt talespråkskorpus der deltakerne arbeider sammen, diskutere, argumenterer, krangler, gråter, ler, roper og elsker. I motsetning til kontrollerte talespråksinnspillinger som ofte er begrenset til intervjuer og dialog, har BigBrother-materialet samtaler om alle mulige temaer og innen ulike genre. Noen ganger er sterke følelser i sving, og dette kan tenkes å innvirkning på språket.
Transkripsjonene er nedlastbare.
Utvidet metadata
resource Common Info:
resource Type: corpus
identification Info:
resource Name: The BigBrother Corpus
resource Name: BigBrother-korpuset
description: BigBrother-korpuset er et talespråkskorpus som består av den første sesongen av realityserien BigBrother som ble sendt på TVNorge våren 2001. Deltakerne i BigBrother er i alderen 23-36 år og snakker ulike dialekter.
BigBrother-korpuset inneholder lyd- og videoopptak av nesten alle de 100 sendingene som ble vist på tv, cirka 44 300 tokens. Materialet er ortografisk transkribert og lenket til lyd og video. Transkripsjonene er også tagget morfologisk.
BigBrother-korpuset er et unikt talespråkskorpus der deltakerne arbeider sammen, diskutere, argumenterer, krangler, gråter, ler, roper og elsker. I motsetning til kontrollerte talespråksinnspillinger som ofte er begrenset til intervjuer og dialog, har BigBrother-materialet samtaler om alle mulige temaer og innen ulike genre. Noen ganger er sterke følelser i sving, og dette kan tenkes å innvirkning på språket.
Transkripsjonene er nedlastbare.
description: The BigBrother Corpus is a speech corpus with recordings from the first season of the BigBrother show, sent on Norwegian television by TVNorge in the first half of 2001. The participants in BigBrother speak different dialects, but primarily they come from the east of Norway. They are aged 23-36 years.
The BigBrother Corpus contains audio and video recordings of almost all the 100 broadcasts that was shown on television, approx. 440 300 tokens. The recordings are linked to the orthographic transcriptions. The transcriptions are also tagged morphologically.
The BigBrother Corpus is a unique speech corpus where the participants work together, discuss, argue, quarrel, cries, laugh, shout, make love etc. In contrast to controlled recordings that are limited to interviews and dialogue, the BigBrother-material has conversations about all possible topics and within different genre. Sometimes strong feelings are in turn, which also can conceivably have an impact on the language.
The transcripts can be downloaded.
non Standard Conditions Of Use: The corpus has audio and video recordings classified as personal data.The production company Nordic Entertainment has generously given their consent to the usage of the videos as a speech corpus. Every individual researcher is responsible for treating the participants with resepct and sincerity. Furthermore, the informants in the corpora should be anonymized, e.g. by changing their names, in every published paper or other output.
licensor:
actor Info:
actor Type: organization
organization Info:
organization Name: Universitetet i Oslo
organization Name: University of Oslo
organization Short Name: UiO
organization Short Name: UoU
department Name: Department of Linguistics and Scandinavian Studies
department Name: Institutt for lingvistiske og nordiske studier
funder: The Research Council of Norway, the KUNSTI program (Kunnskapsutvikling for norsk språkteknologi).
funding Country: Norway
project Start Date: 31.08.2007
project End Date: 31.12.2007
corpus Info:
corpus Type: Multimodal Corpus
corpus Part Info:
media Type: text
corpus Text Info:
text Format Info:
mime Type: txt
size Per Text Format:
size Info:
size: 440 338
size Unit: tokens
character Encoding Info:
character Encoding: utf8
corpus Part Info:
media Type: video
corpus Video Info:
video Content Info:
type Of Video Content: Recordings from the first season of the BigBrother show, that means audio and video recordings of almost all the 100 broadcasts that was shown on television.
text Included In Video: none
setting Info:
naturality: spontaneous
conversational Type: multilogue
audience: some
interactivity: overlapping
interaction: All kinds of situations in the BigBrother house. The participants prepare dinner, eat, sleep, make love, discuss, work together etc etc.
video Format Info:
mime Type: videos in mpeg4 streaming format available through Glossa
compression Info:
compression: true
compression Name: mpg
corpus Part Info:
media Type: audio
corpus Audio Info:
audio Size Info:
size Info:
size: Approx 29 GB
size Unit: gb
audio Content Info:
setting Info:
naturality: spontaneous
conversational Type: multilogue
audience: some
interactivity: overlapping
interaction: All kinds of situations in the BigBrother house. The participants prepare dinner, eat, sleep, make love, discuss, work together etc etc.
audio Format Info:
mime Type: wav and mpeg
signal Encoding: linearPCM
sampling Rate: 32
quantization: 64
number Of Tracks: 1
recording Quality: medium
compression Info:
compression: true
compression Name: mpg
corpus Part General Info:
person Source Set Info:
number Of Persons: 12
age Of Persons: adult
age Range Start: 23
age Range End: 36
sex Of Persons: mixed
origin Of Persons: native
dialect Accent Of Persons: Some dialects represented, all of them from Southern Norway.
linguality Info:
linguality Type: monolingual
language Info:
language Id: No
language Name: Norwegian
language Info:
language Id: Nb
language Name: Norwegian Bokmål
modality Info:
modality Type: spokenLanguage
modality Type Details: Informal language from all settings in the BigBrother house.
target Resource Name U R I: Transcriber (http://trans.sourceforge.net/en/presentation.php )
classification Info:
genre Info:
genre Type: speechGenre
genre: informal
unstandardised Genre: All kinds of situations in the BigBrother house. The participants prepare dinner, eat, sleep, make love, discuss, work together etc etc. Lots of emotions.
time Coverage Info:
time Coverage: 2001
dc:type
corpus
dc:title
BigBrother-korpuset
dc:identifier
oai:tekstlab.uio.no:bigbrother
dc:description
BigBrother-korpuset er et talespråkskorpus som består av den første sesongen av realityserien BigBrother som ble sendt på TVNorge våren 2001. Deltakerne i BigBrother er i alderen 23-36 år og snakker ulike dialekter.
BigBrother-korpuset inneholder lyd- og videoopptak av nesten alle de 100 sendingene som ble vist på tv, cirka 44 300 tokens. Materialet er ortografisk transkribert og lenket til lyd og video. Transkripsjonene er også tagget morfologisk.
BigBrother-korpuset er et unikt talespråkskorpus der deltakerne arbeider sammen, diskutere, argumenterer, krangler, gråter, ler, roper og elsker. I motsetning til kontrollerte talespråksinnspillinger som ofte er begrenset til intervjuer og dialog, har BigBrother-materialet samtaler om alle mulige temaer og innen ulike genre. Noen ganger er sterke følelser i sving, og dette kan tenkes å innvirkning på språket.
Transkripsjonene er nedlastbare.