Norsk WebDewey – et verktøy i vekst

Gjesteblogger Grete Seland fra Universitetsbiblioteket ved Universitetet i Oslo (UiO) skriver om erfaringer med bruk av norsk WebDewey (DDC23) i prosjektet «Mapping mot norsk WebDewey».

I januar i år dukket det opp to nye overskrifter i skjermbildet for klassenumre i norsk WebDewey: «Humord» og «Realfagstermer». Står man på teknikknummeret 620.191, vil man se at Realfagstermer ligger inne med «Jordbunnssystemer», og befinner man seg på kunsthistorienummeret 709.024, vil man legge merke til at Humord opererer med begrepet «Ungrenessanse» og synonymet «Tidligrenessanse». Det vi ser, er begynnelsen på mapping av to nye emnevokabularer i WebDewey.

Mapping vil si å etablere relasjoner mellom begreper i to ulike vokabularer. Å mappe er som å lage koblinger mellom ulike kart over kunnskapsuniverset. Prosjektet Mapping mot norsk WebDewey har som mål å mappe universitetenes emnevokabularer Humord og Realfagstermer (kalt kildevokabularer) mot norsk WebDewey (målvokabular). For prosjektet vårt er WebDewey et sentralt verktøy i arbeidet. Samtidig tilfører mappingene nye kvaliteter til norsk WebDewey – vi ser at verktøyet vokser både i omfang og brukspotensiale.

Humord er en tesaurus som dekker humaniora og samfunnsvitenskap, mens Realfagstermer er et emneordsvokabular som i hovedsak dekker naturvitenskap, matematikk og informatikk. I mappingarbeidet kobles hver av de omkring 33000 begrepene (og medfølgende synonymer) i disse vokabularene til én eller flere deweyklasser. Siden emnene i våre vokabularer kan befinne seg på flere faglige plasseringer i Deweys desimalklassifikasjon, har vi mange tilfeller av at ett begrep fra Humord eller Realfagstermer får flere mappinger mot norsk WebDewey.

Mappingprosjektet resulterer i en felles verbal inngang til de involverte vokabularene via norsk WebDewey. Dette legger grunnlaget for sluttbrukertjenester med mulighet for søk på tvers av samlinger og språk, samt muligheter for å orientere seg i emnebaserte metadata før søk. Mappingene vil også være en hjelp for bibliotekpersonalet i valg av emneord og klassifikasjon. Takket være at DDC23 nå foreligger i sin helhet på norsk, fungerer deweyklassene som et språkuavhengig koblingspunkt. Norsk WebDewey er som «navet i et hjul» som flere vokabularer mappes mot. Biblioteksentralens BS-emner på bokmål og nynorsk har i tiår vært knyttet opp mot deweyklasser, og ligger allerede mappet i WebDewey med kobling til både DDC23-numre og DDK5. De tilmappede vokabularene utfyller hverandre og beriker WebDewey med nye søkeinnganger, både i form av nye begreper og med synonymer til begreper som allerede finnes i WebDewey. Spesielt for vårt prosjekt, er at vi etablerer relasjoner mellom kilde- og målbegrepene, i tråd med ISO-standarden for mapping (25964-2), på denne måten:

Når vi mapper Humord og Realfagstermer til WebDewey, får hver mapping en relasjon. Vi bruker fire ulike relasjonstyper: Eksakt ekvivalens (som kodes med =EQ i WebDewey), tilnærmet ekvivalens (~EQ), overordnet mapping (BM) og relatert mapping (RM). Mange bibliotekarer vil kjenne igjen den klare parallellen til tesaurusrelasjoner – med ekvivalens brukt i forbindelse med synonymi/nærsynonymi, hierarkiske relasjoner ved over-/underordning og assosiativ relasjon for andre typer relaterte begreper. Forskjellen er at i en tesaurus etablerer man relasjoner mellom begreper innen ett vokabular, mens man ved mapping kobler sammen begreper mellom ulike vokabularer.

Å mappe involverer en tredelt prosess: Først må vi avklare betydningen av det kildebegrepet som skal mappes, for eksempel begrepet «Jordreformer» i Humord. Deretter må vi identifisere hvilke deweyklasser som representerer dette begrepet, mao. vi må finne en eller flere plasseringer for målbegrepet i WebDewey. For «Jordreformer» er for eksempel 333.31 «Landreformer» og 346.044 «Offentlig regulering og kontroll med fast eiendom» aktuelle. Til sist vurderer vi hvilken relasjonstype som best beskriver forholdet mellom kildebegrepet og målbegrepet. I dette eksemplet har vi laget to mappinger: «Jordreformer» =EQ 333.31 og «Jordreformer» RM 346.044.

Mappingarbeidet er en datastøttet intellektuell prosess. Til hjelp i arbeidet bruker vi et mappingverktøy som gir automatiske forslag til deweyklasser. Det innebærer at hele WebDewey er lastet inn i dataverktøyet vi bruker. Siden våre vokabularer inneholder mange begreper som ikke finnes verbalt i WebDewey, medfører mappingarbeidet mange kunnskapsorganisatoriske nøtter som må løses intellektuelt og med manuell søking i WebDewey, pluss UBOs emneregister til Dewey, BS-emner, de bibliografiske postene, leksika og en rekke andre kilder. I bruken av WebDewey har vi stor glede av skillet mellom registersøk og fritekstsøk. Dette har å gjøre med at vi for begreper med termsammenfall mellom våre vokabularer og WebDewey hovedsakelig mapper mot numre som har registeroppslag. Her fokuserer vi på valg av mappingrelasjon. For begreper som ikke finnes i WebDewey fra før, ligger den største utfordringen i å finne aktuelle deweyklasser å mappe mot. Ideelt sett bør en som mapper besitte både deweykompetanse, kjennskap til kildevokabularene, kunne mappingmetodikk og ha fagkompetanse innen de kildebegrepene man mapper. I prosjektet vårt er denne kompetansen fordelt på bibliotekarer og fagreferenter som utfyller hverandre på de ulike ferdighetene. Personalressurser til mappingarbeidet hentes inn i prosjektet ved fristilling av egne ansatte, og siden august også ved nyansettelser.

I WebDewey vises begrepene som er mappet fra Humord og Realfagstermer på den enkelte deweyklasse, etterfulgt av en mappingrelasjon. Synonymene til de mappede Humord-/Realfagsbegrepene skal være både synlige og søkbare: Når man holder musepekeren over begrepet, får man fram eventuelle synonymer. Disse blir om kort tid søkbare. Ved peking på forkortelsen for mappingrelasjonen, får man opp en forklaring – som for eksempel for ~EQ at «begrepet har stort overlapp med deweyklassen». Eksempler på synonymer fra våre vokabularer som gir nye verbale innganger til eksisterende begreper i WebDewey, er «Domslogikk» (for «Utsagnslogikk»), «Uegennytte» (for «Altruisme»), «Kulturvern» (for «Kulturminnevern») og «Kjernefysiske våpen» (for «Kjernevåpen»), som ellers ville gitt null treff i WebDewey. I Realfagstermer ligger engelsk og/eller latinsk form som synonym på en del begreper, i tillegg til at hele vokabularet er søkbart i begge målformer på norsk – alt sammen nyttige bidrag som verbale innganger til WebDewey. Med tanke på engelske synonymer til begreper i Realfagstermer, har vi god hjelp av at registertermene fra den amerikanske WebDewey-originalen er søkbare i norsk WebDewey. Library of Congress Subject Headings (LCSH) som er mappet til amerikansk WebDewey ligger nå også i den norske utgaven, og det hjelper oss ytterligere. Ved mapping av Realfagtermers «Koronamasseutbrudd», ga søk på engelsk synonym fra vårt vokabular tilslag på LCSH «Coronal mass ejections», noe som førte til en related mapping (RM) til 523.75 «Kromosfære og korona».

I tillegg til synonymer til eksisterende begreper, tilfører mappingarbeidet nye begreper til norsk WebDewey. Dette kommer bl.a. av at kildevokabularene våre er mer spesifikke i sine spesialfelter enn WebDewey. Vi får da typisk overordnet mapping (BM) fra kildebegrepet til et overordnet begrep i WebDewey – for eksempel Realfagstermers «Prinsipalkomponentanalyse» BM 519.5354 «Faktoranalyse», eller Humords «Fraseologi» BM 415 «Standardspråkets grammatikk». Nye begreper som tilføres fra kildevokabularene er dog ikke nødvendigvis fagspråk med høy spesifisitet – de kan også være begreper fra allmenn språkbruk som bare ikke finnes i WebDewey fra før – for eksempel «Tidsmaskiner», «Kvinnearbeid» og «Boformer».

Vi mapper til bygde klassenumre når et Humord eller en Realfagsterm ellers ikke ville latt seg uttrykke i WebDewey. Prosjektet bruker nummerbyggingsmodulen i WebDewey for å bygge numrene som vi deretter mapper til. Nummerbygging i forbindelse med mapping er i tråd med Universitetsbibliotekets praksis om å indeksere så dypt som mulig. Eksempler på numre som er bygget i forbindelse med mappingarbeidet og siden etablert som nasjonale numre, er «Krystallografer» RM 305.9548, «Fukushimaulykken 2011» BM 363.1799095211 og «Okhotskhavet» =EQ 910.916453. Til nå har vi bygget spesielt mange numre innen historie, geografi og for etniske og nasjonale grupper. Disse vil bli synlige i WebDewey etter hvert som de godkjennes som nasjonale numre. Våre kildebegreper blir ofte brukt som utgangspunkt for registerinnførsler for bygde numre i WebDewey. For våre overordnede mappinger (BM) til bygde numre, vil WebDeweys registerinnførsel ofte være hierarkiske overordnet vårt kildebegrep – for eksempel «Tistedalsmål» BM 439.8279482321, der WebDewey-redaksjonen har opprettet «Dialekter–norsk språk–Halden (Østfold)». Når vi mapper med eksakt ekvivalens (=EQ) til et nummer som vi selv bygger, blir som regel vårt kildebegrep brukt som registerinnførsel når nummeret godkjennes av WebDewey-redaksjonen – som da vi mappet «Anmeldelser» til 808.066028, og det nasjonale nummeret fikk registerinnførselen «Anmeldelser–skriveteknikker».

Oppsummert kan vi si at mapping av Humord og Realfagstermer fører til en berikelse av norsk WebDewey på flere måter, ikke minst ved tilførsel av nye begreper og synonymer til begreper som allerede finnes. Mappingarbeidet medfører bygging av nye numre med klassebetegnelser og registertermer. Mappingen viser begrepets relasjon til klassen, i motsetning til en registerinnførsel, som ikke viser forholdet mellom oppslagstermen og klassen. Tilførselen av terminologi og nye klassenumre kommer både sluttbrukere og bibliotekpersonale til del. Brukerne får flere søkeinnganger til WebDewey, og indekserere vil få økt støtte for valg av klassenummer og emneord. Mappingarbeidet fører til flere nyttige bi-effekter. Nærkontakten med de tre involverte vokabularene fører til at vi oppdager feil og inkonsistenser, som vi retter opp underveis. Mappede vokabularer i WebDewey kan på sikt brukes til forbedring og videreutvikling av klassifikasjonssystemet, gjennom analyser av mappingrelasjoner og tilmappede begreper fra kildevokabularene. Et eksempel på dette er at opphopninger av overordnede mappinger (BM) til en deweyklasse vil være en indikasjon på steder der det er behov for videreutbygging av deweytabellen.

Tilfanget av mappede begreper fra Humord og Realfagstermer øker stadig, og med det potensialet for sluttbrukere og bibliotekpersonale. Vi hører gjerne fra WebDewey-brukere som finner mappingene våre nyttige. Dersom det er bibliotekmiljøer som er interessert i å gå i gang med mapping av egne vokabularer til WebDewey, deler vi gjerne av våre erfaringer med mapping.

Mappingprosjektet er nå i sitt andre av to år, og er støttet av Nasjonalbiblioteket. Prosjektet drives av Universitetsbiblioteket ved UiO i samarbeid med redaksjonen for norsk WebDewey. Prosjektleder er Unni Knutsen (unni.knutsen@ub.uio.no). Mer informasjon om mappingprosjektet finnes på våre nettsider. Et greit sted å starte kan være å ta en titt på brosjyren og plakaten som ble presentert på Bibliotekmøtet i Tromsø i mars – lenke til begge deler finnes nederst på prosjektsiden vår: http://www.uio.no/for-ansatte/enhetssider/ub/prosjekter/mapping-mot-webdewey/

Bokmerk permalenken.

2 kommentarer til Norsk WebDewey – et verktøy i vekst

  1. Marit Kristine Ådland sier:

    Interessant! Eg har eit spørsmål: I WebDewey er Biblioteksentralen sine emneord mappa som to sjølvstendige vokabular: nynorsk og bokmål. Ved mapping frå Realfagtermer ser det for meg ut til at dei nynorske termane berre er blitt til synonym “under” bokmålstermar. Når eg klikkar inn på “Jordbunnssystemer”, finn eg “Jordbotnsystem” merka med 450, det same som synonym på bokmål. Kvifor er det slik? Ville ikkje ei mapping som er på same måte som BS-termane gje betre søk etter nynorske termar totalt i WebDewey?

  2. Mari Lundevall og Dan Michael O. Heggø sier:

    Takk for morsomt spørsmål! Jo, det ville gi et bedre søk etter nynorske termer om vi leverte data på samme format som BS. Vi har jobbet med datamodellen i flere runder, men ikke med utseendet i WebDewey som perspektiv, det er jo nytt for oss også at vi får en så flott visning der.

    Realfagstermer er et flerspråklig vokabular, men det finnes ikke støtte for flerspråklighet i MARC. I valget mellom å eksportere til flere parallelle MARC-vokabularer, og å ha bare ett, har vi foreløpig landet på det siste. Ulempen med det er som du sier – at alle andre språkformer enn bokmål, enten det er engelsk, latin (vitenskapelig navn) eller nynorsk, fremstår som ikke-foretrukne termer. 450-feltene vil snart bli søkbare, så akkurat søkbarheten ordner seg, men det er likevel teit at det bare er bokmålstermene som presenteres i grensesnittet. Aller helst skulle vi selvfølgelig hatt det som i vårt eget emnesøk, der foretrukket term er basert på hvilken språkform brukeren velger: https://app.uio.no/ub/emnesok/realfagstermer/

Legg igjen et svar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

Du kan bruke disse HTML-kodene og -egenskapene: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>