Seminar om mapping til Dewey – en oppsummering

Gjesteblogger: Asbjørn Risan (NKKI/BIBSYS)

11. juni var ca 65 bibliotekarer samlet ved Høgskolen i Oslo og Akershus for å høre om mapping av emneordssystemer/vokabularer til Dewey. Seminaret ble arrangert av Nasjonalbiblioteket, i samarbeid med HiOA, og med innspill fra NKKI.
Hensikten med seminaret var tredelt:

  • Forstå hva mapping er og hvilke gevinster/fallgruver det er ved å mappe ulike norske vokabularer til Dewey
  • Få en praktisk forståelse av mapping
  • Identifisere aktuelle emneordssystemer/vokabularer og begynne å stake ut en kurs for den videre organiseringen av arbeidet

Hva er poenget?

Første bolk hadde tittelen Hva er mapping og hva er poenget?. Elise Conradi, prosjektleder for WebDewey, og Ingebjørg Rype, Nasjonalbiblioteket, innledet med å definere mapping som forholdet mellom et begrep i ett vokabular (kildevokabularet) (enten et emneordssystem eller et klassifikasjonssystem) og et eller flere begrep i et annet vokabular (målvokabularet).

Hensikten med mappingen ble beskrevet som å konvertere og supplere målvokabularet, som i denne konteksten er Dewey. En slik mapping kan være et bidrag inn i indekseringsprosessen, i søkeprosessen eller begge.

Ifølge Rype er hovedhensikten å gi flere innganger til et emne for indekserere og sluttbrukere. Det er flere fordeler med dette. De største overordnede fordelene med Dewey som målvokabular er at Dewey er internasjonalt og språkuavhengig.
For indeksererne vil en mapping bidra til:

  • Hjelp til klassifikasjon – flere termer å søke på
  • Hjelp til å sette emneord – flere termer å søke på
  • Lettere gjenbruk og utveksling av data – mapping mellom Dewey og emneord på flere språk

For sluttbrukere vil en mapping bidra til økte søkemuligheter ved at man ved en underliggende mapping kan:

  • søke med eget vokabular i samlinger med ulike vokabularer
  • søke med emneord også i samlinger som bare har Dewey.
  • søke med eget språk i poster på andre språk

Conradi sa også at det er viktig å identifisere hva slag relasjon det er mellom de to begrepene. Er det en identisk match (ekvivalens) eller er det en mer relatert kobling. Behovet for graderingen er noe avhengig av om mappingen skal benyttes i indekseringsprosessen eller i søkeprosessen. I indekseringsprosessen kan det være tilstrekkelig med en “tilknyttet klasse”-relasjon, mens det i søkeprosessen er viktig å differensiere mer. Conradi foreslo ISO-standard ISO/DIS 25964-2 (DRAFT) som utgangspunkt for angivelse av relasjon. Se en beskrivelse av relasjonene i utkastet til standarden her

Presentasjonene til Ingebjørg Rype og Elise Conradi finner du her

Utfordringer

Etter innledningen til Rype og Conradi problematiserte Ellen Hjortsæter fra Høgskolen i Oslo og Akershus, bibliotekarutdanningen, forholdet og ulikhetene mellom tesauri og DDC og hvilke utfordringer disse grunnleggende ulikhetene kan føre til.

Tradisjonelt sett er det en utfordring for brukerne å søke på tvers av vokabularer, da de ofte må vurdere alternative søkeuttrykk. Det ville vært ideelt om en bruker kan søke og gjenfinne informasjon som er klassifisert i DDC ved bruk av eget uttrykk, og som gir et resultat som er akseptabelt med tanke på fullstendighet og presisjon.

Historisk sett har DDC vært et system for å stille opp dokumenter. Dokumenter som omhandlet det samme skulle stå samlet og dokumenter med relatert tematikk skulle stå i nærheten av hverandre. Det var en inndeling etter fag og ikke etter emne, og dokumenter om et emne ble spredt rundt i systemet. Registeret er oversettelsesmekanismen fra term til symbol/klassenummer som samler de emner som er spredt i systemet.

Tesauri har en annen målsetning enn DDC. Tesauri skal bidra til gjenfinningen, mens DDC skulle organisere fysisk. Tesauri dekker som regel ikke hele kunnskapsuniverset, men heller smalere emneområder.

Disse ulikhetene fører til noen utfordringer:

  • Ikke alltid eksakt match
  • Identiske termer kan ha ulik betydning
  • Et språk kan mangle et uttrykk for begrepet i det andre
  • Dekker ikke de samme emneområdene
  • Ulik faglig synsvinkel/kontekst
  • Ulik grad og dybde med tanke på spesifisitet
  • Ulik syntaks
  • Ulik struktur
  • Utfordringer knyttet til oppdatering og revisjon.

Ellen Hjortsæters presentasjon finner du her

Erfaringer fra Sverige

I neste bolk fikk vi presentert erfaringer fra Sverige. Mange svenske bibliotek har gått over til å benytte Dewey etter å ha brukt sitt eget klassifikasjonssystem, SAB, i mange år. For å lette overgangen og for å bidra i gjenfinningen har de mappet SAB til Dewey. Dette har blant annet resultert i at de maskinelt kan sette Dewey-nummer på poster som ikke har dette, basert på SAB-klassifikasjon. Dette fungerer stort sett bra, men med noen utfordringer.

Svenskene har også mappet:

  • svenske navn med engelske navn
  • SÄO (svenske emneord) til LCSH
  • SÄO til Dewey
  • deler av det svenske autoritetsregisteret for navn/korporasjoner til Dewey

Presentasjonene til Pia Leth og Ingrid Berg fra Kungliga biblioteket finner du her

Eksisterende prosjekter

Etter lunsj fikk vi presentert ulike eksisterende initiativ som allerede er relatert til mapping.

Asgeir Rekkavik fra Deichmanske bibliotek, og Anette Munthe fra Universitetsbiblioteket i Oslo presenterte hvordan to emneportaler, Detektor og SMIL, som er basert på verktøyet Sublima bruker mapping for å gi brukerne bedre tjenester.

SMIL (Skandinavisk medisinsk informasjon for legfolk) er en nettportal med medisinske nettressurser. Tilknyttet hver ressurs er det mappet en MeSH-id. Denne MeSH-id’en er internasjonal og språkuavhengig. Dette innebærer at når brukeren har funnet en relevant nettressurs så kan systemet basert på MeSH-id’en tilby videresøk i andre medisinske databaser som MedLine+, SweMed+ og PubMed. For eksempel kan brukeren søke på Hjerte- og karsykdommer og få tilbud om å søke videre på dette i engelskspråklige databaser uten å kjenne til den engelskspråklige betegnelsen.

Detektor, som er rettet mot skoleelever, benytter noen av de samme mulighetene men benytter Dewey som mapping. Dette innebærer at de kan hente inn relevante artikler fra Norart. Detektor har også knyttet seg opp mot Wikipedia/DBpedia og kan hente inn eksterne referanser fra disse kildene. Fordelen med dette er at det andre som vedlikeholder og holder informasjonen oppdatert.

Kjersti Feiring Myrtrøen fra Biblioteksentralen presenterte Biblioteksentralens emneord.

Biblioteksentralen har koblet Dewey-nummer opp mot sine emnestrenger og de har nå ca 40.000 emnestrenger som er “gryteklare” for å kobles inn i WebDewey. Eksempler på tjenester som er utviklet på bakgrunn av dette er Emneord i skjønnlitteratur og BS Globus. Biblioteksentralen er i dialog med Nasjonalbiblioteket om å koble emneordene med WebDewey, men det er foreløpig ikke helt avklart.

Myrtrøens presentasjon finner du her

Sigrun Ask fra Universitetsbiblioteket i Bergen presenterte lokale emneregisteret med undertittelen: Deres innhold, funksjon og utnyttelse i dag. Det finnes fire store lokale emneregistre i dag. Disse eies av henholdsvis UiO, UiB, UiA og BOB. Emneregistrene er tilpasset deweynumre i oppbygging og struktur. Fagekspertise har “mappet” termer til dewey manuelt (og intellektuelt) i over 30 år. De inneholder mange bygde numre og termer knyttet til disse og vil være en potensiell kilde til å få et stort omfang av bygde nummere inn i WebDewey.

Asks presentasjon finner du her

Andre prosjekter som ble presentert var:

  • Agrovoc som linked data ved Lisbeth Eriksen ved Universitetet for miljø- og biovitenskap
  • Rydding og reorganisering av emneordsarbeidet og overgang til Dewey ved Universitetsbiblioteket i Oslo ved Mari Lundvall, UiO
  • Sammenslåing/mapping av Tekord fra NTNU Universitetsbiblioteket og Realfagstermer fra UBO ved Viola Kuldevere, UiO

De to sistnevnte prosjekter finner du her

Oppsummering og veien videre

Etter presentasjonene var det klart for gruppediskusjoner og diskusjonspunktene var:

  • Hvilke potensielle problemer og/eller gevinster kan dere tenke dere ved en mapping av emnesystemer til Dewey?
  • Hvilke emneordsystemer ønsker vi mappet til Dewey?
  • Tidsperspektiv/hvordan kan et slikt arbeid organiseres og støttes?

Noen av de utfordringene som ble identifisert var:

  • Mapping tar tid og det kan være en utfordring å bli enige
  • Lite ekvivalensrelasjoner (direkte match)
  • Det er forskjellige tilnærminger/innretning på vokabularene
  • Det blir mange Broad match-koblinger, dvs. kobling til en overordnet term/klasse
  • Potensielt mye opphopning på enkelte klasser
  • Vanskelig og tid-/ressurskrevende vedlikehold

Men, potensielt kan en mapping gjøre det lettere å søke og gi bedre treff, og også legge til rette for videresøk og andre uante muligheter.

Ønskede mappede emneordssystemer var:

  • BS Emneord. Biblioteksentralen er i dialog med Nasjonalbiblioteket, men foreløpig ingen avklaring.
  • MeSH. Her foregår det et mappearbeid internasjonalt, men det har stoppet litt opp. I og med at det er den internasjonale ID’en som mappes, vil vi kunne gjenbruke denne også i Norge. MeSH oversettes også til norsk (ferdig i 2013).
  • Emneordsliste for musikk. Nylig revidert. Konvertert til SKOS/RDF.
  • Samiske emneord. Samisk bibliografi har gode emneord som kan danne grunnlaget for en mapping. Det kan være aktuelt med et samarbeid med Sverige. Nasjonalbiblioteket var positivt innstilt. (Obs: det er ikke samiske emneord i samisk bibliografi).

Tidsperspektiv/organisering:

Oversettelsen av Dewey tar tid. Prosjektet var opprinnelig tenkt ferdig i løpet av 2012, men nå er planen forskjøvet til 2013. I løpet av høsten 2013 ser man for seg å begynne med opplæring og kursing.

Det er imidlertid bare å sette i gang å mappe. Det er DDC23 som oversettes. Nasjonalbiblioteket presiserte at det er dataeierne som har eierskap til mappingen og dermed også ansvaret for vedlikehold. Det ble nevnt at det vil være mulig å søke Nasjonalbiblioteket om prosjektmidler til dette gjennom de vanlige kanalene. Frist for dette er 1. oktober 2012.

Nasjonalbiblioteket presiserte også at systemleverandørene må ta disse verktøyene i bruk og lage gode løsninger for sluttbrukerne, hvis ikke har satsningen begrenset verdi.

En forutsetning for at systemleverandørene skal kunne ta i bruk WebDewey og tilknyttede emneordssystemer er at de får en god maskin til maskin integrasjon med systemet, enten ved hjelp av API’er eller på andre måter. WebDewey-prosjektet er i dialog med OCLC om lisenser og jobber for at dette skal bli en realitet.

Bokmerk permalenken.

3 kommentarer til Seminar om mapping til Dewey – en oppsummering

  1. Tilbaketråkk: Seminar om mapping til Dewey – en oppsummering | Biblioteksfaglig | Scoop.it

  2. Tilbaketråkk: Seminar om mapping til Dewey – en oppsummering | Utbildning på nätet | Scoop.it

  3. Tilbaketråkk: Seminar om mapping til Dewey 11 juni 2012 i Oslo | Deweybloggen

Legg igjen et svar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

Du kan bruke disse HTML-kodene og -egenskapene: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>