Hvordan katalogisere med dewey for at det skal kunne brukes

Med ferdigstillelsen av norsk webDewey får vi en omfattende database med strukturert, norskspråklig informasjon knyttet til hvert deweynummer. Dette kaller vi for deweydata, og et av hovedmålene våre er at deweydata skal benyttes i sluttbrukersystemer.

En av de enkleste måtene å gjøre dette på, er ved å utnytte seg av koblingen mellom ord (i klassebetegnelser, registertermer og tilmappede emneord) og numre. Dette er metoden som er brukt i det tyske søkesystemet Melvil Search, der sluttbrukere kan søke med ord og få adgang til klassifikasjonsnumre og tilhørende klassifiserte dokumenter.

Sammen med det tyske nasjonalbiblioteket og Kungliga biblioteket i Sverige, er vi nå i planleggingsfasen med å lage et nytt søkesystem (som vil bli tilgjengelig for alle) basert på Melvil Search: WebDeweySøk. Vi kommer tilbake med mer informasjon om WebDeweySøk etterhvert.

En viktig forutsetning for at deweydata kan bli utnyttet i et sluttbrukersystem er at den er registrert på riktig måte. I tillegg til selve klassifikasjonsnummeret, er det 3 viktige elementer som alltid bør med i katalogiseringen av et deweynummer, uavhengig av hvilket format som brukes i katalogiseringsarbeidet. Jeg legger til et fjerde element som strengt tatt ikke er nødvendig for å tolke nummeret, men som kan være nyttig å ha med.

  1. Utgavetype
  2. Utgavenummer
  3. Språk
  4. Institusjonen som klassifiserer

Hvorfor holder det ikke med å bare registrere nummeret? La oss si at vi har en bok som handler om medisinske aspekter ved skarlagensfeber:

Scarlet Fever: A Medical Dictionary, Bibliography, and Annotated Research Guide to Internet References / ICON Health Publications (2004)

 

Vi bruker deweyutgaven vi har for hånda og klassifiserer den i 616.91. Vi registrerer dette nummeret i den bibliografiske posten for boka (eller lager en fin RDF-trippel der nummeret blir knyttet til boka, eller …). Er det ikke nok informasjon i selve nummeret til å kunne utnyttes i søkesystemer?

1. Utgavetype

Det finnes per i dag 3 forskjellige deweyutgavetyper: forkortede utgaver, fullstendige utgaver, og midt-i-mellom utgaver (delvis forkortet, delvis fullstendig). DDK5 er et eksempel på en midt-i-mellom utgave.

Dersom vi ikke vet hvilken type utgave vi har med å gjøre, er det vanskelig å vite nøyaktig hvilke emner som dekkes av 616.91.

I DDK5, finner vi blant andre emnene meslinger, røde hunder og skarlagensfeber i 616.91.

I DDC21 (som DDK5 baserer seg på, og som er en fullstendig utgave), må vi nedover i hierarkiet til henholdsvis 616.915, 616.916 og 616.917 for å finne ovennevnte emner. 616.91 er her et overordnet nummer beregnet til oversiktsverker om sykdommer med utslett.

Hva betyr så dette? Et søkesystem basert på data fra DDC21 vil ikke uten videre kunne finne dokumenter klassifisert etter DDK5. Det vil si: et søk etter skarlagensfeber vil kun gi treff på dokumenter som er klassifisert i 616.917. Vi vil dermed ikke få treff på Scarlet Fever, som vi nettopp klassifiserte.

Men, hvis vi registrerer utgavetype sammen med deweynummeret, vil et søkesystem kunne klare å skille mellom dokumenter som er klassifisert etter fullstendig utgave, og de som er klassifisert etter forkortet eller midt-i-mellom utgave. Dermed vil søket gi treff på dokumenter som er klassifisert i 616.917 med DDC21 OG de som er klassifisert i 616.91 med DDK5.

2. Utgavenummer

Den observante leseren vil legge merke til at det finnes ulike numre i den ovennevnte omtalen av deweyutgaver. DDK5 er altså den femte midt-i-mellom utgave av Deweys desimalklassifikasjon. DDK4 og de tre Arnesen-utgavene utgjør de andre numrene i denne gruppen.

DDC21 er den 21. fullstendige utgaven av Dewey. Det finnes totalt 23 forskjellige utgaver av Dewey, og de finnes i mange forskjellige språk. (Når vi begynner å bruke norsk webDewey, tar vi i bruk den norskspråklige 23. utgave av den fullstendige Dewey).

Det finnes 15 utgaver av den forkortede Dewey, oversatt til ca 10 språk.

Med hver ny utgave, kommer det endringer i tabellene som (hovedsakelig) reflekterer endringer i verdensbildet vårt. Noen emner blir flyttet til nye fagområder, nye emner finner plass i eksisterende eller nye numre, og emner som ikke er så relevante lenger blir opphørt. Det hender også at man endrer på inndelingsprinsippene innen enkelte fag.

Et eksempel av sistnevnte finner vi nettopp i forskjellen mellom plasseringen av skarlagensfeber i DDC21 og DDC22. I DDC21 skilte man mellom sykdommer med utslett (616.91) og bakterie- og virussykdommer (616.92). De fleste sykdommer med utslett skyldes imidlertid enten bakterier eller virus. I arbeidet med DDC22, ble det bestemt at man heller skulle skille mellom bakteriesykdommer (616.92) og virussykdommer (616.91). Sykdommer med utslett som skyldes virus beholdt sine plasser, mens de som skyldes bakterier ble flyttet til underinndelinger av 616.92. Skarlagensfeber skyldes streptokokker, og fikk dermed et nytt nummer i DDC22: 616.92987.

Klassifikasjonsnumre knyttet til skarlagensfeber:

DDK4: 616.91
DDK5: 616.91
DDK21 (fullstendig): 616.917
DDC14 (forkortet): 616.9
DDC22 (fullstendig): 616.92987

[Et par ord her om webDewey kontra trykte utgaver av Dewey:

Som nevnt er norsk webDewey en oversettelse av DDC23. Det som skiller webDewey og trykte utgaver av Dewey er at mens de trykte utgavene oppdateres fra utgave til utgave, blir webutgaven kontinuerlig oppdatert. Dette innebærer at et emne kan ha to forskjellige klassifikasjonsnumre i samme utgave. Det vil på sikt være nødvendig å registrere et eller annet form for tidsstempel i tillegg til utgavenummeret, men det er per i dag ikke avklart hvordan dette best skal gjøres.  ]

3. Språk

À propos kontinuerlig oppdatering: På sikt kan det oppstå et visst etterslep i oppdateringene mellom de ulike språkutgaver av webDewey. Da vil det være helt nødvendig å vite hvilken oversettelse som ble brukt i klassifiseringen. Dette gjelder også for eventuelle avvik (som helst ikke skal forekomme, men som likevel gjør det!) i oversettelsene fra originalen og fra hverandre.

4. Institusjonen som klassifiserer

Det er flere grunner til hvorfor man bør registrere hvilken institusjon som klassifiserer. For det første, vil det muliggjøre at man på sikt lager løsninger som rangerer treff etter hvilke biblioteker har klassifisert dokumentene. Klassifikasjon er ofte sterkt knyttet til samlinger, og det kan være greit å få muligheten til å avgrense trefflister til de dokumentene som er blitt klassifisert av ens eget bibliotek.

Videre kan det nevnes at noen bibliotek velger å bruke tillatte løsninger i tabellen, mens andre lar være. Med institusjonskoder vil man kunne sette likhetstegn mellom et nummer fra en tillatt løsning og dets tilsvarende standardnummer fra tabellen.

Og til slutt (puh!): Noen eksempler på katalogiseringen av dewey

Dewey i MARC21 : felt 082

1. indikator => utgavetype (fullstendig = 0, forkortet = 1, annen (midt-i-mellom) = 7)
2. indikator => er det LoC som har klassifisert, eller ikke (ikke = 4)
$a => deweynummer
$2 => deweyutgavenummer + språk
$q => institusjonen som klassifiserer

082 74$a616.91$25/nor$qNO-OsNB => 616.91 fra norsk DDK5 klassifisert av NB
082 04$a616.917$221$qNO-BeU => 616.917 fra engelsk DDC21 klassifisert av UBB
082 74$a616.92987$223/nor$qNO-OsBA => 616.92987 fra norsk DDC23 klassifisert av Biblioteksentralen

Dewey i NORMARC : felt 082

1. indikator => utgavetype (fullstendig = 0, forkortet = 1, DDK = 3, Arnesen = 4)
2. indikator => klassifikasjonskilde (institusjonen som klassifiserer) (NB = 0, BibSent = 1, annen = 2)
$a => deweynummer
$2 => deweyutgavenummer
(OBS: her får man ikke frem språket eller andre institusjoner enn NB og BibSent)

082 30$a616.91$25 => 616.91 fra DDK5 klassifisert av NB
082 01$a616.917$221 => 616.917 fra DDC21 klassifisert av Biblioteksentralen

Dewey som en URI (til potensiell bruk i RDF)

[hvem publiserer deweydataen/tabellinformasjon/deweynummer/utgavetype og -nummer/tidsstempel/dette er en URI som beskriver nummeret, ikke selve nummeret/språk]

http://nbfiktiv.info/class/616.92987/F23/2012/03/about.no

(OBS: Eksempelet over er basert på OCLCs modellering av deweydata (dewey.info) og viser én mulighet for hvordan man kunne publisert norsk deweydata med bruk av URI’er. Her får man blant annet frem nummeret, utgavetype og -nummer, samt et tidsstempel. Det vil antakeligvis være lurest å registrere informasjon om hvem som klassifiserer utenfor URI’en!)

Bokmerk permalenken.

13 kommentarer til Hvordan katalogisere med dewey for at det skal kunne brukes

  1. Tarje Lavik sier:

    Hva med at klassifiserende inst. bruker sitt eget domene?

    http://data.uib.no/class/616.917/F23/2012/03/about.no owl:sameAs
    http://nbfiktiv.info/class/616.917/F23/2012/03/about.no

    Noe lignende det BBC gjør med IDer fra MusicBrainz? Bare en idé.

  2. elise sier:

    Hei, Tarje!

    Jeg tror konsekvensen av det du foreslår er slik:

    verk : har klassifisering :deweyURI
    kontra
    verk : har klassifisering :dewey brukt av en bestemt institusjon-URI
    dewey brukt av en bestemt institusjon-URI : er den samme som : deweyURI

    Umiddelbart liker jeg den løsningen. Men jeg er litt usikker. For det første er det det her med lisenser. Det tyske nasjonalbiblioteket har forhandlet med OCLC og fått lisenser til å publisere deler av det tyskspråklige deweydata. Disse blir behandlet på en lignende måte som du nevner over, altså tyskdeweyURI (uten info om hvem som klassifiserer) owl:sameAs OCLCdeweyURI. Det er lisensbetinget hva mer de kan faktisk si om hvert nummer.

    Hvis vi ser på det baklengs: er det ikke litt farlig å åpne opp for at OCLCdeweyURI (eller tyskdeweyURI eller norskdeweyURI) er det samme som hver enkelt institusjons bruk av deweyURI? Jeg har en følelse av at det (i tillegg til å være et potensielt lisensproblem) er et eller annet filosofisk som ikke helt stemmer her.

    Tenker videre…

    • Oddrun Pauline Ohren sier:

      Slik jeg forstår det, vil Tarjes forslag føre til at hver institusjon får sin egen norskWebDewey-instans (institusjonsspesifikke URI-er for hvert klassenummer). Motivasjonen for noe slikt måtte da være at institusjonene ønsker å legge til eller endre noe av informasjonen som ligger i den autoriserte norske WebDewey, og lagre dette knyttet til sin lokale instans. For det første er det som Elise sier tvilsomt om dette blir lov i henhold til lisensen, og for det andre er det vel også i strid med samordnings- og hamoniseringstankegangen som faktisk ligger til grunn for WebDewey-prosjektet? For det tredje: blir det nå egentlig owl:sameAs hvis man gjør større tilpasninger til eget bruk? Se f.eks. http://ceur-ws.org/Vol-628/ldow2010_paper09.pdf om dette.
      Hvis institusjonene likevel må/vil bruke norsk webDewey som den (til enhver tid) er, må det eneste rette være å operere med ett sett norskWebDewey-URIer, som forvaltes av organisasjonen som skal ta hånd om norskWebDewey som sådan.

  3. Linda sier:

    Så vi som bruker NORMARC får altså ikke registrert språk? Eller hvor skulle vi legge det evt?

  4. elise sier:

    Hei, Linda

    Veldig godt spørsmål.
    Så vidt jeg kan se, finnes det per i dag ingen mulighet for å registrere språk i Deweyfeltet i NORMARC. Dette er ingen krise ennå, da de fleste som registrerer i NORMARC klassifiserer etter DDK5, som jo bare finnes i et språk. Men på sikt, når alle klassifiserer med den norskspråklige DDC23 (som også finnes på minst 3 andre språk), må man få muligheten til å registrere språk også i NORMARC. Vi i webDewey-redaksjonen kan sende en henvendelse til den norske katalogkomiteen for å belyse dem om problemet.

  5. elise sier:

    Ps:

    Det trenger forsåvidt ikke være mer komplisert enn at NORMARC tillater samme løsning som MARC 21– altså en tilføyelse av språkinfo etter utgavenummer.

  6. Tarje Lavik sier:

    Vil alle nivå av (norsk) webdewey bli tilgjengelig via SPARQL endpoint med en fornuftig datalisens, forresten?
    Webdewey i “next-gen” Bibsys, uttrykt i MARC21? Kan ikke vente ;-) .

    Hva med:
    http://uib.nbfiktiv.info/class/616.917/F23/2012/03/about.no owl:sameAs
    http://nbfiktiv.info/class/616.917/F23/2012/03/about.no

    Da er det NB/OCLC som kontrollere domenet og relasjonen mellom URI’ene.

    • elise sier:

      Veldig godt spørsmål! Det tyske nasjonalbiblioteket har tilgjengeliggjort alle nivåer av tyskspråklig dewey. Jeg regner med at vi kan få til det samme, dersom vi bestemmer oss for at det er den retningen vi skal ta. ;-)

  7. Øyvind Sæther sier:

    Får hvert bibliotek sin klassifikasjonskildekode eller skal alle vi andre bruke “annen=2″

    • Ingebjørg Rype sier:

      Hei,
      Det stemmer at i dagens NORMARC er det bare mulig å bruke “annen=2″. Katalogkomiteen kan imdidlertid ta inn felter fra MARC 21 etter behov. Det betyr at hvis det er behov for å ta inn delfeltet for klassifkasjonskilde ($q), er det mulig. Antakeligvis vil det være et behov for det, det vil alltid være dokumenter man må klassifisere selv, f.eks. lokallitteratur.

  8. Pål H. Bakka sier:

    Og jeg som trodde at norsk WebDewey ville innebære en forenkling …

    • elise sier:

      Hehe.
      Måtene å registrere klassifikasjonsdata beskrevet over gjelder for alle deweynumre, uansett om de kommer fra trykte eller webutgaver. Tidligere har man ikke gjort noe med deweydata fra bibliografiske poster annet enn å angi hylleoppsett og muliggjøre søk med numre. Med norsk webDewey får vi endelig muligheten til å la sluttbrukere benytte seg av informasjonen som hvert nummer bærer med seg: ord knyttet til nummeret, hierarkisk informasjon, informasjon om nummerets historikk, informasjon om komponenter i sammensatte numre…
      Men det forutsetter at deweynumrene i de bibliografiske postene er entydige– noe de ikke er så lenge de mangler info om utgavetype, -nummer og språk.
      (Kanskje denne typen informasjon kan automatiseres av systemsleverandørene våre?)
      Ellers har du helt rett– norsk webDewey kommer til å innebære en stor forenkling av selve klassifiseringen av dokumenter. :-)

  9. Jag kan berätta hur vi gör i Sverige. Vi använder oss av andraindikator 4 för andra institutioner än Library of Congress. Efter koden lägger vi delfält 2 med upplageuppgift följt av swe för den svenska upplagan. När vi hämtar poster och inte gör förändringar i deweynumret låter vi den befintliga upplageuppgiften ligga kvar. Vi använder inte delfält q, utan försöker enas om ett gemensamt deweynummer för svenska bibliotek. Det går bra för det mesta, men blir förstås problematiskt ibland.
    Deweynummer gjort av svenskt bibliotek:
    082 04$a616.92987$22/swe
    Deweynummer i amerikansk post, gjord av Library of Congress:
    082 00$a616.92987$22
    Här finns de svenska anvisningarna för kodning av deweynummer: http://www.kb.se/katalogisering/Klassifikation/DDK/DDK-praxis/

Legg igjen et svar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *

*

Du kan bruke disse HTML-kodene og -egenskapene: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>