Fag
Digital bevaring


Vi er inne i eit teknologisk paradigmeskifte med omsyn til produksjon og bevaring av informasjon.



Vi definerer det slik at originalen er den virtuelle samlinga av data som er definert som 0-ar og 1-arar, og som avhengig av korleis dei blir koda og dekoda, utgjer den informasjonen vi vil ta vare på. Autentisitet avheng av evna til å dekode informasjonen på eit sett som gjer at informasjonen framstår på same måte som den opphavleg gjorde.
Det er vanskelig å sikre at vi kan lese av alle formata i framtida. Framtidig teknologi og konverteringar kan gjere det uråd å framstille identiske uttrykk av eit innhald, og vi må da ha system som sikrar det opphavlege uttrykket.
Ved val av filformat for langtidsbevaring er det fleire element som spelar inn. Det er viktig å velje format med dei rette eigenskapane, til dømes at formatet er vidt utbreidd, at det ikkje er komprimert, eller at det er godt dokumentert.

Dokumentasjon
I eit bevaringsperspektiv er det avgjerande at vi har tilgang til mest mogleg komplett dokumentasjon av dei formata vi nyttar. Det er òg viktig å ha tilgang til verifikasjonsverkty for formatet.

Sjølvdokumenterande
Vi ønskjer at alle filene skal vere sjølvdokumenterande, dvs. innehalde metadata på eit visst nivå. Dette dreier seg om metadata av både deskriptiv, teknisk og administrativ karakter. Skal vi lykkast med bevaringsarbeidet, er det viktig at denne typen informasjon er tilgjengeleg.
Filhistorie er ein viktig faktor i bevaringssamanheng. At ei videofil er generert i til dømes dv-format og seinare konvertert til mpeg, er relevant for kvaliteten på vidare konvertering.

Eksternt avhengig
Mange filformat er i meir eller mindre grad avhengig av spesialisert maskinvare eller spesialiserte operativsystem. Ikkje minst gjeld dette format som inneheld ei form for interaksjon. For desse formata er det spesielt komplisert å vedlikehalde funksjonaliteten.
Men andre format er òg eksternt avhengige. Det gjeld vanlege dynamiske format som html, og pdf der denne funksjonaliteten blir brukt. Denne typen dynamiske format vil utan tvil krevje meir ressursar i ein bevaringssamanheng enn statiske format.

Atterhald om patent
At eit format er underlagt patentrestriksjonar står ikkje nødvendigvis i motsetnad til langtidsbevaring. Patent er for det første veldokumenterte. For det andre inneber det at eit format er patentert, ofte at formatet er kjent og utbreidd.

Interne tekniske avgrensingar
Kryptering er i motstrid med langtidsbevaring. Kryptering eller kopisperrrer gjer framtidig konvertering og vedlikehold av informasjonen umogleg eller i beste fall vanskeleg.

Format
Alle format har avgrensa levetid. Over tid må ein derfor vere førebudd på å konvertere digitale dokument til nye format for å vere i stand til å lese dokumenta. Utfordringa er å finne det riktige tidspunktet for konvertering, og å finne eit nytt format som gjer det mogleg å konvertere dokument utan å miste informasjon eller forandre på visninga av innhaldet.

Teknologi
I Nasjonalbiblioteket blir all informasjon lagra i disksystem med backup på en tape-robot. I praksis må dei digitale dokumenta migrerast til ny teknologi med 2–3 års mellomrom. Dette må gjennomførast så automatisk som mogleg for at vi skal kunne handtere så hyppig migrering av fleire titals terrabyte med data. Det betyr at dei digitale dokumenta må lagrast som datamaskinlesbare filer på eit on-line lagringsmedium.

Lagringsmedium
Dersom ein vel å lagre data på off-line lagringsmedium (typisk magnetisk tape, CD-RW eller DVD-RW), vil måten lagringsmediet blir oppbevart på påverke levetida til den digitale informasjonen. Informasjonen bør sjekkast jamnleg, og det bør alltid lagrast minimum to fysisk skilde kopiar av den digitale informasjonen.

Sikkerheit
Det er viktig å beskytte digitale dokument mot hacking og uautorisert tilgang. Hacking kan i verste fall føre til at historia blir endra, om eit unikt digitalt dokument blir endra utan at det blir registrert. For å sjekke at digitale dokument held seg uendra, kan ein bruke algoritmar for å rekne ut ein sjekksum for heile dokumentet. Denne summen kan seinare samanhaldast med sjekksummen for det lagra dokumentet. Om summane avvik, har det skjedd endringar i dokumentet, og ein ny kopi må hentast frå backup.



Nasjonalbiblioteket | postboks 2674 Solli, 0203 Oslo | tlf.: 810 01 300 | postmottak
 
Nasjonalbiblioteket ligg ikkje langt frå sentrum av byen.