Oddano: 26. 2. 2010 - Sprejeto: 19. 3. 2010
Pregledni znanstveni clanek
UDK 02:004:005.921.1"746"
Izvlecek
Prispevek je pregled teorije in prakse na podrocju trajnega ohranjanja digitalnih virov. V njem so prikazani najpomembnejsi koncepti, standardi in priporocila na tem podrocju ter razlicne veljavne metode, ki jih uveljavljajo digitalni arhivi (knjiznice in arhivi, ki so zadolzeni za trajno ohranjanje digitalnih virov). Kljub tem da je podrocje trajnega ohranjanja digitalnih virov sele v razvoju in ne vemo, ali so izbrane metode zanesljive, velja nacelo, da lahko z doslednim izvajanjem katerekoli metode med obstojecimi precej pripomoremo k ohranjanju dostopa do arhiviranih digitalnih vsebin.
Kljucne besede: trajno ohranjanje digitalnih virov, metode, koncepti
Review article
UDC 02:004:005.921.1"746"
Abstract
The paper is a review of digital preservation theory and practice. Main concepts, standards and recommendations in this field as well methods implemented by digital archives (libraries and archival institutions responsible for digital preservation) are presented. Although digital preservation is still evolving and we do not know whether the selected methods are reliable, it is generally known that implementing any method with consistency, we can considerably contribute to the preservation of the access to the archived digital contents.
Key words: digital preservation, methods, concepts
1 Uvod
Leta 2007 je vodilna ameriska korporacija na podrocju informacijske tehnologije EMC Corporation narocila IDC raziskavo o kolicinah ustvarjenih informacij v svetu (Gantz, et al., 2007; Barnett, 2007). Z razliko od studije, ki je nastala na Univerzi v Kaliforniji, Berkeley (How, 2003) in uposteva le izvirno ustvarjene informacije (brez podvajanj) in po tipih zapisov, zajema studija EMC/IDC celotno kolicino informacij, ki jih clovestvo ustvari (digitalne in analogne), in jih vrednoti z digitalnim zapisom. Po njihovih ocenah proizvodnja vseh informacij narasca vsako leto za 57 %. Kolicina vseh informacij, ki so bile ustvarjene v svetu, je leta 2006 znasala 161 eksabajtov1 (161 milijard GB), leta 2008 pa 486 eksabajtov informacij. V grobem to pomeni 3 milijone krat informacije, ki nam jih ponujajo vse knjige, ki so bile kdajkoli napisane. Po njihovih predvidevanjih naj bi v letu 2010 ustvarili sestkrat vec informacij kot leta 2006 oziroma 988 eksabajtov, kar bi znasalo 70 % vseh do takrat ustvarjenih digitalnih informacij.
Dejstvo je, da je digitalno okolje prevzelo pomembno vlogo v nasih zivljenjih in delovanju. Pri tem se poraja vprasanje, kako ohraniti informacije, ki so pomembne za prihodnost. Zato se v zadnjih letih veliko vec pozornosti namenja trajnemu ohranjanju digitalnih virov, vendar pa nihce ne more z gotovostjo reci, da so strategije in metode, uporabljene v mnogih digitalnih arhivih, povsem zanesljive.
Bodocega razvoja informacijske tehnologije ter sprememb v digitalnih zapisih in nosilcih ne moremo predvideti. Od izuma svetovnega spleta je minilo manj kot 20 let in vsebine na njem so se zacele ohranjati sele pred kratkim. Digitalna dediscina komaj nastaja in zato se praksa trajnega ohranjanja sele razvija. Prakso trajnega ohranjanja razvijajo vecje depozitne ustanove, kot so nacionalne knjiznice, nacionalni arhivi in raziskovalne organizacije, pa tudi vse vecje stevilo univerz. Morda so strategije in metode, ki jih zagovarjajo razlicni digitalni arhivi, na prvi pogled zelo razlicne, imajo vendarle skupna izhodisca in cilje. Poleg tega strokovnjaki na tem podrocju ugotavljajo, da nikakor ne zadostuje, da se s trajnim ohranjanjem digitalnih virov ukvarjajo le organizacije, ki so za to pozvane, ampak bi morali pri tem sodelovati tudi drugi delezniki v zivljenjskem ciklusu digitalnih virov. Med njimi najprej njihovi ustvarjalci. V trenutku, ko nastane digitalni objekt, se zacne proces trajnega ohranjanja2. Ta proces se nadaljuje pri posrednikih v njegovem zivljenjskem ciklusu in nazadnje v digitalnih arhivih, ki so odgovorni za hrambo teh virov.
Teorija in praksa trajnega ohranjanja digitalnih virov sta se v knjiznicarstvu zaceli razvijati sele pred desetimi leti. Metodologija, znacilna za to podrocje, skusa vgraditi dolocene procese pri ravnanju z digitalnimi viri. V teh procesih so bistvenega pomena metapodatki, ki nam bodo omogocili ohraniti informacije o digitalnem objektu, ter postopki, ki so predvideni za ohranjanje dostopa do digitalnih vsebin.
Namen tega prispevka je podati povzetek konceptov in metod, ki bodo pomagali razumeti to podrocje in bodo, upamo, spodbudili kolege v stroki, da so pozorni na nekatere vidike trajnega ohranjanja digitalne dediscine ze v zacetni fazi njihove zivljenjske dobe. Prispevek temelji na analizi najnovejse strokovne literature in priprave strategije trajnega ohranjanja v Narodni in univerzitetni knjiznici (NUK). To problematiko v NUK spremljamo od zacetka, pa smo vendar sele v zadnjih nekaj letih uspeli doseci nekaj pomembnejsih rezultatov. Zelo pomemben vidik pri trajnem ohranjanju digitalnih virov je upravljanje z avtorsko in sorodnimi pravicami. Zaradi obseznosti tega podrocja ga v tem prispevku ne bomo obravnavali.
Ceprav se terminologija na podrocju trajnega ohranjanja hitro spreminja, pogosto se za isti pomen uporablja vec izrazov, bomo poskusali najprej opredeliti tri temeljne pojme: digitalni arhiv in digitalni vir ter digitalni objekt. V strokovni literaturi je mogoce zaslediti vec terminov in pomenov digitalnega arhiva. Bibliotekarski terminoloski slovar (Kanic et al., 2009, str. 72) podaja dva pomena. Digitalni arhiv je arhiv digitalnih dokumentov, lahko je tudi zbirka vsebinsko, logicno povezanih elektronskih dokumentov (npr. starejsih letnikov elektronskih casopisov). Mednarodni standard za odprt arhivski informacijski sistem - OAIS (Open archival information system) (ISO 14721, 2003) uporablja termin digitalni arhiv, medtem ko ameriskih skupina znanstvenih knjiznic - RLG (Research Libraries Group) in OCLC (Online Computer Library Center) govorita o zaupanja vrednih repozitorijih. Na zacetku je to bilo vezano na koncept skladiscenja, ki se je izvajalo v posebnih, za to organiziranih enotah izven knjiznice. S tem konceptom so univerze in raziskovalni instituti imenovali digitalne zbirke, ki jih ustvarjajo akademsko osebje in studentje. Vecinoma te zbirke razvijajo in vzdrzujejo racunalniski oddelki ali druge enote izven knjiznice in ne predvidevajo trajnega ohranjanja. Zato so tudi bile glavne pobudnice za razvoj tovrstnih sistemov ravno univerze. V prispevku uporabljamo termin digitalni arhiv za poimenovanje organizacije, ki je zadolzena za trajno ohranjanje nacionalne digitalne dediscine (npr. knjiznice, arhivi ali druge sorodne ustanove) in izvaja dejavnosti, ki so potrebne za ohranjanje in zagotavljanje dostopnosti digitalnih virov, medtem ko repozitorij predstavlja programsko resitev, ki avtomatizira vse procese pridobivanja, trajnega ohranjanja in dostopa do digitalnih vsebin v digitalnem arhivu. Digitalni repozitoriji so torej sistemi za digitalno skladiscenje.
Pojem digitalni (informacijski) viri (ang. digital resources) v nasem primeru ustreza tudi izrazom digitalno gradivo (ang. digital material), digitalna publikacija (ang. digital publication), digitalna informacija (ang. digital information), tudi spletne publikacije ipd. Gre za dokumente, ki so zapisani v obliki digitalnega zapisa (obicajno dvojiskem), nastali z digitalizacijo ali ze izvorno z racunalnikom in so dostopni na elektronskem mediju.
Pojem digitalni objekt je izposojen iz sistemske analize. Pomeni katerokoli digitalno vsebino, ki predstavlja zaokrozeno intelektualno enoto. To je lahko digitalna slika, besedilo, knjiga, dokument, publikacija, glasbeni posnetek itd. Sestavljajo ga podatki, metapodatki in oznacevalec (identifikator). V prispevku je digitalni objekt uporabljen kot sinonim za digitalno vsebino, elektronsko publikacijo in elektronski oziroma digitalni vir. Razlika je v kontekstu. Sestavljajo ga podatki, metapodatki in oznacevalec (identifikator).
2 Kaj je trajno ohranjanje digitalnih virov?
V slovenski strokovni literaturi se srecujemo z razlicnimi prevodi angleskega termina »long-term preservation of digital materials« ali »digital preservation«. Razlicni strokovnjaki uporabljajo dobesedni prevod besede »long-term« v smislu dolgorocno ali dolgodobno ohranjanje oziroma dolgorocna ali dolgodobna hramba (npr. Novak, 2002; Novak, 2007; Kodric - Dacic, 2005)3. Vendar ima v arhivski stroki dolgorocna hramba nekoliko drugacen pomen. Dolgorocna ali dolgodobna hramba casovno pomeni hrambo nad stirimi do desetimi leti. To gradivo ni nujno arhivsko, ki bi ga bilo potrebno trajno hraniti. Namrec, arhivisti locijo kratkorocno hrambo (do 5-10 let) od dolgorocne (vec kot 5-10 let). Po dolocenem obdobju postane gradivo arhivsko4. Zato smo se v knjiznicarski stroki odlocili za termin trajno ohranjanje digitalnih virov, ker dostopa do digitalnega gradiva ne smemo omejevati na doloceno obdobje, ampak ga moramo trajno ohranjati, to pa seveda ne pomeni neskoncno. Termin je tudi blizji prevodu (ang.) »digital preservation«, ki v zadnjih letih vse bolj nadomesca uporabo angleske razlicice (ang.) »long-term preservation«.
Poleg izraza trajno ohranjanje digitalnih virov se v anglesko govorecih dezelah v zadnjem desetletju uporabljajo tudi drugi sorodni termini, kot je npr. digitalno skrbnistvo (ang. digital curation) ali digitalno arhiviranje (ang. digital archiving). Razlika med temi tremi izrazi je odnos do gradiva, ki ga trajno ohranjamo. Digitalno skrbnistvo zajema vsa dejanja, ki so potrebna za vzdrzevanje digitalnih virov skozi cas in za prihodnje generacije, med njimi tudi dodajanje informacij trajno hranjenim vsebinam (Beagrie, 2006). Trajno ohranjanje digitalnih virov pomeni ohranjanje dostopnosti do digitalne vsebine skozi cas. Zajema razlicne dejavnosti, kot so nacrtovanje, zagotavljanje virov, uporabo metod in tehnologij, ki omogocajo, da elektronski viri ostanejo dostopni in uporabni v prihodnosti. Pri digitalnem arhiviranju pa je poudarek na skladiscenju digitalnih virov in njihovem ohranjanju za prihodnost (Beagrie, 2006).
Obstaja vec definicij koncepta trajnega ohranjanja. RLG opredeljuje trajno ohranjanje digitalnih virov kot upravljanje z aktivnostmi, ki so potrebne za trajno vzdrzevanje bitnega toka (vkljucno z metapodatki), kar zadostuje za ustrezno reproduciranje izvirnega dokumenta, in zagotavljanje dostopnosti do njegove vsebine skozi cas, kljub tehnoloskim spremembam (Trusted, 2002). Amerisko zdruzenje knjiznic (American Library Association - ALA) pa definira trajno ohranjanje digitalnih virov kot skup strategij in dejavnosti, ki so usmerjene na ustvarjanje digitalnih vsebin, ohranjanje njihove celovitosti ter njihovo vzdrzevanje (Definitions, 2007).
Ce povzamemo obe definiciji, trajno ohranjanje pomeni ohranjanje dostopnosti do digitalne vsebine skozi cas. Zajema razlicne dejavnosti, kot so nacrtovanje, zagotavljanje virov, uporabo metod in tehnologij, ki omogocajo, da elektronski viri ostanejo dostopni in uporabni v prihodnosti.
3 Zgodovina trajnega ohranjanja digitalnih virov in razlicne pobude
Strokovnjaki so v zacetku 90. let ugotovili, da nihce ne skrbi za ustvarjene digitalne vsebine in da so te prepuscene nestrokovnemu ravnanju razlicnih organizacij. Potrebno je bilo dolociti nekaj pogojev, ki bi jih prav ustanove, namenjene skladiscenju in trajnemu ohranjanju tega gradiva, morale izpolnjevati. S tem se je zacela zgodovina trajnega ohranjanja digitalnih virov. Leta 1994 sta ameriska Komisija za trajno ohranjanje in dostop (Commission on Preservation & Access) in posebna delovna skupina za arhiviranje digitalnih virov pri RGL (RLG Task Force on Archiving of Digital Information) izrazili potrebo po definiciji pogojev, ki jih morajo izpolnjevati zanesljivi digitalni arhivi. Hkrati je bilo oblikovano besedilo referencnega modela za odprt arhivski informacijski sistem (OAIS), sprejet leta 2003 kot mednarodni standard ISO 14721 (2003), ki ga je v letu 2009 revidirala ustanova Consultative Committee for Space Data Systems (CCSDS) (Reference, 2009).
Leta 2002 sta RLG in konzorcij OCLC pripravila skupno porocilo Trusted digital repositories: attributes and responsibilities (2007), v katerem so bile opredeljene znacilnosti in vse odgovornosti na podlagi OAIS, ki jih morajo prevzeti zaupanja vredni digitalni arhivi. Vendar pa nihce ni preverjal, ali digitalni arhivi in njihovi repozitoriji dejansko izpolnjujejo te osnovne pogoje. Da bi zagotovili zanesljivost, so se nemski strokovnjaki odlocili, da pravim digitalnim arhivom dodelijo certifikate, ki bi zagotavljali, da digitalni arhivi in njihova skladisca v razlicnih organizacijah sledijo obstojecim standardom in zahtevanim postopkom. Prvi taksen je DINI-jev (Deutsche Initiative fur Netzwerkinformation) certifikat. Ta v svojem zacetku leta 2003 ni bil prevec zahteven, saj so bile definicije po standardu OAIS zelo fleksibilne. DINI je pozneje dozivel nekoliko redakcij, zadnje leta 2006. Namenjen je predvsem trajnemu ohranjanju znanstvenih publikacij, ki so shranjene v digitalnih repozitorijih nemskih univerz. Seveda pa DINI-jev certifikat lahko pridobijo tudi tuje organizacije (DINI, 2006).
RLG in NARA (National Archives and Records Adminstration), sta nadaljevali delo RLG in OCLC iz leta 2002 in v letu 2005 objavila publikacijo An audit for the certification of trusted digital repositories. Slednjo sta Center za ameriske raziskovalne knjiznice (CRL - Center for Research Libraries) in OCLC dopolnila in leta 2007 objavila Trustworthy repositories audit & certification (TRAC). TRAC je natancneje specificiral publikaciji iz leta 2002 in 2005 in je bil napisan kot kontrolni seznam pogojev, ki jih morajo izpolnjevati digitalni arhivi. Predstavljal je nekaksno merilo pri ocenjevanju njihove zanesljivosti.
Zavedajoc se velikega pomena trajnega ohranjanja digitalnih virov je UNESCO narocil izdelavo smernic za digitalne arhive, ki jih je leta 2003 pripravila Avstralska nacionalna knjiznica (Guidelines, 2003). Pri tem so pod vodstvom Colina Webba sodelovali najvecji svetovni strokovnjaki na podrocju trajnega ohranjanja digitalnih virov. Smernice obravnavajo postopke trajnega ohranjanja od ustvarjenja digitalnega vira, in sicer dolocanje odgovornosti, kriterijev izbire ter izbire metod in potrebnih informacij, ki naj bi olajsali dostop do digitalnega vira v prihodnosti.
Pri vseh omenjenih prizadevanjih je dosledno upostevan referencni model za OAIS, trajno ohranjanje digitalnih virov pa je razumljeno kot medsebojna odvisnost trajnega ohranjanja in organizacije (podpora vodstva in strategije organizacije), tehnologije (repozitorij) in drugih virov (kadrovski, financni itd.). To McGovern (2007) predstavlja kot »trinozni stol« trajnega ohranjanja digitalnih virov (Slika 1).
Poleg omenjenih prizadevanj so se po svetu pojavile razlicne pobude in se izvajali pomembni raziskovalni projekti, ki so skusali prispevati k razvoju podrocja trajnega ohranjanja digitalnih virov. Naj omenimo le nekaj od njih:
- Preserving Access to Digital Information (PADI, http://www.nla.gov.au/padi/index.html) je spletno mesto, ki ga od leta 1996 vzdrzuje Nacionalna knjiznica Avstralije. Zaradi skupnih mednarodnih projektov od leta 2003 dalje zdruzuje informacije iz celega sveta na razlicnih podrocjih trajnega ohranjanja digitalnih virov, kot so arhiviranje spleta, metapodatki, standardi in drugo.
- Internet Archive (http://www.archive.org/) je neprofitna organizacija, ki od leta 1996 zajema celotni svetovni splet. Njihovo poslanstvo pri ohranjanju digitalne dediscine na spletu se nadaljuje v okviru konzorcija IIPC, katerega ustanovitelj je med drugimi tudi Internet Archive.
- International Internet Preservation Consortium (IIPC, http://netpreserve.org/). Konzorcij je nastal leta 2003, ko se je 12 ustanov odlocilo, da skupaj razvijajo orodja za zajemanje spleta. Danes deluje konzorcij predvsem na stirih podrocjih: razvoj orodja za zajemanje spleta Heritrix, razvoj orodij za dostop in trajno ohranjanje spletnih strani. Leta 2007 je NUK postal clan tega konzorcija in uporablja njihova orodja za zajemanje spleta.
- Digital Curator Centre (DCC, http://www.dcc.ac.uk/) je rezultat skupne pobude med Joint Information Systems Committee (JISC)5 in britanskim nacionalnim programom za e-znanost. Ustanovljen je bil leta 2004. Na njihovih spletnih straneh redno objavljajo najnovejse novice z razlicnih podrocij prakse trajnega ohranjanja v Veliki Britaniji.
- DigitalPreservationEurope (DPE, http://www.digitalpreservationeurope.eu/) je nastal iz evropskega projekta ERPANET in ima namen ozavescati na podrocju trajnega ohranjanja digitalnih virov. Na njihovih straneh so objavljeni prispevki partnerjev in videoposnetki predavanj eminentnih strokovnjakov na tem podrocju. V sodelovanju z DCC so izvedli evropski projekt DRAMBORA (Digital depository audit method based on risk assessment, http://www.repositoryaudit.eu/), kjer so razvili metodologijo za samostojno evalvacijo digitalnih repozitorijev. Cilj te metodologije je pomagati organizacijam, ki upravljajo z digitalnimi arhivi, da se v celoti zavejo ciljev, aktivnosti in virov, preden ocenijo mozna tveganja pri trajnem ohranjanju digitalnih virov v organizaciji.
Poleg razlicnih zdruzenj in pobud nekatere nacionalne ustanove, kot je nacionalni arhiv v Veliki Britaniji (http://www.nationalarchives.gov.uk/), ki spremljajo podrocje trajnega ohranjanja in objavljajo zanimive analize in priporocila na podrocju trajnega ohranjanja digitalnih virov. V britanskem nacionalnem arhivu so npr. razvili register formatov PRONOM in orodje za prepoznavo datotecnih formatov DROID. K razvoju podrocja so veliko prispevali tudi nacionalni in evropski projekti. Med njimi je vredno omeniti nemska projekta NESTOR in KOPAL ter evropske projekte iz okvirnih programov, npr. CASPAR, PLANETS, LIWA in LOCKSS.
Znacilnosti najnovejsega razvoja na podrocju trajnega ohranjanja digitalnih virov so naslednje:
- po desetih letih imamo prvo generacijo delujocih repozitorijev za skladiscenje digitalnih virov;
- v ospredju so odprtokodne resitve, ki jih razvija mednarodna skupina raziskovalcev in univerzitetnih institucij;
- v uporabi so razlicne metodologije za evalvacijo zanesljivosti repozitorijev za trajno ohranjanje;
- nastaja potreba po ustvarjanju arhivov publiciranih elektronskih revij, ki so bile dosegljive le z licenco;
- razvite drzave (ZDA, Kanada, Evropa in Avstralija) vlagajo vse vec sredstev v razvoj tehnologij, programske opreme in resitev za trajno ohranjanje;
- v letu 2008 se je zacelo preucevati razlicne moznosti ohranjanja digitalnih virov v domeni tehnologij spleta 2.0 (virtualni interaktivni dostopi, socialno mrezenje ipd.).
Pri tem je opaziti razlicne pristope med Evropo in ZDA. ZDA dajejo prednost raziskovanju pred samim procesom trajnega ohranjanja. Vecje fundacije, kot je npr. Andrew Mellon Fundation, so glavni viri financiranja. V Evropi pa je vecji poudarek na mrezenju in podpornih dejavnostih v okviru podrocja trajnega ohranjanja, zlasti digitalnem skrbnistvu, ki se ukvarja z upravljanjem zivljenjskega ciklusa digitalnih virov oz. dejavnosti, in zagotavljanju dostopa do vsebin v prihodnosti.
4 Standardi in priporocila
Namen standardizacije na podrocju trajnega ohranjanja je uvajanje minimalnih zahtev in pogojev za ohranjanje dostopnosti do digitalnih vsebin. Najpomembnejsi mednarodni standard je ze omenjen referencni model za odprt informacijski arhivski sistem - OAIS (ISO 14721, 2003). Referencni model OAIS opredeljuje procese, ki naj bi se izvajali v digitalnih arhivih, da bi se zagotovilo trajno ohranjanje digitalnih vsebin. Te procese spremlja tudi informacijski model, ki zajema informacije o digitalnem objektu, kontekstu njegovega delovanja in podatke o njegovi verodostojnosti. Po nekaj letih teoretiziranja o procesih v modelu, smo koncno dobili sisteme za digitalno skladiscenje (repozitorije), ki lahko izvajajo vse procese, navedene v referencnem modelu (Kavcic - Colic, 2004a; Kavcic - Colic in Kragelj, 2008). Problem, ki se v zadnjem letu poraja, je, kako integrirati procese trajnega ohranjanja digitalnih virov v obstojece knjiznicne procese. Torej, kako preiti iz teorije v prakso.
Standardizacija se izvaja tudi na podrocju datotecnih formatov. Da bi se preprecila izguba podatkov, je priporocena uporaba formatov brez ali z minimalnim zgoscevanjem. Tako na primer za arhivsko skladiscenje strokovnjaki priporocajo datotecni format TIFF (ISO 12234-2, 2001) in TIFF/IT (ISO 12639, 2004), predvsem za barvne slike in podobe z bogatimi detajli. Ker datoteke v TIFF zahtevajo veliko pomnilniskega prostora, se v zadnjih dveh letih za besedila vse bolj uveljavlja standard JPEG 2000 (ISO 15444, 2004)6. JPEG 2000 ali JP2 zahteva do 50 % manj pomnilniskega prostora od formata TIFF. Razlika je v potencialni izgubi v barvnem spektru RGB, ki je nasim ocem nevidna. Poleg tega JP2 sprejme - z razliko od TIFF - tudi predelavo z opticno prepoznavo besedil (uveljavljena kratica OCR). Ta standard, kot standard za trajno ohranjanje je prevzel tudi Xerox Research Center. Za dokumente v PDF je priporocena uporaba razlicice PDF/A (ISO 19005-1, 2005).
Poleg omenjenih so v uporabi tudi drugi formati, ki imajo, ceprav niso standardizirani, obsezno dokumentacijo in se zato priporocajo za trajno ohranjanje digitalnih virov. Med njimi so WAVE (Broadcast WAVE Format - BWF) za glasbene posnetke, ICC.1 (International Color Consortium - color profile format) za natancno prepoznavo barv, ki je enak standardu ISO 15076-1 (2005), GeoTIFF za georeferencirane in geokodirane rastrske slike ter SPIFF (Still Picture Interchange File format (ISO/IEC 10918-1, 1994) in JFIF (JPEG File Interchange Format) za slikovno gradivo.
Med raziskavami na podrocju pomnilniskih medijev so za knjiznicarje zanimiva porocila Adriana Browna, vodje oddelka za raziskave na podrocju trajnega ohranjanja digitalnih virov v britanskem nacionalnem arhivu. Brown od leta 2003 analizira lastnosti (trajnost, kapaciteto, trdnost, zastarevanje, ceno in obcutljivost) razlicnih opticnih in magnetnih pomnilniskih medijev in ugotavlja, da so najprimernejsi za skladiscenje podatkovnega toka magnetni trakovi LTO (Linear Tape Open) (Brown, 2008a). Brown ugotavlja tudi idealne pogoje za dolgorocno hrambo, ki so v povprecju 18-22 stopinj C in 20-45 % relativne vlage, odvisno od pomnilniskega medija (Brown, 2008b). Na straneh britanskega nacionalnega arhiva je Brown objavil se priporocila za graficne formate in zgoscevanje slikovnih formatov.
Poleg Unescovih priporocil so na spletu objavljeni razlicni prirocniki in smernice za trajno ohranjanje, ki se nenehno prenavljajo, ker je tudi podrocje se v razvoju. Med boljsimi je prirocnik Digital preservation handbook (2008), ki ga vzdrzuje Digital Preservation Coalition in je nadgradnja prirocnika avtorjev Beagrie in Jones (2001). Evropski projekti in razlicna zdruzenja na svojih spletnih mestih omogocajo bogat vir informacij s podrocja trajnega ohranjanja digitalnih virov. Poleg tega so tu se navodila in priporocila specializiranih ustanov, kot so video in glasbeni arhivi7.
5 Zakaj so metapodatki tako pomembni?
Ko odlocamo o trajnem ohranjanju digitalnih virov, je treba imeti v mislih, kako bodo jutrisnji strokovnjaki ali uporabniki razumeli shranjene vsebine. Denimo, da zelimo samostojno ohraniti celotno strukturo in vsebino na primeru tabele, ki je bila ustvarjena za moj prispevek v letu 1996 (Preglednica 1).
Ko bo uporabnik cez 50 let odprl tabelo, bo iz besedila lahko razbral, da je bila napisana v slovenscini. Poleg tega bo ugotovil, da so v levem stolpcu razlicne stopnje akademske izobrazbe, v desnih stolpcih pa so navedena stevila za dva razlicna obdobja. Glavni problem je, da iz same tabele ne bo mogel ugotoviti, kaksen je namen teh podatkov, niti v kaksnih okoliscinah, je bila tabela ustvarjena. Zato bo potreboval dodatne informacije, ki mu bodo pomagale razumeti, da podatki predstavljajo izobrazbeno strukturo zaposlenih v anketiranih specialnih knjiznicah v letih 1992 in 1995-96 in da je tabela del analize stanja v specialnih knjiznicah, ki jo je spisala Alenka Kavcic - Colic leta 1996.
Nosilci teh informacij, ne le vsebinskih (o digitalnem objektu), kot v navedenem primeru, ampak tudi tehnicnih, administrativnih, informacij o strukturi, provenienci, verodostojnosti, avtenticnosti itd., so metapodatki. Iz njih izvemo, kdo je imetnik avtorskih pravic, katero aplikacijo potrebujemo za dostop do vsebine dokumenta, kaj se nam mora prikazati ob odpiranju dokumenta, ali je bila izvirna datoteka pretvorjena v drug format, zakaj je bila pretvorba izvedena itd. Referencni model za OAIS je v zvezi s tem dolocil informacijski model, ki naj bi zajel vse relevantne informacije, potrebne za to, da bi bodoci uporabniki pravilno razumeli digitalni objekt in ga znali tudi pravilno odpreti in uporabiti (Kavcic - Colic, 2004b). Poleg mnogih obstojecih naborov metapodatkov, ki so nastali bodisi pod razlicnimi vplivi evropsko-ameriskega ali novozelandskega modela (Metadata, 2002), npr. NEDLIB (Lupovici in Masanès, 2000) in LMER (Steinke, 2005), se v zadnjih letih vse bolj uveljavlja nabor metapodatkov za trajno ohranjanje PREMIS, ki je rezultat skupnega projekta RLG in OCLC, trenutno pa ga vzdrzuje Kongresna knjiznica (PREMIS, 2010). Mnoge evropske knjiznice zato pri trajnem ohranjanju digitalnih virov ze razmisljajo o uporabi nabora PREMIS.
Posebna zvrst metapodatkov so trajni identifikatorji (trajni oznacevalci) digitalnih objektov, ki so pomembni predvsem v spletnem okolju. Povprecna zivljenjska doba spletne strani je 40 dni. Poleg tega se informacijska tehnologija, na katerih slonijo, prenavlja vsake 2,5-3 leta. Zato so spremembe streznikov in posledicno tudi njihovih URL naslovov zelo pogoste. Velikokrat se dogaja, da je streznik, na katerem smo dostopali do dolocene publikacije, prenehal delovati, in je ta bila prenesena na drugega. S tem je publikacija dobila nov URL naslov. Z navadno poizvedbo s spletnim brskalnikom bomo to publikacijo morda nasli, vendar nikoli ne bomo vedeli, ali je to bila ravno tista, ki smo jo uporabili v preteklosti. Zato potrebujemo trajne identifikatorje ali trajne oznacevalce vira. Ti nam lahko pomagajo, da nedvomno identificiramo elektronski vir in ga lokaliziramo, kjerkoli je ta shranjen.
Obstajajo razlicne zvrsti trajnih identifikatorjev. Med zalozniki je najpopularnejsi DOI (Digital Object Identifier, http://www.doi.org/), ki se izdaja enako kot ISSN. Nacionalne knjiznice pogosteje uporabljajo URN (Uniform Resource Name) oziroma enotno ime vira, ki je z razliko od DOI brezplacen, njegovo sintakso pa lahko knjiznice dolocijo same. Trajni oznacevalec vira URN je lahko avtomatsko dodeljena stevilka ali je sestavljen iz sifriranih informacij o viru. Navadno trajne oznacevalce vira spremlja podatkovna baza (razresevalec), kjer so ustrezno navedene lokacije URL, ki se nenehno prenavljajo. Ko uporabnik v razresevalcu vtipka URN, dobi pravo lokacijo vira. Poleg tega trajni oznacevalci vira zagotavljajo avtenticnost vira in se zato uporabljajo tudi pri bibliografskih referencah. URN uporabljamo tudi v Nuku.
6 Metode za trajno ohranjanje digitalnih virov
Cilji razlicnih metod za trajno ohranjanje so predvsem naslednji:
- ohranjanje dostopnosti do vsebine digitalnega vira;
- ohranjanje identitete digitalnih objektov (s pomocjo metapodatkov, trajnih identifikatorjev itd.);
- ohranjanje razumljivosti digitalnega objekta (vsebinski kontekst, odnos do drugih objektov, okolje delovanja itd.);
- ohranjanje izvirnosti podatkov - nespremenljivosti - zascita proti virusom, varno shranjevanje podatkov, ohranjanje nosilcev, primerni pogoji shranjevanja, kontrola kakovosti podatkov itd.;
- ohranjanje avtenticnosti digitalnih virov - mozno je preveriti vir (provenienco) in vsebino dokumenta;
- ohranjanje obstojnosti podatkov in nosilcev - pomembno pri migraciji nosilcev;
- ohranjanje sposobnosti prikazovanja podatkov - vezano na obstojnost SW.
Ko se odlocamo o metodi za trajno ohranjanje, se moramo vprasati, kaj zelimo ohraniti: dostop do vsebine digitalnega objekta in njegov logicni zapis ali le dostop do njegove vsebine, ne glede na njegov logicni zapis? Pri tem je treba razumeti strukturo digitalnega objekta.
Digitalne objekte sestavljajo stiri osnovne ravni (glej Preglednico 2). Najnizja je fizicna raven, ki predstavlja zapis podatkov na fizicnem nosilcu. Druga, logicna raven, predstavlja format ali sintakso zapisa (programski jezik, aplikacija itd.). Tretja, konceptualna raven, nam omogoca razumevanje vsebine digitalnega objekta. V tej ravni izvemo, ali je pred nami slika, besedilo, tabela itd. Zadnja, cetrta raven, predstavlja vse lastnosti, ki so specificne za digitalni objekt: zvocni posnetek, dolocena barva, ce gre za podobo, funkcionalnost pri dostopu itd.
Thibudeau (2002) je zelo nazorno predstavil razliko med dvema logicnima ravnema. Na Sliki 2 je predstavljeno isto besedilo v MS Wordu in v PDF. Z rdeco sta oznaceni enaki vrstici v besedilu. Razlika je ocitna.
V tem primeru je konceptualna raven nespremenjena. Razlicna logicna raven vpliva tudi na specificne lastnosti digitalnega objekta, saj funkcionalnosti v MS Wordu niso enake kot v datoteki v PDF.
Pri izbiri metode za trajno ohranjanje moramo vedeti, da elektronskih virov ne moremo ohranjati enako kot analogne. Njihova avtenticnost je odvisna od informacijske tehnologije, logicne strukture in vsebinskega konteksta (namen, za katerega je bil dokument ustvarjen).
Thibodeau (2002) nasteva 4 kriterije za izbiro ustrezne metode ohranjanja:
- izvedljivost metode - za njeno izvajanje mora obstajati ustrezna programska oz. racunalniska oprema (SW/HW);
- trajnost metode - mora se prilagajati tehnoloskim spremembam in drugim metodam;
- prakticnost - njena zahtevnost in cena morata biti primerni vrednosti vsebine;
- ustreznost - metoda mora ustrezati zvrsti digitalnih objektov, ki naj bi se trajno ohranili.
Pri trajnem ohranjanju digitalnih virov je treba upostevati dva razlicna vidika, ki se med seboj dopolnjujeta, in sicer: skladiscenje podatkovnega toka in ohranjanje trajnega dostopa do digitalnih vsebin.
6.1 Skladiscenje podatkovnega toka
Skladiscenje podatkovnega toka (ang. bitstream) zadeva predvsem fizicno raven digitalnega objekta. Pri skladiscenju podatkovnega toka je zelo pomembno, da nam sistem za skladiscenje zagotavlja naslednje pogoje:
- zadostne pomnilniske in funkcionalne kapacitete;
- tehnicno podporo za hitro reagiranje v primeru nesrec;
- sistem mora upostevati granularnost digitalnih objektov ter hierarhicne odnose med datotekami oz. digitalnimi objekti. Pri tem je pomembna tudi sposobnost razlicnega preimenovanja datotek, ki naj ne bi vplivalo na obstojece hierarhicne odnose. Razviden mora biti odnos med fizicno, logicno in konceptualno ravnjo digitalnega objekta;
- sposobnost za upravljanje z redundantnim arhivom - omogociti mora upravljanje s podvojenimi vsebinami v razlicnih formatih in razlicnimi verzijami enega digitalnega objekta;
- na drugi strani pa mora tocno zaznati identicne kopije digitalnega objekta;
- sposobnost avtomatskega preverjanja napak.
Primera resitve za skladiscenje digitalnih objektov, ki izpolnjujejo vse omenjene zahteve, sta npr. komercialni DigiTool od exLibrisa in odprtokodna resitev FEDORA, ki je nastala v sodelovanju med Cornell University in University of Virginia, in jo naprej razvija mednarodni konzorcij (Kavcic - Colic in Kragelj, 2008).
Poleg tega se priporoca, da se osvezitev ali migracija na nove fizicne nosilce opravi vsaki dve leti. Za fizicne nosilce se priporocajo magnetni trakovi, ceprav je pri njih skladiscenje linearno in imajo omejeno pomnilnisko kapaciteto (njihova zivljenjska doba je do 30 let). Druga moznost so magnetni (trdi) diski, ki omogocajo hiter dostop do podatkov in prenasajo vecje kapacitete. Problem je, da je njihova povprecna zivljenjska doba 5 let (Brown, 2008a).
6.2 Ohranjanje dostopa do vsebin digitalnega objekta
Ohranjanje trajnega dostopa do digitalnega objekta zadeva logicno in konceptualno raven ter raven specificnih lastnosti digitalnega objekta. Tezava je v tem, da danes se ni enotnih resitev. Vedno obstaja nevarnost izgube podatkov, predvsem na ravni specificnih lastnosti. Pri oblikovanju strategije za trajno ohranjanje digitalnih virov moramo vsekakor upostevati, da je ne glede na izbrano metodo, potrebno vlagati veliko sredstev.
Glede na osredotocenost trajnega ohranjanja digitalnih virov delimo metode za trajno ohranjanje v dve skupini (Preglednica 3): metode, ki so namenjene ohranjanju logicne ravni digitalnega objekta, in metode, ki so namenjene ohranjanju konceptualne ravni digitalnega objekta.
Metode, ki so namenjene ohranjanju logicne ravni digitalnega objekta, zavracajo vse mogoce spremembe v digitalnem objektu. Najbolj znan je muzejski pristop, pri katerem se ohranja stara tehnologija. Vendar tezave nastanejo pri njihovem vzdrzevanju oziroma okvarah. Poleg tega je vsaka informacijska tehnologija vezana na generacijsko znanje. Pri muzejskem pristopu so zato strokovnjaki, ki bi lahko pomagali pri odpravi okvar, zelo redki in dragi. So pa zato mozne druge resitve, kot npr. reinkarnacija starih strojev z dodajanjem novih cipov, ki naj bi oponasali delovanje starih strojev, ali uporaba emulatorjev, ki omogocajo, da se dolocena tehnologija obnasa kot druga (npr. novi operacijski sistem). Vendar je emulatorje treba napisati in so zato zelo dragi. S tako vrtoglavimi spremembami informacijske tehnologije bi bilo potrebno za vsako novo platformo ali tehnologijo izdelati nov emulator. Pri zapletenih sistemih in sestavljenih tehnologijah (Java, razlicne platforme, aplikacije, ki integrirajo streznike in odjemalce ipd.) je programiranje emulatorjev zelo zahtevno. Poleg tega dodajanje cipov in emulatorjev predvideva tudi njihovo dodatno vzdrzevanje.
Tu so se druge metode, kot je npr. tiskanje na papir v kombinaciji z drugimi vzporednimi metodami. Raymond Lorie (2002) je predlagal metodo abstrakcije podatkov, pri kateri bi se v strojnem jeziku opisala pravila kodiranja in dekodiranja podatkov v formatih, v katerih so napisani dokumenti. Strojni jezik je tako enostaven, da ga v prihodnosti lahko prebere vsak racunalnik. Slabost metode je, da ima omejeno stevilo funkcij. Zato bi bile mnoge specificne znacilnosti digitalnih objektov izgubljene.
Metode, ki so namenjene ohranjanju konceptualne ravni digitalnega objekta, temeljijo na pretvorbi logicnih formatov v novejse. Najbolj znana metoda je migracija, ki se lahko odvija na ravni formata (npr. Word > PDF), na ravni verzije formata (npr. SGML>HTML>XML) ali na strojni ravni (migracija dostopnosti s pomocjo pregledovalnikov ali orodij za upravljanje in izvajanje postopkov). V vsakem primeru pride do kaksne izgube podatkov ali funkcionalnosti (raven specificnih lastnosti) digitalnega objekta.
Vecina nacionalnih knjiznic, ki imajo poseben program trajnega ohranjanja digitalnih virov, ohranjajo dve kopiji digitalnega objekta, in sicer: izvirni digitalni objekt in digitalni objekt v arhivskem formatu (tj. formatu, ki najbolj ustreza arhiviranju in je lahko enak izvirnemu). Pri tem si pomagajo tudi s seznami formatov, npr. PRONOM, GDFR (Global Digital Format Registry8), kjer dobijo informacije o lastnosti podobnih formatov. Tezko je predvideti, kako se bo razvijala tehnologija v prihodnosti. Zato je pomembno, da se ohrani tudi izvirni digitalni objekt, v primeru, da se bo potrebno vrniti na zacetek pred migracijo.
V San Diego Supercomputer Center, ZDA, izvajajo tudi metodo, imenovano »kamen iz Rosette«, ki temelji na seznamu reprezentativnih vzorcev podatkovnih tipov z vsemi znacilnostmi (Heminger in Robertson, 1998). Vzorci se podvajajo v drugih formatih, ki jih lahko prebere trenutna racunalniska tehnologija, in predstavljajo skupino referenc za morebitno dekodiranje starejsih formatov.
Alternativne metode, ki se bodo mogoce v prihodnosti uporabljale, so arheologija podatkov, torej raziskave za povrnitev podatkov iz starejsih zapisov in podobno.
7 Kje smo v Sloveniji na podrocju trajnega ohranjanja digitalnih virov?
V Sloveniji se vecja pozornost podrocju trajnega ohranjanja digitalnih virov posveca sele v zadnjih nekaj letih. Tako je v Resoluciji o Nacionalnem programu za kulturo 2008-2011 (2008) zapisano, da »kulturna politika pojmuje e-kulturo oziroma digitalne kulturne vsebine kot eno od najpomembnejsih splosnih prioritet, ki naj prezema - horizontalno prepleta - celotno kulturno sfero. Razumeti jo je treba kot vkljucevanje informacijsko-komunikacijske tehnologije v osnovne procese ustvarjanja, shranjevanja, razsirjanja, predstavljanja javnosti, zascite in ponovne uporabe digitalnih kulturnih vsebin tako pri neposrednih ustvarjalcih kulturnih dobrin kot tudi v knjiznicah, muzejih, galerijah, arhivih, medijih ter drugih kulturnih institucijah.«
Digitalne vsebine so ze pomemben sestavni del slovenske kulturne dediscine, so del slovenike, zato je NUK odgovoren za njihovo hranjenje. V Nuku od leta 2002 z razlicnimi viri financiranja preko domacih in tujih projektov razvijamo digitalni arhiv, ki bo zagotovil trajno ohranjanje digitalnih virov. Kljub temu, da se zavedamo pomena trajnega ohranjanja digitalnih virov, se v Nuku pojavljajo naslednje tezave:
- imamo premalo strokovnjakov, ki bi lahko pokrivali celotno podrocje;
- sledimo prakso v tujini, vendar je ta zelo razlicna od okolja do okolja, saj se v zadnjih letih podrocje trajnega ohranjanja digitalnih virov nenehno razvija;
- nimamo dovolj izkusenj iz prakse;
- v slovenskem okolju opazamo, da se tudi druge kulturne institucije (arhivi in muzeji) in pomembne javne institucije, kot je RTV, posvecajo enakim problemom;
- manjse knjiznice in arhivi se ne poglabljajo v to problematiko, saj ni v njihovi pristojnosti;
- institucije, ki s svojimi vsebinami sodelujejo pri gradnji Nukovih digitalnih zbirk, zaradi pomanjkanja znanj in sredstev ustvarjajo digitalne vire slabse kvalitete, kar ni dobro izhodisce za trajno ohranjanje;
- raziskovalci in avtorji nimajo nobenih priporocil, ki bi jim lahko pri svojem ustvarjanju sledili.
Da bi dosegli optimalne rezultate, je nujno potrebno interdisciplinarno sodelovanje med knjiznicarji in arhivisti. V ta namen smo raziskovalci NUK v okviru projekta Nove vsebine in storitve Digitalne knjiznice Slovenije - dLibsiPlus (2009- 2010)9 stopili v stik z arhivisti iz Arhiva Republike Slovenije, Pokrajinskega arhiva Maribor in Arhiva druzboslovnih podatkov Fakultete za druzbene vede Univerze v Ljubljani, da bi skupaj pripravili spletno mesto, ki bo namenjeno sodelovanju in razsirjanju prakse in izkusenj s podrocja trajnega ohranjanja digitalnih virov. Pricakujemo, da bo spletna stran dostopna ze septembra 2010. Takrat bomo izvedli strokovno posvetovanje, ki naj bi postavilo temelje za sodelovanje na tem podrocju. Ceprav se praksa trajnega ohranjanja digitalnih virov v knjiznicarstvu in arhivistiki10 zaradi razlicnih ciljev razlikuje, je pri obeh vendarle precej skupnih tock, pri katerih je sodelovanje mogoce in prepotrebno.
8 Zakljucek
V prispevku smo predstavili osnovne koncepte pri trajnem ohranjanju digitalnih virov, nastanek ter razvoj teorije in prakse, pomembne iniciative, standarde in priporocila na tem podrocju. Pojasnili smo pomen metapodatkov in predstavili razlicne metode, ki jih vecji digitalni arhivi uporabljajo pri izvajanju trajnega ohranjanja digitalnih virov. Izpustili smo podrocje avtorskih pravic, ki sodi v organizacijski vidik tega podrocja. Sicer naj bi digitalni arhivi te pravice pridobili ob prevzemu digitalnega vira v hranjenje. Zajemale naj bi pravico do reproduciranja, pravico dajanja digitalnih vsebin na voljo javnosti in pravico do spreminjanja logicne strukture zapisa v okviru izbrane metode za trajno ohranjanje. Seveda pa so vmes razlicni vidiki, zaradi katerih zasluzi ta specificna problematika veliko vecjo pozornost.
V prispevku smo zeleli poudariti, da je glavni problem pri digitalnih virih ohranjanje dostopnosti do digitalnih informacij v prihodnosti. Vendar bo komaj cez nekaj desetletij, po opravljenih analizah nosilcev in zivljenjske dobe digitalnih objektov, mozno reci, katera od metod je najuspesnejsa. Danes je vsaka metoda, ki je namenjena ohranjanju cim vec informacij in ki skrbi za celotni zivljenjski ciklus tako nosilcev kot dostopa do digitalnih vsebin, lahko uspesna. Pri tem je zelo pomembna doslednost in vztrajnost. Trajno ohranjanje digitalnih virov se zacne v trenutku ustvarjanja digitalnih vsebin in zato je potrebno v tistem trenutku tudi zaceti razmisljati, kaj bo z digitalnim objektom v prihodnosti, kdo bo dostopal do njega, kaksen je njegov pomen, katere so njegove specificne lastnosti, ki jih zelimo ohraniti, na kaj je treba biti posebej pozoren, kdo je odgovoren za njegovo ohranjanje itd. Pri tem bodo - ce bomo ugotovili, da smo se motili - vse pravocasno pridobljene informacije pripomogle, da bomo prakso prilagodili drugim metodologijam.
KAVCIC - COLIC, Alenka. Digital preservation: concepts and methods. Knjiznica, 54(2010)1-2, p. 99-119
1 1 eksabajt (exabyte) znasa 1018 bajtov. Barnett v svojem blogu navaja primerjavo: 5 eksabajtov predstavlja kolicino informacij v 37.000 knjiznicah, velikosti Kongresne knjiznice.
2 Ni vseeno, kateri datotecni format bo avtor uporabil pri ustvarjanju svojega dela. Obenem je zelo pomembno, kdo so vsi nosilci tega dela, kdo je odgovoren za njihovo hranjenje. Za vzdrzevanje dostopnosti do vsebine dela je potrebno delo resiti vseh mogocih ovir (licenc, zascite) in spremljati njegov zivljenjski ciklus skozi cas v primeru poznejsih pretvorb v standardizirane formate. Zato tezko recemo, da se po koncanem digitalnem delu to dejansko loci od avtorja. Nasprotno, delo nadaljuje svoje zivljenje s pomocjo njegovih ustvarjalcev.
3 V drugih jezikih se izraz »long-term preservation« prevaja dobesedno: v spanscini »conservación a largo plazo«, v italijanscini »conservazione a lungo termine«, v francoscini »préservation à long terme«, v srbscini in hrvascini »dugorocno cuvanje«.
4 Novak (2007) razlaga, da kljub 52 zakonom, ki dolocajo roke hranjenja v Sloveniji, roki hranjenja za posamicne vrste dokumentarnega gradiva se niso jasno doloceni. Nadalje ugotavlja, da imajo pri posameznem dokumentarnem gradivu razlicne ustanove (Arhiv RS, Ministrstvo za javno upravo in Centralni arhiv Evropskega sveta) dolocene razlicne roke kratkotrajne hrambe. Tudi pri dolgorocni hrambi ni dovolj jasnih dolocil, ceprav je tudi ta omejena. V Centralnem arhivu Evropskega sveta je ta omejena na 30 let. Po tem obdobju postane gradivo arhivsko.
5 Joint Information Systems Committee - JISC (http://www.jisc.ac.uk/).
6 Ker TIFF zavzame prevec pomnilniskega prostora, je Kanadska nacionalna knjiznica leta 2008 dolocila JPEG2000 za standardni format pri digitalizaciji vseh vsebin.
7 Primer je londonski AHDA (Arts and Humanities Data Service), ki izdaja publikacije, namenjene razlicnim vidikom trajnega ohranjanja. Vec na spletni strani http://ahds.ac.uk/preservation/ahds-preservation-documents.htm.
8 Skupni projekt Univerzitetne knjiznice Harvard, OCLC in NARA. Njihov glavni sponzor je Andrew W. Mellon Foundation. V letu 2008 so se zdruzili z britanskim nacionalnim arhivom, ki razvija PRONOM. Vec o GDFR na spletnem naslovu http://www.gdfr.info/.
9 Projekt je financiran s sredstvi Strukturnih skladov za EU preko Ministrstva za visoko solstvo, znanost in tehnologijo.
10 V knjiznicarstvu ohranjamo dostopnost do intelektualne vsebine digitalnih knjiznih virov, medtem ko je v arhivistiki glavni cilj hranjenja zagotoviti neizbrisljivost, nespremenljivost, celovitost, verodostojnost in neokrnjenost vsebine in oblike elektronskih podatkov in dokumentov. Tako knjiznicarji ohranjamo digitalno knjiznicno gradivo, medtem ko arhivisti dokumentarno gradivo in elektronske zapise, ki so rezultat elektronskega poslovanja. Zaradi razlicnega predmeta ohranjanja sta pristopa nekoliko razlicna.
Navedeni viri
1. An audit checklist for the certification of trusted digital repositories: draft for public comment. (2005). Mountain View: RLG; OCLC. Pridobljeno 19. 2. 2010 s spletne strani: http://www.worldcat.org/arcviewer/1/OCC/2007/08/08/0000070511/viewer/file2416.pdf
2. Barnett, A. (2007, 6. marec). The expanding digital universe. Alex Barnett blog. Pridobljeno 19. 2. 2010 s spletne strani: http://alexbarnett.net/blog/archive/2007/03/06/The-Expanding-Digital-Universe.aspx
3. Beagrie, N. (2006). Digital curation for science, digital libraries and individuals. International Journal of Digital Curation, 1 (1), 3-16.
4. Beagrie, N., Jones, M. (2001). Preservation management of digital materials: a handbook. London: British Library.
5. Brown, A. (2008a). Digital preservation guidance note2: selecting storage media for long-term preservation. Richmond: The National Archives. Pridobljeno 19. 2. 2010 s spletne strani: http://www.nationalarchives.gov.uk/preservation/advice/digital.htm.
6. Brown, A. (2008b). Digital preservation guidance note3: care, handling and storage of removable media. Richmond: The National Archives. Pridobljeno 19. 2. 2010 s spletne strani: http://www.nationalarchives.gov.uk/documents/removablemedia-care.pdf.
7. Definitions of digital preservation. (2007). Chicago: ALA. Pridobljeno 19. 2. 2010 s spletne strani: http://www.ala.org/ala/mgrps/divs/alcts/resources/preserv/defdigpres0408.cfm
8. Digital preservation handbook. (2008). Heslington: Digital Preservation Coalition. Pridobljeno 19. 2. 2010 s spletne strani: http://www.dpconline.org/advice/digital-preservation-handbook.html
9. DINI-Certificate. Document and publication services 2007. (2006). Göttingen: Deutsche Initiative für Netzwerkinformation. Pridobljeno 19. 2. 2010 s spletne strani: http://www.dini.de/documents/Zertifikat-en.pdf
10. Gantz, J.F. (2007). The expanding digital universe: forecast of worldwide information growth through 2010. Framingham(MA): IDC. Pridobljeno 19. 2. 2010 s spletne strani: http://www.emc.com/collateral/analyst-reports/expanding-digitalidc-white-paper.pdf
11. Guidelines for the preservation of digital heritage. (2003). Paris: UNESCO. Pridobljeno 19. 2. 2010 s spletne strani: http://unesdoc.unesco.org/images/0013/001300/130071e.pdf
12. Heminger, A. R. in Robertson, S. B. (1998). Digital Rosetta stone: a conceptual model for maintaining long-term access to digital documents. V Sixth DELOS Workshop: preservation of digital information, Tomar, Portugal 17-19 June 1998. Pridobljeno 19. 2. 2010 s spletne strani: http://www.ercim.eu/publication/ws-proceedings/DELOS6/rosetta.pdf
13. How much information 2003. (2003). Berkeley: University of California. Pridobljeno 19. 2. 2010 s spletne strani: http://www2.sims.berkeley.edu/research/projects/how-much-info/
14. ISO 12234-2:2001, Electronic still-picture imaging - Removable memory - Part 2: TIFF/ EP image data format. (2001). Geneva: ISO.
15. ISO 12639:2004, Graphic technology - Prepress digital data exchange - Tag image file format for image technology (TIFF/IT). (2004). Geneva: ISO.
16. ISO 14721:2003, Space data and information transfer systems - Open archival information system - Reference model. (2003). Geneva: ISO.
17. ISO 19005-1:2005, Document management - Electronic document file format for long-term preservation - Part 1: use of PDF 1.4 (PDF/A-1). (2005). Geneva: ISO.
18. ISO/IEC 10918-1:1994, Information technology - Digital compression and coding of continuous-tone still images: requirements and guidelines. (1994). Geneva: ISO.
19. ISO/IEC 15444-1:2004, Information technology - JPEG 2000 image coding system: core coding system. (2004). Geneva: ISO.
20. Kanic, I., Leder, Z., Ujcic, M., Vilar, P. in Vodeb, G. (2009). Bibliotekarski terminoloski slovar. Knjiznica, 53 (3/4), 1-374.
21. Kavcic - Colic, A. (1996). Analiza stanja v specialnih knjiznicah v Sloveniji v obdobju 1992-1995. V N. Cesnovar (Ur.), Vloga specialnih knjiznic pri pospesevanju druzbenega in gospodarskega razvoja. Organizacijski, tehnoloski in komunikacijski izzivi v specialnih knjiznicah, 6. posvetovanje Sekcije za specialne knjiznice, ZBDS, Ljubljana, 17. - 18. oktober 1996 (str. 81-95). Ljubljana: Centralna tehniska knjiznica Univerze.
22. Kavcic - Colic, A. (2004a). Teoreticni model digitalnih arhivov. Knjiznica, 48 (4), 63-75.
23. Kavcic - Colic, A. (2004b). Metapodatki za trajno ohranjanje elektronskih virov. Knjiznica, 48 (4), 97-119.
24. Kavcic - Colic, A. in Kragelj, M. (2008). Razvoj digitalnega repozitorija v NUK. V M. Selan, S. Cufer, M. Hartman, S. Macek in M. Jurecic (Ur.), Sistemi za upravljanje z dokumenti, 17. posvetovanje DOK_SIS 2008, Kranjska Gora, 23. 9. 2008. (str. 46-I-54-I). Ljubljana: Media.doc.
25. Kodric - Dacic, E. (2005). Zunaj Gutenbergovega vesolja. Knjiznica, 50 (1-2), 173-186.
26. Lorie, R. A. (2002). The UVC: a method for preserving digital document- proof of concept. Amsterdam: IBM Netherlands.
27. Lupovici, C., Masanès, J. (2000). Metadata for long term preservation. Paris: BNF; Den Haag: Koninklijke Bibliotheek. Pridobljeno 19. 2. 2010 s spletne strani: http://nedlib.kb.nl/results/D4.2/D4.2.htm
28. McGovern, N. Y. (2007). A digital decade: where have we been and where are we going in digital preservation? RLG DigiNews, 11 (1). Pridobljeno 17. 3. 2010 s spletne strani: http://deepblue.lib.umich.edu/html/2027.42/60441/McGovern-Digital_Decade.html
29. Metadata standards framework - preservation metadata. (2002). Wellington: National Library of New Zealand. Pridobljeno 19. 2. 2010 s spletne strani: http://www.natlib.govt.nz/files/4initiatives_metaschema.pdf
30. Novak, M. (2007). Roki hranjenja dokumentarnega gradiva - arhivsko gradivo - nov nastajajoci vmesni arhivi. V M. Selan, S. Cufer, M. Hartman, S. Macek in M. Jurecic (Ur.), Sistemi za upravljanje z dokumenti, 16. posvetovanje DOK_SIS 2007, Kranjska gora, 26.-28. september 2007 (str. VIII-32-VIII-38). Ljubljana: Media.doc.
31. Novak, M. (2002). O arhiviranju spletnih strani ter problemih njihovega varovanja, ohranjanja in uporabe. Knjiznica, 46 (1-2), 61-76.
32. PREMIS Data dictionary for preservation metadata. (2010). Pridobljeno 17. 3. 2010 s spletne strani: http://www.loc.gov/standards/premis/
33. Preservation metadata and the OAIS information model: a metadata framework to support the preservation of digital objects. (2002). Dublin, OH: OCLC/RLG Working Group on Preservation Metadata. Pridobljeno 5. 5. 2004 s spletne strani: http://www.oclc.org/research/projects/pmwg/pm_framework.pdf
34. Reference Model of an Open Archival Information System (OAIS): draft recommended standard: CCSDS 650.0-P-1.1 Pink Book. (2009). Washington: CCSDS. Pridobljeno 19. 2. 2010 s spletne strani: http://public.ccsds.org/sites/cwe/rids/Lists/CCSDS%206500P11/Attachments/650x0p11.pdf
35. Resolucija o Nacionalnem programu za kulturo 2008-2011. (2008). Uradni list RS, st. 35.
36. Steinke, T. (Ur.) (2005-). Long-term preservation metadata for electronic resources (LMER). Frankfurt am Main: Die Deutsche Bibliothek. Pridobljeno 19. 2. 2010 s spletne strani: http://www.d-nb.de/eng/standards/lmer/lmer.htm
37. Thibodeau, K. L. (2002). Overview of technological approaches to digital preservation and challenges in coming years. Pridobljeno 19. 2. 2010 s spletne strani: http://www.clir.org/pubs/reports/pub107/thibodeau.html
38. Trusted digital repostiories: attributes and responsibilities: an RLG-OCLC report. (2002). Mountain View, CA: RLG. Pridobljeno 19. 2. 2010 s spletne strani: http://www.oclc.org/research/activities/past/rlg/trustedrep/repositories.pdf
39. Trustworthy repositories audit & certification (TRAC): criteria and checklist. (2007). Chicago; Dublin (OH): CRL; OCLC. Pridobljeno 19. 2. 2010 s spletne strani: http://www.crl.edu/sites/default/files/attachments/pages/trac_0.pdf
Dr. Alenka Kavcic - Colic je zaposlena v Narodni in univerzitetni knjiznici.
Naslov: Pot na Fuzine 1, 1000 Ljubljana
Naslov elektronske poste: [email protected]
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Copyright Zveza Bibliotekarskih Drustev Slovenije 2010