Povzetek
Javne institucije hranijo pomembne zbirke fizicnih gradiv s podrocja kulture in znanosti. Ze vec kot desetletje se na podoben nacin ukvarjajo s problematiko digitalizacije in zahtevami po traj- nem ohranjanju nastalih e-vsebin. Hkrati je opazno, da je veliko vecja mnozica tistih javnih insti- tucij, ki se se vedno bolj ali manj uspesno ukvarjajo z zacetnimi tezavami pri digitalizaciji gradiv. razlogi za neskladje med enimi in drugimi so lahko v razlicnih dejavnikih, kot so: pomanjkanje znanja informatike, omejena financna sredstva in kadri, ki jih javne institucije lahko namenijo prenosu fizicnih gradiv v digitalni medij, predvsem pa omejeni viri za nujno upravljanje pro- cesov arhiviranja, vzdrzevanje arhiva in zagotavljanje trajne dostopnosti do e-vsebin uporab- nikom. V Narodni in univerzitetni knjiznici se razvija poslovni model, ki bo sorodnim instituci- jam lahko zagotovil uspesno digitalizacijo in oblikovanje lastnih e-zbirk, ki poleg digitalizacije vkljucuje tudi model trajnega ohranjanja in zagotavljanja javnega dostopa do e-vsebin. celotni proces sestavljajo faze, kot so: izbor in priprava fizicnega gradiva, preverjanje avtorskih in drugih upravicenj na gradivu ter oprema digitalnih razlicic publikacij s pripadajoco licenco creative commons, priprava parametrov digitalizacije in bibliografskih podatkov o gradivu, postopek di- gitalizacije gradiva, vkljucevanje bibliografskih podatkov v e-publikacijo, postopek avtomatske razpoznave besedila, arhiviranje gradiva in zagotovitev dostopa do le-tega. Nekatere aktivnosti nastopijo v procesu digitalizacije zgolj v doloceni fazi, druge pa skozi ves »zivljenjski tok« e-pu- blikacije. Zagotavljanje dostopa in trajno ohranjanje morata biti podprti ves cas. V posebnih primerih lahko nastopi potreba po spremembi nekaterih bibliografskih podatkov - npr. licence oz. modalitet dostopnosti. Potreba po spremembi se lahko pojavi zaradi casovne komponente (pretek trajanja licence, publikacija preide v javno uporabo itd.) ali spremenjenega dogovora z nosilcem avtorske in sorodnih pravic. Z uresnicitvijo poslovnega modela zelimo prispevati k ra- cionalizaciji porabe javnih sredstev v ta namen, a hkrati spodbuditi vecjo ponudbo e-vsebin po spletu uporabnikom ter zagotoviti varno trajno ohranjanje e-vsebin. Pomembno je poudariti, da se z digitalizacijo problematika, povezana z ohranjanjem fizicnega gradiva in njegove e-oblike, ne konca, temvec le razsiri iz fizicnega tudi v digitalno okolje.
Kljucne besede: digitalni arhivi, digitalizacija, kultura, digitalne zbirke, upravljanje
Abstract
Public institutions hold important physical collections of materials from the fields of culture and science. For more than a decade, they have been facing the problem of digitization and archiving requirements as a part of the digitization process when generating e-content. They are using more or less the same procedures when they cope with those difficulties. At the same time, we note a much larger set of institutions, which still deal, more or less successfully, with the initial problems of the digitization process. The main reasons for the gap between the two can be found among different factors, including: lack of knowledge in the field of the science in informatics, limited financial and staff resources provided by public institutions, and in particular, limited resources for the preservation management and the archive maintenance sub processes. The National and University Library is developing a business model that will provide a successful implementation of the digitization process with all main sub processes (submission and/or digitization, archiving, dissemination). Thus, the end product for digital preservation and provision of public access to e-content for similar institutions will be ensured.
The main component parts of the digitization process are as follows: selection and preparation of physical collections, determination of access/use restrictions or copyright, application of creative commons license, preparation of project parameters and bibliographic information, digitization, integration of bibliographic data into e-contents, automatic text recognition, archiving and providing access to digitized collections. Some activities, such as access and long-term preservation, need to be ongoing throughout all the phases of the digitization workflow, whereas some of them can be traced only in individual phases of the process. In special cases, it might be necessary to change some bibliographic data, i.e. license terms and conditions or access modality. The digital copy status can change over time (expiration of licence, the digitized materials fall in the Public Domain) or by modification of agreement with the copyright holder.
By implementing a business model, we wish to contribute to the rationalization of the use of public funds for this purpose, but at the same time, to encourage a greater scope of online available e-content and to ensure a safe digital preservation of e-content material. It should be pointed out that the problems, related to long-term preservation of physical collections and their digital representation are not terminated by the digitization process, they are only expanded from the physical to digital environment.
Keywords: digital archives, digitization, culture digital collections, management
1 Uvod
Potreba po digitalizaciji gradiva, z namenom ohraniti kulturno dediscino prihodnjim rodovom, se je v devetdesetih letih prejsnjega stoletja kazala skozi nacrtovanje in uresnicevanje posameznih projektov, katerih rezultat so zakljucene tematske zbirke. Digitalizirani so manjsi korpusi posameznih zvrsti gradiva oziroma gradiva dolocene tematike, skeniranega v visoki locljivosti, visoki barvni globini ter opisanega z bogatim naborom bibliografskih podatkov. Knjiznice so se obicajno odlocale za posebej vredno gradivo, torej gradivo, izrednega pomena ne le za institucijo, ampak tudi celotno druz- bo. Ceprav je bilo na ta nacin mogoce uporabniku ponuditi digitalne objekte, ki so zelo natancna kopija izvirnikov, so vlozeni cas, porabljena financna sredstva in drugi viri za izvedbo projekta prav tako omejevali kolicino gradiva, ki je bila lahko digitalizirana (Sutton, 2012).
Po tradicionalnem umevanju knjiznico sestavljajo tri podrocja/dimenzije: skladiscni prostor, prostor za uporabnike in upravno obmocje. Kljucna razlika med digitalno in klasicno knjiznico ni v njeni pojavni obliki. Digitalna knjiznica ni zgolj virtualna po- doba klasicne knjiznice. H. Hobohm (2012) navaja, da digitalna knjiznica tradicional- no knjiznico razsirja, dodaja ji cetrto dimenzijo. Ponuja ne le informacije o publikaciji ampak tudi povezave med katalogom in publikacijo ter zagotavlja dostop do same publikacije, obicajno prek oddaljenega dostopa. Spletni uporabniki zato postanejo cetrto obmocje knjiznice, znacilno le za digitalno knjiznico. r. Maurya (2011) podaja opredelitev digitalne knjiznice kot zbirke dokumentov, v organizirani digitalni obliki, ki je dostopna po (spletnem) omrezju.
K. Tharani (2012) ugotavlja, da se v drzavah severne Amerike, v visokosolskih knjizni- cah, se vedno zaznava povecana potreba po digitalizaciji. Vendar smo se vedno prica dejstvu, da je digitalizacija vezana na posamezne projekte namesto integrirana med redne storitve knjiznice.
Gracy in Kahn (2012) povzemata po croft (2003), da je digitalna tehnologija v poveza- vi z ohranjanjem gradiva predvsem vplivala na zamenjavo medija - mikrofilma, ki je bil tradicionalna metoda preformatiranja tiskanih publikacij, predvsem serijskih, zelo malo pozornosti pa je bilo posvecene razvoju teorije in tehnik bodisi za ohranjanje i zvorno digitalnih publikacij, bodisi digitaliziranih, ki so nastale kot konverzija ana- lognih medijev. V zelo kratkem casu se je strokovno mnenje spremenilo - digitalizacija ni vec zgolj orodje v razvoju, temvec pogosto prva izbira med metodami preformati- ranja gradiva. Avtorja ugotavljata, da se knjiznice lotevajo izdelave uporabniskih kopij (surogatov) tiskanega gradiva iz razlicnih razlogov, kot so npr:
* zascita izvirnikov pred propadanjem
* zamenjava izvirnikov, ce poslabsanje fizicnega stanja ogroza uporabnost gradiva
* boljsa dostopnost gradiva, ki jo dosezemo z uporabo novih tehnologij (npr. bolj ucinkovito iskanje po gradivu zaradi moznosti Ocr-postopka, povecava detajlov gradiva itd.).
conway (2010) je previdno opredelil »digitalizacijo za ohranjanje kot nalozbo v ustvar- janje trajnih digitalnih izdelkov« in ne zgolj kot nacin ohranjanja ogrozenih publika- cij. Hurst-Wahl (2009) predlaga, da naj stroka razmisli o razvoju splosnih smernic, ki bi bile vodilo pri izbiri gradiva za digitalizacijo, oblikovanju in uporabi metapodatkov- nih shem, postopkov skeniranja in preverbe kakovosti ter nacrta trajnega ohranjanja digitalnih vsebin. Standardizacija bi imela pozitiven ucinek pri poenotenju izvajanja postopkov digitalizacije in bi okrepila interoperabilnost na tem podrocju. Omeniti ve- lja, da je bila v Narodni in univerzitetni knjiznici leta 2012 sprejeta »Strategija trajnega ohranjanja digitalnih virov v Narodni in univerzitetni knjiznici« (Kavcic-Colic, 2012), leta 2013 pa je minister za kulturo sprejel »Smernice za zajem, dolgotrajno ohranjanje in dostop do kulturne dediscine v digitalni obliki«, ki so sad skupnih naporov celotne- ga kulturnega sektorja.1 Zmotno je misljenje, da digitalizacija resuje vsa odprta vpra- sanja, povezana z ohranjanjem fizicnega gradiva, kakor tudi, da digitalizacija niza ceno hrambe gradiva. Kacy L. guill (2009) skrbi vidik umikanja fizicnega gradiva. gradivo, ki zaradi zagotovljenega dostopa do elektronskega nadomestka ni vec nujno potrebno na lokaciji, kjer se je nahajalo, se seli v manj primerne prostore (npr. kleti), saj zelimo uporabnikom ponuditi vecje udobje znotraj ustanov. S tem, ko gradivo selimo v manj primerne prostore, sprozamo dve pasti. Prvic - gradivo je manj varovano, predvsem pred zunanjimi vplivi, kot je npr. poplava, in drugic, cas dostopa do gradiva je daljsi. glede zagotavljanja trajnega dostopa do e-gradiva, pa se pojavlja se vidik potrebnih stroskov za zanesljivo delovanja tega servisa.
2 Primeri metodologij
Zadnja leta je glavni igralec na trgu digitalizacije knjiznicnih fondov podjetje google. Knjiznice so postavljene pred izziv - zagotoviti dostop do zahtevnejsega gradiva s po- stopki skeniranja, opticne razpoznave, indeksiranja in spletne ponudbe uporabnikom (gracy in Kahn, 2012). Zaradi razvoja informacijske tehnologije so knjiznicam odprte nove poti za digitalizacijo gradiva, ki je bilo dolga leta »skrito« oziroma ga je bilo ne- mogoce pretvoriti v elektronsko obliko in ponuditi uporabnikom. Med razloge uvrsca- mo pomanjkanje dokumentacije, zastarele formate, slabo stanje gradiva in druge ovire (Benson, 2009; evens in Hauttekeete, 2009). Knjiznice in arhivi imajo danes moznost da s sodelovanjem zberejo gradivo istega izvora (provenience), ki se nahaja oz. je v lasti razlicnih institucij. Taksno prizadevanje lahko opisemo kot virtualna zdruzitev.
Prav tako, kot imamo v ospredju uporabnika pri zagotavljanju storitev klasicne, tra- dicionalne knjiznice, velja analogija v digitalnem okolju. T. K. Huwe (2012) ugotavlja, da je bil se nedolgo nazaj dober knjiznicar tisti, ki je bil pred uporabnikom v smislu predvidevanja njegovih potreb in ucinkovite uporabe tehnicnih moznosti dostopa do informacij. Stanje se je obrnilo. Uporabniki so postali bolj vesci uporabe spletnih iskal- nih orodij ter se hitreje prilagajajo novim storitvam. Hkrati ko te storitve s pridom in v polni meri uporabljajo, povsod pricakujejo se moznost interakcije in uporabe oblacnih storitev, tudi v knjiznicah. Na sreco so storitve zasnovane tako, da jih je mogoce in- tegrirati in ponuditi uporabnikom tudi znotraj servisov digitalne knjiznice. Vseckanje, komentiranje, vkljucevanje dinamicnih komponent, kot je npr. Facebook, Twitter, You- Tube, so elementi, za katere uporabnik pricakuje, da so podprti tudi v spletnem okolju knjiznice. Hkrati se zdi, da se vedno bolj brise meja med uporabnikom in knjiznicarjem pri oblikovanju storitev spletnega okolja.
K. Tharani (2012) navaja, da je zdruzenje digitalnih knjiznic (Digital Library Federation (DLF)) razvilo storitveno ogrodje (service framework) za digitalne knjiznice z namenom vpogleda v razlicne postopke in dejavnosti znotraj knjiznic ter njihovo transformacijo v modularne servise za podporo procesov digitalizacije. Akademske knjiznice na po- drocju severne Amerike so lahko zaradi napredka pri razvoju informacijskih tehnologij na novo zasnovale digitalizacijo, kot del knjiznicne dejavnosti. Iz digitalizacij, ki so bile nacrtovane in izvajane v sklopih razlicnih projektov, jim vpeljava storitvenega ogrod- ja omogoca podporo procesov digitalizacije znotraj knjiznicne dejavnosti. Ogrodje je sestavljeno iz sedmih glavnih, krovnih procesov, ki jih podpira enainstirideset funkcij. Med glavne procese stejemo: nacrtovanje, razporejanje virov, digitalizacijo, metapo- datkovno opisovanje, arhiviranje/oddaja, dostop, upravljanje. entitete, ki nastopajo v procesih in funkcijah, izhajajo iz referencnega modela OAIS, (Open Archival Informa- tion System) (ISO 14721, 2012) kar pomeni, da gre za implementacijo tega modela v prakso. referencni model OAIS podpira tri glavne procese, ki so zajem, ohranjanje in zagotavljanje dostopa do objektov.
Kot primer koraka v smeri platforme, ki pokriva arhiviranje in zagotavljanje dostopa, velja omeniti »sodelovalno« digitalno knjiznico NeUMA (rigaux et al., 2012). gre za di- gitalno knjiznico, posveceno objavljanju elektronskih notnih zapisov. Odprta in name- njena je ne le specialistom muzikologom, temvec tudi drugim glasbenikom in glasbe- nim pedagogom. Digitalna knjiznica sestoji iz repozitorija, namenjenega shranjevanju velikih zbirk notnih zapisov, kjer uporabniki (fizicni uporabniki ali aplikacijski vmesniki) oddajajo publikacije. Sistem ponuja storitveno orientirano arhitekturo (SOA)2 za ob- javo gradiva, belezk, poizvedb, transformacij in analizo shranjenih objektov - notnih zapisov. Dolgorocni namen projekta je zagotoviti odprt virtualni prostor skupinam uporabnikov, ki zelijo shranjevati in deliti zbirke glasbenih vsebin. cilji, ki bodo s tem dosezeni, pa so: podpora znanstveni objavi vsebin z bolj specialnih podrocjih kulturne dediscine, ki bi bili sicer tezko dostopni, razvoj in vzdrzevanje zbirke glasbenih del, z moznostmi, ki jih ponuja informacijska tehnologija (brskanje, preiskovanje, moznost analize zvocnih zapisov, bogatenje z novimi metapodatki itd.).
Kot primer omejevanja stroskov razvoja in vzdrzevanja digitalnih knjiznic je na voljo primer iz Zdruzenih drzav. Wu (2011) ugotavlja, da je v ZDA priblizno dvesto akrediti- ranih sol s podrocja prava (American Bar Association),3 skupni letni strosek za razvoj in vzdrzevanje digitalnih knjiznic ocenjujejo na vec kot 230 milijonov dolarjev. Pomenlji- vo je dejstvo, da je med dostopnimi publikacijami precejsnje stevilo duplikatov, tudi med tistimi gradivi, ki so redko uporabljeni. Avtorica predlaga za vzor drzavo Florida, ki je znizala stroske z uvedbo razvoja zbirke na drzavni ravni, splosne knjiznice pa so prevzele centralizirane oblike gradnje zbirk. Avtorica prispevek zakljuci z nastevanjem pozitivnih strani centralne digitalne knjiznice. Omenja sirsi dostop do informacij, za- gotavljanje trajnega ohranjanja vsebin, nadzor nad obliko in formatom vsebine. Z za- gotavljanjem vec in boljsih informacij uporabniku, le-tega scitimo pred morebitnim izkrivljanjem informacij. Ce namrec drzi, da uporabniki tezijo k spletnim virom, mora- mo poskrbeti, da imajo tam moznost dostopa do enakih informacij kot v tiskani obliki, in ne zgolj do tistih, ki so uporabniku lazje dostopne. Dovolj je razprave o knjiznici prihodnosti, cas je za njen razvoj.
K. Tharani (2012) ugotavlja, da pomenijo najvecji izziv pri sodelovanju v procesih digi- talizacije druzbeni vidiki. Le-ti so pomembnejsi od tehnicnih. Ze na institucionalni rav- ni je potreba po sodelovanju osebja v procesih digitalizacije razlicnih oddelkov vecja kot obicajno. Odnosi postanejo se kompleksnejsi, ko se v digitalizacijo vkljuci vec par- tnerjev, iz razlicnih institucij, razlicnih tako po velikosti, tipu in lokaciji. Z upostevanjem razlik lahko dosezemo bolj raznovrsten rezultat (zbirko digitaliziranega gradiva), pove- camo stopnjo ucinkovitosti procesov in pridobimo dodatne vire financiranja.
Spletno okolje 2.0 je omogocilo aktivno vlogo subjektov (uporabnikov) v spletnem okolju. Poleg nekaj primerov, navedenih kot primer dobre prakse, so pomembne se najvecje in najbolj razsirjene implementacije orodij, ki ponazarjajo znacilno obliko ak- tivne vloge posameznika v spletnem okolju. To so npr. Wikipedia (organizacija znanja), Flicker (fotografsko gradivo), iTunes (zvocne vsebine), YouTube (video vsebine).
3 Potreba po procesu digitalizacije
Ce povzamem po Maurya, r. (2011), in okolje omejim na dejavnost knjiznic, lahko oce- nim, da knjiznice digitalizirajo knjiznicno gradivo, ker so se vedno prepricane o trajni vrednosti teh virov za ucenje, raziskovanje, poucevanje, dokumentiranje in izvajanje javne sluzbe. razlogi za prehod na digitalno obliko so med ze prej navedenimi tudi:
* dostop do dokumentov brez poskodb izvirnika
* potrebe nove generacije
* vecja stroskovna ucinkovitost digitalnih knjiznic
* izboljsane moznosti iskanja vsebin tradicionalne knjiznice
* podpora obstojecim funkcijam knjiznice
* ekologija: digitalna knjiznica ohranja okolje, ker porabi manj papirja in omejuje uporabo okolju skodljivih snovi.
Med izzive pri procesu digitalizacije gradiva v knjiznicah r. Maurya (2011) posebej omenja predvsem naslednje:
* pomanjkanje tehnicnega osebja
* avtorska in sorodne pravice
* tehnoloske spremembe
* varnost podatkov
* nezadostno financiranje in pomanjkljiva infrastruktura
* eksponentna rast kolicine ustvarjenega (e-)gradiva na internetu.
Ceprav se potrebe in izzivi pri ustvarjanju e-vsebin s postopki digitalizacije, omenjeni v tem prispevku, navezujejo na Indijo, so na drugi strani sveta - v ZDA, prav tako brez jasnih odgovorov. Teper in Shaw (2011) opazata, da so se knjiznice po svetu zacele aktivno ukvarjati z mnozicno digitalizacijo. Ceprav dolgorocni ucinki mnozicne digi- talizacije se niso jasni, knjiznice vpeljujejo in izvajajo digitalizacijo pri rednem delu.
Razlika med »buticnimi« projekti digitalizacije, torej tistimi, ki se vecinoma izvajajo v knjiznicah oz. pri zunanjih izvajalcih, in projekti mnozicne digitalizacije (Mass Digitiza- tion Projects), kot so npr. google Books,4 the Open content Alliance5 in Million Book Project,6 je predvsem v zagotavljanju ucinkovite porabe casa in denarja za doseganje cilja. Hitrejsi potek dela (workflow) botruje nizji ceni po skenogramu ter posledicno vecji kolicini digitaliziranega gradiva.
Drugacno opredelitev digitalizacije ponujajo Katz, Koutroumpis in callorda (2014). Po- leg splosno sprejete in veckrat omenjene razlage, da gre za proces prenosa analogne informacije v digitalno obliko, avtor to razsirja in pravi, da je v sirsem druzbenem kon- tekstu digitalizacija opredeljena kot ekonomska in socialna transformacija, povzroce- na z mnozicnim sprejemom digitalnih tehnologij, ki so osnova ustvarjanja, obdelave, razsirjanja in deljenja informacij. V clanku avtor uporabi indeks digitalizacije kot merilo napredka, ki ga dosega evropa pri implementaciji Digitalne agende (Digitalna agenda za evropo).7
Digitalizacija mora biti razprsena, da bi lahko pomembno vplivala na znotraj gospo- darske in druzbene strukture naroda. Za to mora biti sprejeta na treh ravneh:
* izkoriscena s strani posameznikov, gospodarskih podjetij in druzb, vgrajena v procese proizvodnje dobrin in storitev ter vkljucena v izvajanje javnih sluzb
* biti mora vseprisotna - dosegljiva cim vec prebivalcem na nacionalni ravni
* biti mora zanesljiva, zagotavljati mora zadostno zmogljivost za prenos velike kolicine informacij ob zahtevanih hitrostih.
Indikatorji, ki jih je avtor uporabil za oblikovanje indeksa digitalizacije, so: cenovna do- stopnost digitalizacije, nalozbe v infrastrukturo, dostopnost omrezja, zmogljivost omrezja, uporaba, cloveski kapital. Indikatorji skupaj vsebujejo se 24 podindikatorjev oz. kom- ponent. Kot je razvidno iz Slike 1, je Slovenija uvrscena zelo visoko, med razvitimi dr- zavami. Avtor postavlja cenovno dostopnost kot kljucni element za dosego dobrega rezultata. Prav tako pomembna pa je ugotovitev, da se lahko drzave z veliko visoko izobrazenimi zaposlenimi hitro prilagodijo spremembam in uporabi novih orodij in tako dohitijo vodilne. Drzave evrope zaostajajo zgolj za severno Ameriko, ob tem, da imajo zelo slab indikator - nalozbe v infrastrukturo. Po drugi strani pa so drzave evrope najboljse pri zagotavljanju cenovne dostopnosti.
Katz, Koutroumpis in callorda (2014) drzave razdelijo v stiri skupine: razvojno omejene, v razvoju, prehodne in napredne - vse v smislu ravni razvoja pri procesih digitalizacije.
4 Upravljanje digitaliziranih zbirk
Orodij za upravljanje digitalnih zbirk, ki nastanejo v procesu digitalizacije, je mnogo. Na voljo so tako komercialne kot odprtokodne resitve. Skupina avtorjev (Kamble, raj in Sangeeta, 2012) ugotavlja, da so v zadnjih letih prav odprtokodni produkti pozeli veliko zanimanja v knjiznicnih krogih. Po eni izmed opredelitev je odprtokodna pro- gramska oprema8 programska oprema, za katero je izvorna koda objavljena pod za- scitno licenco (ali pogojem, kot npr. javna domena), ki ustreza kriterijem odprtokodne definicije. Ta dovoljuje vsakrsno uporabo in spreminjanje programske opreme, njeno razsirjanje v spremenjeni ali nespremenjeni obliki. Velikokrat jo razvijajo v javnosti, s prispevki drugih.
Knjiznice se spoprijemajo s podobnimi izzivi pri zajemu (digitalizaciji), ohranjanju in dostopnosti e-vsebin, zato je pricakovanje, da »nekje ze obstaja programska resitev, prosto dostopna, ki bi bila za nas uporabna« povsem na mestu. Opozoriti je treba le, da je pri komercialnih produktih garancija in tehnicna pomoc zagotovljena (strosek je navadno vkljucen v ceno nakupa, najema), pri odprtokodnih produktih pa se pojavi odvisnost od razvijalcev, ki so zaposleni v knjiznici oz. drugi sorodni instituciji, sicer je organizacija prisiljena iskati razvojno moc na trgu ali v skupnostih, ki so produkt razvile.
Kamble, raj in Sangeeta (2012) med orodji za upravljanje digitalnih zbirk omenjajo: Koha,9 Newgenlib,10 OpenBiblio,11 Avanti,12 greenstone,13 Dspace,14 e-Prints15 in Fedora.16
Omenjena programska orodja so vecinoma pripravljena za takojsnjo uporabo, a je pri gradnji vecjih korpusov razlicnega tipa podatkov potreben razvoj dodatnih uporabni- skih in aplikacijskih vmesnikov za dosego avtomatizacije in s tem nizje cene upravlja- nja enote gradiva.
Z repozitoriji, namenjenimi shranjevanju digitalnih vsebin, publikacij, smo v Narodni in univerzitetni knjiznici v stiku ze vec kot desetletje. Avtorji clanka »Digital repositori- es ten years on: what do scientific researchers think of them and do they use them?« (Nicholas et al. 2012) na zacetku besedila ugotavljajo, da ceprav so tovrstni sistemi ze vrsto let prisotni v nasih krogih in ceprav je bilo na temo uporabe prelitega veliko crnila ter je bilo mnogo konferenc, zelo malo vemo o tem, kako univerzitetni ucitelji uporabljajo te sisteme. V raziskavi so se avtorji dotaknili treh vrst repozitorijev, in sicer:
* institucionalnih (navadno vsebujejo razlicne vsebine, pridobljene znotraj institucije),
* tematskih (zbiranje je osredotoceno na tematiko, navadno vsebujejo dela vec insti- tucij, praviloma so mednarodni),
* doloceni s tipom, formatom (npr. disertacije, raziskovalni podatki)
V mednarodno raziskavo so vkljucili 85.000 elektronskih naslovnikov. Vsega so pre- jeli pribl. 2 % odgovorov, vecinoma od raziskovalcev tehnicnih ved. Med odgovori je opaziti, da prevladujejo institucionalni in tematski repozitoriji, med tistimi, ki oddajajo konkretne vsebine, je najvec objavljanja znanstvenih clankov. Ce imajo avtorji moz- nost, najraje oddajo gradivo v tematski repozitorij. Med moznimi odgovori na vprasa- nje o smislu oddaje gradiv v repozitorije prevladuje odgovor, da je najpomembnejse zagotavljanje javne dostopnosti gradiv.
5 Digitalna knjiznice slovenije in moznosti razsiritve
Digitalna knjiznica Slovenije17 (v nadaljevanju dLib.si) je spletni portal, knjiznica na spletu, ki je na voljo vsem - kadarkoli in kjerkoli. Poleg digitalnih vsebin, ki so nastale s sredstvi in iz gradiva Narodne in univerzitetne knjiznice, vsebuje spletno mesto knji- znice tudi gradiva drugih organizacij.18 Digitalne vsebine teh organizacij niso v lasti Narodne in univerzitetne knjiznice, ta le skrbi za njihovo dostopnost prek Digitalne knjiznice Slovenije. Spletno mesto ponuja uporabnikom digitalne vsebine v ogledni locljivosti, medtem, ko lastniki gradiva hranijo visoko locljive skenograme na svoji lo- kaciji. Na Sliki 2 prikazuje tortni prikaz delezev oddanih gradiv v dLib.si. Ustanove z najvec oddanega gradiva so:
* Narodna in univerzitetna knjiznica (424.565)
* Mestna knjiznica Ljubljana (89.028)
* Knjiznica Ivana Potrca (17.305)
* Osrednja knjiznica celje (14.869)
* Univerzitetna knjiznica Maribor (9.315).
Vseh partnerjev, ki so oddali gradivo na dLib.si, je bilo maja 2014 297. Sto organizacij, ki so oddale najmanj gradiva na spletni portal, je skupaj oddalo zgolj 324 publikacij.
Na Sliki 3 je prikazano razmerje med stevilom oddanih publikacij na portal, aritmetic- no sredino stevila oddanih publikacij ter standardnim odklonom. Na abscisi je podan indeks knjiznice (manjsi indeks prikazuje knjiznico, ki je oddala vec gradiva), na ordi- nati pa stevilo oddanih publikacij. V grafu ni zajete Narodne in univerzitetne knjiznice. Ustanove in partnerji (253-297) so oddali zgolj po eno publikacijo. Na grafu je podana se aritmeticna sredina (rdeca barva) in standardni odklon (zelena barva). Iz grafa in sta- tisticnih kazalnikov (aritmeticna sredina in standardni odklon) je opaziti, da so velike razlike v kolicini oddanega gradiva partnerskih organizacij.
Na sliki 4 je prikazan graf, na katerem so organizacije, ki oddajajo gradivo na dLib.si, razen najvecjih deset, ki prispevajo najvec gradiva (pribl. 90 %). Ceprav sem umaknil partnerje, ki oddajo najvec gradiva, statisticna kazalca (aritmeticna sredina in standar- dni odklon) se vedno kazeta, na velike razlike med partnerji.
5.1 Trajno ohranjanje publikacij
V raziskavi, opravljeni v podjetju gartner, ki se ukvarja z raziskavami na podrocju infor- macijske tehnologije in svetovanjem, so ugotovili, da strosek razvoja informacijskega sistema obsega zgolj 8 % celotnih stroskov, v primeru, da bomo informacijski sistem uporabljali petnajst let. 92 % obsega vzdrzevanje sistema. Med vzdrzevanje stejemo tudi nadaljnji razvoj funkcionalnosti, odpravljanje tezav, posodabljanje sistema itd.
celotna digitalna zbirka Narodne in univerzitetne knjiznice presega 50 TB (terabajtov) podatkov. V to niso vkljucene varnostne kopije, zrcalne slike itd. V tem primeru bi bilo podatkov vsaj se dva- do trikrat toliko. Ponazorjeno s sliko (slika 5), to pomeni 71 me- trov v visino zlozenih cD-plosckov. Za primerjavo - Ljubljanski Neboticnik je visok 70 metrov.
Izhajajoc iz statistike spletnega mesta dLib.si, je podana informacija o kolicini gradiv na dLib.si, stevilu subjektov, ki so gradivo oddali, povprecje stevila oddanih vsebin na organizacijo in standardni odklon, ki kaze, ogromne razlike v kolicini oddanega e-gra- diva na portal. Pricakovanje, da bo imela vsaka ustanova, ki ustvarja e-vsebine (digita- lizira gradivo), moznost obvladovati procese digitalizacije v najsirsem smislu v skladu z standardom OAIS, je nerealno.
Na sliki 6 je prikazanih zgolj nekaj nakljucnih terminov iz procesov digitalizacije. Orga- nizacija, ki zeli podpreti vse potrebne procese na podrocju digitalizacije, mora skrbe- ti za njihovo trajno upravljanje, za razvoj novih, spreminjanje obstojecih in ukinjanje zastarelih. Ob tem se zastavljata vprasanji:
* Ali ima organizacija na voljo dovolj virov (financnih, kadrovskih) za obvladovanje pro- cesov digitalizacije po standardih in priporocilih dobrih praksah?
* Ali je smiselno glede na kolicino e-gradiva, ki ga poseduje, vlagati v razvoj in vzdrzeva- nje potrebnih informacijskih sistemov?
Kot je zapisano v uvodu - se vedno smo prica precejsnjemu obsegu digitalizacije, ki nastaja znotraj casovno in z viri omejenih projektov. Po koncanem projektu se nosilec projekta spoprime z vprasanjem financiranja in vzdrzevanja rezultatov projekta (digi- taliziranega gradiva).
5.2 Moznost izvedbe modela za resitve problematike arhiviranja
V javnih ustanovah, ki uporabljajo spletni portal dLib.si za oddajo gradiva, je stanje naslednje:
* 640.925 publikacij je dostopnih na dLib.si
* prispevalo jih je 297 partnerjev (vkljucno z NUK)
* 2.158 enot je povprecna vrednost oddanih gradiv na partnerja
* 1,3 % partnerjev je oddalo vec kot 10.000 objektov (publikacij)
* 4 % ustanov presega povprecno vrednost publikacij na dLib.si (oddali vec kot 2.158 publikacij).
Po vzoru ze omenjenih pristopov (npr. Tharani, 2012; rigaux et al., 2012; Wu, 2011), upravljavec portala, Narodna in univerzitetna knjiznica, predlaga razvoj modela za upravljanje procesov trajnega ohranjanja kulturnih in raziskovalnih publikacij znotraj enotnega sistema. Za popolno obvladovanje procesov ustvarjanja e-vsebin (digitaliza- cije, npr. po modelu OAIS) v najsirsem obsegu, je treba posebno pozornost nameniti trajnemu ohranjanju publikacij: izbiri arhivskih formatov, izbiri trajnih identifikatorjev, varnemu prenosu podatkov, preverjanju avtenticnosti in verodostojnosti podatkov, lo- kaciji shranjevanja, varnostnemu kopiranju, duplikaciji (redundancni kopiji), izvajati je treba scenarije povrnitve podatkov iz sekundarnega medija itd.
Narodna in univerzitetna knjiznica je v letu 2009 pridobila nov racunalniski center in komunikacijsko vozlisce, ki je eden kljucnih pogojev za trajno in varno ohranjanje digi- talnega gradiva. CKot glavne arhitekturne znacilnosti velja omeniti naslednje:
1. visoka razpolozljivost (vec kot 99,65 %)
Na letni ravni to pomeni maksimalno 30 ur izpada (predvidenega in nepredvide- nega skupaj), pri tem pa posamezni poseg vzdrzevanja ne sme trajati vec kot 5 ur. Sistemi vsebujejo redundancno napajanje celotnega sistema (UPS, neprekinjeno napajanje). Prostor je hlajen redundancno. Nadzor centra poteka z nadzornim sis- temom, kjer se poleg okoljskih parametrov nadzira tudi delovanje strezniske infra- strukture. Za preverjanje pristopa je na voljo vec razlicnih in neodvisnih sistemov vstopa, kar zagotavlja visoko varnost in razpolozljivost podatkov in storitev. Za vse kljucne komponente sistema je NUK podpisal ustrezne pogodbe o zagotavljanju servisiranja in vzdrzevanja s tipicnimi odzivnimi casi pod 1 uro.
2. Rezervna lokacija
Sistem zagotavlja redundancno - rezervno lokacijo z redundantno opticno povezavo.
3. strezniki in diskovna polja, varnost podatkov
NUK uporablja virtualizirani sistem (VMWAre, HYPer-V ) z dinamicnim dodeljeva- njem pomnilniskega in procesorskega prostora.
Komponente diskovnega polja so podvojene, z namenom odpraviti SPOF (single point of failure), mozen je priklop vec tipov diskov hkrati (SSD, Fc, SATA), redundan- ca na diskovnih poljih (rAID), mozna menjava diskov med delovanjem (hot-swap), krmilnikov, vmesnikov, predpomnilnika, napajalnika, ventilatorjev, baterijska zasci- ta predpomnilnika. Na voljo je skladisce (sef ) za varovanje zunanjih medijev arhiva (npr. tracnih medijev), zunanjih diskov. Sistem, je varen pred vlomi in pozari ter se ponasa s standardi, kot so »en14450, S 120 P, eN 1047-1«.
6 Zakljucek
V racunalniskem centru NUK je mogoce zagotavljati trajno ohranjanje razlicnih tipov in formatov publikacij. Digitalna knjiznica Slovenije skrbi za zagotavljanje dostopa og- lednih kopij gradiva uporabnikom. Strojna oprema v NUK-u skrbi za trajno varovanje in ohranjanje gradiva. Odprtokodna platforma Fedoracommons in posebej razviti aplika- cijski vmesniki skrbijo za varno oddajo gradiva (oglednih in arhivskih kopij, bibliograf- skih in tehnicnih metapodatkov).
S prikljucitvijo in uporabo sistema v NUK-u lahko javni zavodi, druge organizacije, drustva itd. gradivo varno oddajo, urejajo in zagotavljajo dostop svojim uporabnikom. Z vidika porabe je mogoce vecino javnih sredstev iz razvoja in vzdrzevanja informa- cijskih sistemov znotraj institucij preusmeriti v ustvarjanje digitalnih vsebin. Za enaka sredstva je uporabnikom na voljo vec gradiva - dostopnega znanja.
Potrebno je poudariti, da je koncept oz. poslovni model zdruzevanja postopkov oz. procesov digitalizacije in trajnega ohranjanja gradiva sele nujno potrebna platforma, potreben pogoj za vzpostavitev moznosti upravljanja podatkov. Za vzor so lahko npr. rezultati projektov KeeP19 in ScAPe.20 Naloge, s katerimi se ukvarjajo severne sosede Slovenije, presegajo vzpostavitev ogrodij za trajno ohranjanje vsebin - ti procesi so ze vec let vtkani v organizacijske sisteme institucij. Izzivi, ki prihajajo na povrsje, so pred- vsem analiza in povezovanje podatkov, avtomatizacija procesov, ustvarjanje dodane vrednosti iz podatkov, emulacije starejsih racunalniskih sistemov (c64, Atari, Amstrad, itd)21 z namenom dostopati do informacij oz. vsebin, ustvarjenih v prejsnjih desetletjih.
1 http://nio.gov.si/nio/cms/download/document/bbf2216a1e2283d7c1a5fb57e4fa455e5560634f- 1390917025213 , pridobljeno 13. 5. 2014.
2 http://en.wikipedia.org/wiki/Service-oriented_architecture, pridobljeno 12. 5. 2014.
3 http://www.americanbar.org/aba.html, pridobljeno 13. 5. 2014.
4 http://books.google.com/, pridobljeno 20. 5. 2014.
5 http://www.opencontentalliance.org/, pridobljeno 20. 5. 2014.
6 http://www.ulib.org/index.html, pridobljeno 20. 5. 2014.
7 http://ec.europa.eu/digital-agenda/digital-agenda-europe, pridobljeno 21. 5. 2014.
8 Odprtokodna programska oprema, http://sl.wikipedia.org/wiki/Odprtokodna_programska_oprema, pridobljeno 20. 5. 2014.
9 Koha, http://www.koha.org/, pridobljeno 21. 5. 2014.
10 Newgenlib, http://www.verussolutions.biz/web/, pridobljeno 21. 5. 2014.
11 OpenBiblio, http://obiblio.sourceforge.net/, pridobljeno 21. 5. 2014.
12 Avanti, http://schlaraffiamilwaukia.com/, pridobljeno 21. 5. 2014.
13 greenstone, http://www.greenstone.org/, pridobljeno 21. 5. 2014.
14 Dspace, http://www.dspace.org/, pridobljeno 21. 5. 2014.
15 e-Prints, http://www.eprints.org/, pridobljeno 21. 5. 2014.
16 Fedora commons, http://fedorarepository.org/, pridobljeno 21. 5. 2014.
17 Digitalna knjiznica Slovenije, http://www.dlib.si, pridobljeno, 22. 5. 2014
18 Partnerji na dLib.si, http://www.dlib.si/menu/sodelovanje#submenu-442, pridobljeno 22. 5. 2014
19 http://www.keep-project.eu/ezpub2/index.php, pridobljeno 10. 6. 2014.
20 http://www.scape-project.eu/, pridobljeno 10. 6. 2014.
21 http://liber2014.univie.ac.at/fileadmin/user_upload/DOeVL_events/Kongressfiles/2014-05-20 LIBerworkshop_emulation_en_kb.pdf , pridobljeno 10. 6. 2014.
Navedeni viri
Benson, A. c. (2009). Killed Negatives: The Unseen Photographic Archives. Archivaria, st. 68, 1-37.
conway, P. (2010). Preservation in the Age of google: Digitization, Digital Preservation, and Dilemmas. Library Quarterly 80 (1), 65.
croft, J. A. (2003). The Preservation evolution: A review of Preservation Literature, 1999-2001. Library Resources & Technical Services, 47(2), 59-70.
evens, T. in Hauttekeete, L. (2009). Unlocking Audio: Towards an Online repository of Spoken Word collections in Flanders. D-Lib Magazine, 15(5/6). Pridobljeno 15. 6. 2014 s spletne strani: www.dlib.org/dlib/may09/evens/05evens.html
gracy, K. F. in Kahn, M. B. (2012). Preservation in the Digital Age. Library Resources & Technical Services, 56(1), 25-43.
guill, L. L. (2009). Arguing for Space in an User-Focused environment. Library & Archival Security, 22(2), 115-123.
Hobohm, H. (2012). can Digital Libraries generate Knowledge?. Historical Social Research, 37(3), 218-229.
Hurst-Wahl, J. (2009). Digitization: How Many Best Practices, guidelines, and Standards Do We Need? Information Standards Quarterly, 21(4), 22-24.
Huwe, T. K. (2012). New Technology, New Workflows, New Ways to collaborate. Computers in Libraries, 32(3), 20.
ISO 14721:2012, Space data and information transfer systems - Open archival information system (OAIS) - reference model. geneva: ISO.
Kamble, V. T. in raj, H., in Sangeeta, S. (2012). Open Source Library Management and Digital Library Software. DESIDOC Journal of Library & Information Technology, 32(5), 388-392.
Katz, r., Koutroumpis, P. in callorda, F. (2014). Using a digitization index to measure the economic and social impact of digital agendas. Info, 16(1), 32-44. doi:10.1108/info-10-2013- 0051
Kavcic-Colic, A. (2012). Strategija trajnega ohranjanja digitalnih virov v Narodni in univerzitetni knjiznici : : 2012-2020 / pripravila Alenka Kavcic-Colic ; sodelavci Melita Ambrozic ... [et al.]. Ljubljana : Narodna in univerzitetna knjiznica.
Maurya, r. (2011). Digital Library and Digitization. International Journal Of Information Dissemination & Technology, 1(4), 228-231.
Nicholas, D., rowlands, I., Watkinson, A., Brown, D. in Jamali, H. r. (2012). Digital repositories ten years on: what do scientific researchers think of them and how do they use them? Learned Publishing, 25(3), 195. doi:10.1087/20120306
rigaux, P. P., Abrouk, L. L., Audéon, H. H., cullot, N. N., Davy-rigaux, c. c., Faget, Z. in Thion- goasdoué, V. V. (2012). The design and implementation of Neuma, a collaborative Digital Scores Library. International Journal on Digital Libraries, 12(2/3), 73-88. doi:10.1007/s00799- 012-0089-9
Sutton, S. c. (2012). Balancing Boutique-Level Quality and Large-Scale Production: The Impact of "More Product, Less Process" on Digitization in Archives and Special collections. RBM: A Journal of Rare Books, Manuscripts, & Cultural Heritage, 13(1), 50-63.
Teper, J. in Shaw, e. F. (2011). Planning for Preservation During Mass Digitization Projects. Portal: Libraries & The Academy, 11(2), 717-739.
Tharani, K. (2012). collections Digitization Framework: A Service-oriented Approach to Digitization in Academic Libraries. Partnership: The Canadian Journal Of Library & Information Practice & Research, 7(2), 1-13.
Wu, M. M. (2011). Building a collaborative Digital collection: A Necessary evolution in Libraries. Law Library Journal, 103(4), 527-551.
Matjaz Kragelj
Oddano: 4. 6. 2014 - Sprejeto: 18. 6. 2014
1.02 Pregledni znanstveni clanek
1.02 Review article
UDK 930.25:004.9
Matjaz Kragelj
Narodna in univerzitetna knjiznica, Turjaska 1, 1000 Ljubljana
e-posta: [email protected]
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Copyright Zveza Bibliotekarskih Drustev Slovenije 2014
Abstract
Public institutions hold important physical collections of materials from the fields of culture and science. For more than a decade, they have been facing the problem of digitization and archiving requirements as a part of the digitization process when generating e-content. At the same time, the authors note a much larger set of institutions, which still deal, more or less successfully, with the initial problems of the digitization process. The main reasons for the gap between the two can be found among different factors, including: lack of knowledge in the field of the science in informatics, limited financial and staff resources provided by public institutions, and in particular, limited resources for the preservation management and the archive maintenance sub processes. By implementing a business model, we wish to contribute to the rationalization of the use of public funds for this purpose, but at the same time, to encourage a greater scope of online available e-content and to ensure a safe digital preservation of e-content material.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer