Dokumentide säilitamistehnoloogiad
Ettevõtete jaoks on äärmiselt tähtis garanteerida juurdepääs firmat puudutavatele andmetele. Näiteks võib ettevõttel vaja olla kaitsta oma huvisid mõne minevikus tehtud finantstehinguga seoses. Firmasid kohustab andmeid säilitama ka seadus. Kasvav andmete hulk ja vajadus/kohustus neid säilitada paneb proovile nii mõnegi ettevõtte IT süsteemi. Andmete säilitamisest on saanud/saamas firmade IT eelarvetes suurim kuluallikas (Lee 2008).
Oluline on mitte lasta andmebaasidel liiga suureks kasvada, kuna liiga mahukad andmebaasid vähendavad ettevõtete tootlikkust ning on kulukad. Sellega on seotud ka oht kliente kaotada. IT organisatsioonid aga eemaldavad väga vastumeelselt andmeid andmebaasidest, sest sellega kaasneb oht neist ilma jääda. Teiseks suureks probleemiks on kiire juurdepääsu garanteerimine arhiivis olevatele andmetele (Ibid.¹).
Ühiskasutusdokumentide salvestamine failiserverisse, mis haldab ettevõtte või organisatsiooni andmebaase, on üheks võimaluseks andmeid arhiveerida. Selle lahenduse kasutamise korral salvestatakse info serverarvuti ühele või mitmele kõvakettale, millelt omakorda tehakse varukoopiaid. Salvestusseadmed võivad olla nii sisemised kui ka välimised. Selline mudel kannab nime DAS (Directly Attached Storage, otseselt ühendatud salvestusseadmed) (NAS ja SAN: võrguajastu salvestustehnoloogiad 2008).
Suuremate ettevõtete ja suurele hulgale klientidele teenust pakkuvate firmade juures pole serverarvuti kasutamine aga hea lahendus, kuna:
Klient saab serveri salvestites infot lugeda ja kirjutada vaid läbi serveri, koormates sellega serveri kriitilisi ressursse (protsessor, operatiivmälu jne).
Kliendilt nõutakse autoriseeritud kontakti, et salvestitele ligi pääseda.
Piirangud ketaste üldarvule (ja seega salvestusmahule), mis tulenevad serverarvuti arhitektuurist (NAS ja SAN: võrguajastu salvestustehnoloogiad 2008).
Kui serveri maksimaalne mahutavus hakkab täituma, ei jää üle muud, kui osta juurde uus server või vahetada vana välja suurema ja võimsama vastu. See aga on kulukas. Arvutite ja nende kasutajate hulga suurenemine, suuri andmemahte nõudvate ja suurt infovahetuskiirust vajavate rakenduste (multimeedia, videokonverentsid jne) ning Interneti ja e-teenuste juurutamine aga suurendab andmemahud sellisele tasemele, et need hakkavad nö pooma serverit, koormates LAN-i läbilaskevõimet ning takistades ülejäänud klientide rahuldavat ligipääsu serverile (Ibid.¹).
Üsna varsti peale arvutivõrkude laiemat levikut leiti, et enam pole mõtet igale arvutitöökohale oma printerit osta, vaid mõttekam on ühele arvutile muretseda võimsam ja kiirem printer, mille ressursse siis „emaarvuti“ lahkelt jagab selleks loa saanud klientidele. Kuid küllalt ruttu, eriti peale suuremahuliste graafiliste trükivõimaluste ilmumist, hakkas selline ressursijagamine koormama seda töökohta, kuhu printer oli ühendatud. Nii võetigi kasutusele võrguprinterid, mis iseseisva liidesega ühendati otse LAN-i ning mille poole iga klient sai otse pöörduda (Ibid.¹).
Sama meetod leiab rakendust ka NAS-i puhul – salvestussüsteem eemaldatakse serverist ja ühendatakse otse LAN/WAN külge. See süsteem kujutab endast failserverarvutit, kõrgspetsiifilist masinat, mis on määratud tegelema üheainsa konkreetse ülesandega: teha andmed kiirelt ja turvaliselt kättesaadavaks heterogeense, multiplatvormse arvutivõrgu kõikidele kasutajatele (NAS ja SAN: võrguajastu salvestustehnoloogiad 2008).
SAN (Storage Area Network, salvestusseadmete kohtvõrk) kujutab endast NAS’i evolutsioonilist järglast, samuti nagu NAS arenes lahendusena DAS’i puuduste kõrvaldamiseks. SAN kujutab endast ülikiiret salvestussüsteemide võrku võrgu sees (Lee 2008).
HSM (Hierarchical Storage Management) on loodud selleks, et kahandada salvestamis- ja administreerimiskulusid võimaldades samal ajal ligipääsu andmetele. See tehnoloogia haldab faile automaatselt tuginedes nende kasutatavuse sagedusele (Ibid¹).
Nii HSM kui ka ühiskasutusdokumentide salvestamine failiserverisse on tõhusad meetodid andmete mahu suurenemise korral, sest mõlemal juhul paigutatakse harva kasutatavad andmed salvestusseadmetele, mille hoolduskulud pole nii kõrged (Ibid¹).
Kui ettevõttel on töötlemiseks pidevalt suur hulk andmeid, on otstarbekas kasutada nende hoidmiseks andmehoidlaid (andmeait) - Data Warehouse. DW on olemuselt suur andmebaas, mis on kogum väiksematest andmebaasidest. Andmehoidla eesmärgiks on koondada andmed ühte kohta, et andmed oleksid terve ettevõtte jaoks üheselt mõistetavad ja samad. Andmehoidlad on nii suured, et nende puhul tuleb otsingu kiirendamiseks ja filtreerimiseks kasutada mitmesuguseid andmete tihendamise ja pakkimise vahendeid (Teabe haldus, hooldus, kasutamine 2008).
Digitaalne arhiveerimine
Digitaalne säilitamine on saamas igapäevaseks praktikaks. Selle teostamiseks on vaja kontseptsiooni, konsensust ja keskkonda. Digitaaldokumendid võivad sisaldada väga eritüübilisi faile (andmebaas, tabelarvutus, pilt). Digitaaldokumendi usaldusväärsuse tagamiseks tuleb teda kontrollida kogu tema elukäigu jooksul. Mida säilitada ja mida mitte sõltub dokumendi väärtusest ja kvaliteedist. Digitaalse dokumendi sisulise poole hindamise juures kehtivad samad printsiibid, mis paberpõhises arhiivinduses. Tehnilise poole hindamisel on vaja IT-alaseid oskusi. Seejuures kerkivad üles küsimused mida ja kuidas hõlmata ning kuidas viia eri süsteemide arv miinimumini (Ehamaa 2008).
Dokumentide arhiveerimiseks tuleb: liigitada dokumendid, määrata neile säilitustähtaeg, tagada dokumentide säilimine, kindlustada neile juurdepääs ja eraldada dokumendid hävitamiseks (Ibid.¹).
Arhiivihaldus on üks etapp dokumendi elukäigust. Digitaaldokumendi haldamiseks on vajalik spetsiaalne infosüsteem (tarkvara). Ideaalne oleks, kui selles infosüsteemis saaks hallata ka paberarhiive (Ibid.¹).
Arhiveerimiseks on vaja teada dokumendi tehnilisi omadusi (vorming, tarkvara, nõuded riistvarale, maht jne), olulisi omadusi, mida tuleb säilitada läbi erinevate konverteerimiste (töödeldavus, kvaliteet jne) ning infot dokumendi koostisosade kohta (millistest failidest koosneb) (Ehamaa 2008).
Digitaalse säilitamise korral peavad dokumendid olema tulevikus kasutatavad, usaldusväärsed ja autentsed ning terviklikud. Digitaalne säilitamine nõuab rohkem tööd ja otsustamist. Ta on pidev riskianalüüs ja tekkivate probleemide ennetamine. Peamisteks säilitamise probleemideks on füüsiline ja loogiline vananemine. Digitaalne säilitamine- see on eelkõige dokumendi kasutatavuse säilitamine (Ibid.¹).
OAIS mudel kirjeldab nelja digitaalarhiivi osapoole (looja, haldaja, arhiivi ja kasutaja)
omavahelisi suhteid kuues funktsioonis:
Üleandmine
Hoid
arhiivikogu haldamine
administreerimine
säilitamise planeerimine
juurdepääs
OAIS on mudel arhiivide võrdlemiseks ja tegevuste määramiseks, mis pakub välja valdkonna ühtse terminoloogia ja aitab hinnata olemasolevate süsteemide usaldusväärsust (Teabea haldus, hooldus, kasutamine 2008).
Allikas: NDL Digital Archiving System
Eelmiste aastate üliõpilastööde ja käesoleva töö kokkuvõte
Senised arusaamad dokumendist on selgelt muutumas ja digitaalne dokument oma sisukuses on saamas järjest valdavamaks. Dokumendiks võib olla nii asutuse ametlik dokument, hoone eskiis, mängufilm, romaan kui ka mp3 vormingus muusikapala ja palju muud. Infoühiskonna arenedes kaotab üha rohkem tähtsust paberkandjal levitatav info, nagu näiteks telefoniraamat. Tegevuste dokumenteerimine ning dokumentide säilitamine on ettevõtete jaoks väga tähtis ja nagu juba mainitud, kohustab firmasid seda tegema ka seadus. Mitte vähemtähtsam pole viis, kuidas seda tehakse. See, kuidas organisatsioonis dokumentidesse suhtutakse sõltub kõigepealt sellest, kas tegemist on riikliku või eraettevõttega. Riiklikus ettevõttes on nõuded karmimad ning töötajad on kohustatud väga täpseid reegleid järgima. Eraettevõttes sõltub see peamiselt organisatsiooni juhist, kas ja milliseid reegleid järgitakse, kuigi osade dokumentide puhul, nagu näiteks aastaaruannete ja raamatupidamise tarvis koostatavad dokumendid, tuleb standardeid järgida kõigil. Millist dokumendihaldussüsteemi kasutada, pole ette kirjutatud. Eestis kättesaadavad mitmed dokumendihaldussüsteemid. Kuigi mitmed neist rahuldavad vajalikke dokumendihalduse ja muid nõudmisi, pole ükski süsteem ideaalne. Lisaks on süsteemide hinnatase, hoolduse tase ning keerukus erinevad. Dokumentide haldamine peab mõistetavalt olema järjepidev alates nende loomisest kuni hävitamise või arhiivi üleandmiseni. Arhiivitöö polegi muud kui jätkuv dokumentide haldamine, mis arvestab dokumentide kestva säilitamise vajadustega.
Peale varasemate tööde lugemist ja käesoleva töö koostamist tekkisid järgnevad küsimused:
Erinevad dokumendihaldussüsteemid annavad ka erinevaid tulemusi, mis kokkuvõttes tekitavad palju segadust. Miks ei võiks näiteks kokku leppida, et praegu kehtib Eestis süsteem X?
Enamikes Euroopa riikides on probleemi korral arvutiga võimalik pöörduda IT-toe poole. Miks Eestis seda võimalust ainult teatud eeldustel kasutada saab ning sealt harva ammendavaid vastuseid saab?
Viited
AIIM Industry White Paper on Records. Conversion & Document Formats. Hamburg, 2002, 62 p. [http://h30046.www3.hp.com/uploads/whitepapers/conversion_formats_wp.pdf]. 29.10.2008.
Algajale asjaajajale. [http://asjataja.blogspot.com/]. 30.10.2008.
Amphora [www.amphora.ee]. 08.01.2009.
Ehamaa, A. Digitaaldokumentide säilitamine ja digitaalarhiivinduse korraldamine. Pärnu, 2008, 22 lk. [http://www.konverentsid.ee/files/doc/BYROO/2008/Anu_Ehamaa.pdf]. 31.10.2008.
Lee, J. Future Trends and New Developments in Data Management. Princeton, 6 p. [http://www2.sas.com/proceedings/sugi28/176-28.pdf ]. 28.10.2008.
Teabe haldus, hooldus, kasutamine. 1lk. [http://www.eits.ee/Main/failid/Vet/failid_est/LO07_est/teabe_haldus_hooldus_ja_kasutamine.html]. 30.10.2008.
NDL Digital Archiving System [http://www.ndl.go.jp/en/aboutus/images/ndl_da01.jpg]. 08.01.2009.
Tamm, V. NAS ja SAN: võrguajastu salvestustehnoloogiad. 2003, 1 lk. [http://www.ria.ee/lib/am-2001-2005/2947_250.HTM]. 30.10.2008.
|