Upload
david-ahrendt
View
52
Download
10
Embed Size (px)
DESCRIPTION
Seminarski rad o arhivima u oblaku
Citation preview
Filozofski fakultet Sveuilita u Zagrebu David Ahrendt
Informacijske i komunikacijske znanosti Ivor Varoanec
Kolegij: Uvod u arhivistiku
Arhiviranje u oblaku (cloud)
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
2 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
Sadraj
1.to je oblak? ..................................................................................................... 3
2.Razvoj tehnologija za arhive temeljene na cloud tehnologijama .......................... 7
3.Prelazak na digitalne cloud arhive ........................................................................ 8
4. Organizacija arhiva ............................................................................................ 10
5. Metapodaci u upravljanju cloud arhivima ......................................................... 12
6. Zakljuak ........................................................................................................... 14
7. Literatura .......................................................................................................... 15
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
3 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
1.to je oblak?
Po definiciji, oblak je skup udaljenih servera spojenih na internet koji slue za spremanje,
organizaciju i obradu podataka. Cloud computing nudi rjeenje brojnih poslovnih problema.
Idealan je za poduzea koja imaju potrebu za naprednim uslugama na postojeim
infrastrukturama ali bez investiranja u novu infrastrukturu i kadrove. Aplikacije u infrastrukturi
oblaka ne bi se smjele mijeati s aplikacijama koje rade u internet preglednicima. Veina cloud
computing servisa radi po principu SaaS (Software as a Service), gdje korisnik preko interneta
samo pristupa programu. Internet je u tom sluaju samo sredstvo za prijenos podataka, a
program je smjeten na udaljenom serveru. 1
Funkcionalnost programa ostaje ista i nije niim ograniena u odnosu na klasini nain rada u
programu koji se instalira na raunalo. Internet preglednici (browseri) nisu operacijski sustavi te
aplikacije u takvim preglednicima nemaju iste funkcije i mogunosti kao klasine aplikacije.
Internet preglednici namijenjeni su prvenstveno pregledavanju Internet stranica, a ne za rad sa
sloenim aplikacijama.
1 Dino Kljuo, Cloud Computing, http://hardwarebase.net/teme/11735/uvod-u-cloud-computing
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
4 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
Slika 1. Cloud Computing(Wikipedija, http://bit.ly/1FWiCU7)
Kada se ovakvi sustavi implantiraju u profesionalna okruenja ona donose niz prednost:
1. Dostupnost aplikacija:
a) sa svake lokacije koja ima pristup internetu i putem njega raunskom centru,
b) velik broj raunala omoguava poveanje dostupnosti aplikacija zbog:
velikog broja raunskih centara koji su distribuirani geografski,
svaki raunski centar ima redundantnu (zalihosnu, viestruku) infrastrukturu, poevi od
posluitelja, komunikacijskih veza, sustava napajanja, klimatizacije, automatskog
nadgledanja i profesionalnog informatikog osoblja za podrku.
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
5 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
2. Skalabilnost aplikacija (mogunost opsluivanja velikog broja korisnika):
a) Cloud Computing platforme omoguavaju iskoritavanje velikog broja posluitelja i
raunskih centara na razliitim mjestima.
b) Nova paradigma razvoja aplikacija omoguava jednostavniji razvojni proces
programska podrka se razvija kao da se planira opsluivati jednog korisnika, a
infrastruktura raunskog centra i platforme omoguava da se takva aplikacija "klonira" i
opsluuje veliki broj korisnika u isto vrijeme.
c) U konfiguraciji Cloud Computing platforme mogue je podesiti kada e se koristiti
dodatni resursi, ime se optimizira cijena koritenja infrastrukture sa stvarnim
potrebama da bi se efikasno opsluivalo vie ili manje korisnika.
3. Fleksibilnost u mijenjanju i prilagodbi aplikacija:
a) Aplikacija se aurira samo na jednom mjestu, korisnici dobivaju novu verziju prilikom
sljedeeg pristupa.
b) Parametrima konfiguracije aplikacija se moe prilagoditi svakoj grupi korisnika.
4. Stalno praenje rada i odravanje infrastrukture:
a) Veliki dio trokova za informatiku i osiguranje rada programskih rjeenja odnosi se
upravo na osiguranje infrastrukture za njihov rad, sigurnost, pohranu podataka i
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
6 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
konfiguraciju sustava te stalni nadzor performansi rada.
b) Smjetajem aplikacija u "oblak", taj troak je viestruko manji, a kvaliteta usluge i
performanse se esto poveavaju.
Iako navedene prednosti izgledaju kao "obeana zemlja", postoje i nedostaci koje treba uzeti u
obzir kada se pone razmiljati o razvoju aplikacija koje e se smjestiti u "oblak":
1. Mora se usvojiti nov nain razvoja aplikacija:
a) Platforme koje danas nude razliiti proizvoai ili ponuditelji poput Microsofta i
Amazona vrlo su razliite i zahtijevaju poseban nain projektiranja arhitekture takvih
aplikacija.
b) Nije mogue (jednostavno) premjetati postojee aplikacije.
2. Ne postoje standardi za:
povezivanje aplikacija (servisa) u "oblacima" razliitih proizvoaa (ili ak istog
proizvoaa),
razmjenu podatka,
premjetanje podataka i programske podrke iz "oblaka" jednog proizvoaa u drugi.
3. Problem sigurnosti, odnosno povjerenja da "vlasnik oblaka" nee preuzeti korisnike
aplikacije, ukrasti podatke ili samu aplikaciju.
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
7 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
2.Razvoj tehnologija za arhive temeljene na cloud tehnologijama
Sa trenutanim stanjem u ekonomije sve kompanije pokuavaju smanjiti trokove svog
poslovanja te su u stalnoj potrazi za novim tehnologijama koje bi smanjile iste trokove. Tako u
posljednijih nekoliko godina moemo uoiti digitalizaciju arhiva te njihovo seljenje u oblak.
Prema procjenama u 2011. godini ve je dvadeset posto kompanija poelo koristiti cloud
tehnologije za arhiviranje podataka o korisnicima, a takoer se procjenjuje da e do 2016.
godine pedeset posto kompanije uiniti isto. Postoji nekoliko pristupa problemu prijelazu na
cloud tehnologije te se koriste 4 razliite podvrste clouda, a to su Privatni cloud, Drutveni
cloud, Javni cloud i Hibridni cloud.
Privatni cloud: koristi ga samo jedna kompanija ili korporacija i u veini sluajeva ima
tendenciju da je specifinog dizajna koji tono pokriva potrebe te organizacije
Drutveni cloud: fizika infrastruktura je implantirana, administrirana te organizirana od
strane nekoliko kompanija koje imaju sline ili iste ciljeve i zahtjeve koje cloud mora
ispuniti za njih
Javni cloud: namjenjen da bi bio iznajmljen od strane companije ili osobe
Hibridni cloud: Kombinacija dva ili vie fizikih cloud infrastruktura iz razliitih
gore navedene implementacije modela koji su fiziki odvojeni, ali su povezani putem
zajedniki koritenih podataka i aplikacija ili su hijerarhiski povezani
Ove tehnologije nude brz i efikasan nain za arhiviranje digitalnih zapisa s mogunou da
organizacije same rjeavaju probleme u sustavu bez skupe strune pomoi kako bi se dobilo
najbolje mogue iskustvo za krajnjeg korisnika. Veina takvih sustava temeljenja je na vizualnim
sueljima kako bi olakala baratanje sustavom. Takoer takvi sustavi omoguavaju automatsko
arhiviranje nekih vrsta dokumenata,naprimjer arhiviranje elektronike pote, to uvelike
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
8 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
olakava rad arhivskih strunjaka. Kada jo nisu postojala rjeenja za digitalne arhive svi
dokumenti bi se ispisivali te spremali u klasine arhive. Takav nain rada sa sobom donosi veliki
troak, a i teko pronalaenje potrebnih dokumenata. Zbog brzog razvoja tehnologije
tehnoloka okruenja i rjeenja na tritu treba promatrati kao trenutno dostupne alate i
zadatak arhivskim strunjacima. Nijhov je zadatak da procjene koji su alati i platforme
najprilagoenije za njihov tip arhiva te koje donose najvie prednosti sa to manjim rizikom.
3.Prelazak na digitalne cloud arhive
Digitalizacija arhivske grae je proces pretvaranja fizikih dokumenata u digitalne slike ili
elektronike zapise putem skeniranja. Takav postupak zahtijeva puno manje vremena i truda
nego metoda ponovnog tipkanja cijeloga teksta; prije nego to je skeniranje postalo izvedivo,
ponovno tipkanje je obino bilo jedina opcija. Nakon skeniranja veina datoteka prolazi kroz
OCR programe. OCR (Optical Character Recognition) je tehnologija koja omoguava pretvaranje
razliitih vrsta dokumenata, kao to su skenirani papirnati dokumenti, PDF datoteke ili slike
snimljene digitalnom kamerom u digitalni tekst koji je mogue editirati. Problem takvih
programa to nisu sto posto precizni pogotovo kod starih dokumenata koji nisu u dobrom
stanju, zbog toga nakon obrade OCR programom moraju se ispravljati pogreke. Zato jer je to
jako mukotrpan i dugotrajan posao esto se za taj proces koristi crowdsourcing.
Primjer takvog crowdsourcing projekta je reChapta, alat koji developer web stranica koriste za
zatitu od botova. Princip funkcioniranja je taj da se prva prikazana rije koristi za potvrdu da
podatcima pristupa ovjek a druga rije je dio nekog spisa gdje OCR program nije uspio
prepoznati o kojoj se rijei radi te je potrebna pomo ovjeka.2
2 Alexander Lenk, Markus Klems, Jens Nimis, Stefan Tai, Thomas Sandholm: Whats Inside the Cloud? An
Architectural Map of the Cloud Landscape, 2009.
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
9 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
Slika 2.reCAPTCHA inter-workings (www.gravitatedesign.com)
Pri digitalizaciji te pohrani podataka takoer je jako vano paziti na format u kojem se spremaju
dokumenti da bi oni bili itljivi i za nekoliko godina. Neki formati koji su bili popularni prije
desetak godina danas su gotovo neitljivi. Digitalizacija jest mukotrpan posao no jako je vana
da bi se dokumenti u arhivima ouvali za budunost te da se pretraivanje arhiva uini to brim
i uinkovitijim.
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
10 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
4. Organizacija arhiva
Upravo zbog brze pretrage vana je dobra organizacija dokumenata i zapisa.
Arhitektura i organizacija arhiva programskih sustava ukljuenih u cloud computing tipino
ukljuuje viestruku meusobnu komunikaciju komponenata oblaka. Komunikacija se obavlja
preko aplikacijskog programskog suelja, uobiajeno preko web posluitelja. Cloud arhitekture
rjeavaju nekoliko kljunih problema koji su bitni za obradu velike koliine podataka.
U tradicionalnoj obradi podataka teko je dobiti koliinu raunala koliko je pojedinoj aplikaciji
potrebno. Jo tee je dobiti potrebna raunala u trenutku kada su potrebni. Pojavljuju se mnoge
potekoe u raspodjeli i koordiniranju mnotva poslova na razliitim raunalima, pokretanju
procesa na njima i osiguravanju dodatnog raunala u sluaju da jedno od koritenih sluajno
zakae. Teko je automatski procijeniti poraste i padove dinamikog optereenja. Nakon
obavljenog posla teko se rijeiti svih tih koritenih raunala.
Cloud arhitektura rjeava sve te probleme. Aplikacije izgraene na cloud arhitekturi pokreu se
u oblaku gdje fiziko mjesto infrastrukture odreuje davatelj usluge. Oni iskoritavaju
jednostavna API (eng. Application Programming Interface) suelja usluga dostupnih na
Internetu. Rasporeivanje se izvodi na zahtjev, a logika raspodjele i pouzdana logika usluga
ostaje implementirana i skrivena u oblaku. Koritenje resursa u cloud arhitekturi je po potrebi
ponekada kratkotrajno, a ponekada se javlja vie puta, ali s odreenim razmacima.
Zbog upravo gore nabrojanih razloga je ova arhitektura optimalna i jako iskoristiva. Prednosti
organizacije arhiva uz pomo cloud arhitekture su smanjivanje vremena izvoenja i vremena
odziva, smanjivanje rizika, infrastruktura koja funkcionira tono na vrijeme, mali poetni
trokovi, povean tempo inovacija, uinkovitije koritenje resursa, trokovi na temelju uporabe i
potencijal smanjivanja vremena obrade.
Neizostavno bitna stavka koja nam pomae da se snaemo u svim arhiviranim podacima u
cloudu su upravo metapodaci. Uobiajeno je da se metapodaci definiraju kao podaci o
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
11 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
podacima, to je u irem smislu tono, ali ne pomae razumijevanju sloenosti i snazi
metapodataka.
U ISO 15489-1, osnovnom internacionalnom standardu na podruju upravljanja spisima,
metapodaci su opisani detaljnije: Podaci koji opisuju kontekst, sadraj i strukturu zapisa i
upravljanje njima tijekom vremena. Dijelovi ove reenice stavljaju naglasak na koritenju
metapodataka u svrhu opisivanja raznih svojstava spisa.
U podruju upravljanja spisima metapodaci trebaju biti definirani i shvaeni u okvirima funkcija
koje predstavljaju, tako da se ne vrednuje sami dokument, nego i nain na koji taj dokument
funkcionira u okolini.
Minessota Electronic Records Management Guidelines daju jednu od praktinijih definicija
metapodataka: Metapodaci doputaju da korisnici lociraju i procijene podatke bez potrebe za
tim da ih se kasnije ponovno mora nanovo otkrivati sa svakim koritenjem. Njihovi osnovni
elementi su svrhovit sadraj, strukturiranost oblika i dobro definiran rjenik, to doputa
precizan i razumljiv opis sadraja, lokacije te vrijednosti dokumenta.3
National Information Standards Organisation definira metapodatke kao strukturirane
informacije koje opisuju, objanjavaju, lociraju ili olakavaju pronalazak, koritenje ili upravljanje
informacijskim izvorima. Osim toga, spominje se i vanost izvornosti; spisi moraju biti
jedinstveno identificirani i autentini.
Metapodaci su sastavljeni od elemenata. Oni opisuju karakteristike informacijskih objekata ili
izvora. Dobro poznati elementi metapodataka su npr. autor, naslov i tema. Oni imaju
standardiziranu prezentaciju (izgled i sadraj) ime se omoguuje interoperabilnost
metapodataka i korist njihovim korisnicima. Veina elemenata koristi dodatna pravila, standarde
ili kodirane sheme za osiguranje dosljedne prezentacije njihovog sadraja. Elementi
metapodataka ujedno opisuju izvor na standardiziran nain, dosljednim rjenikom kako bi
omoguili i olakali pretraivanje i rukovanje informacijama. Drugim rijeima, metapodaci
3 Electronic Records Management Guidelines. (2012)
http://www.mnhs.org/preserve/records/electronicrecords/erguidelines.html
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
12 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
nameu strukturu nestrukturiranim informacijama (tj. dokumentima, mapama, audiovizualnom
materijalu), te nadodaju vie strukture onima koji su ve strukturirani (primjerice baza
podataka).4
Struktura metapodataka na taj nain je iskoristiva za svrhe pronalaska informacija,
administracije, upravljanja spisima i uvanja.
5. Metapodaci u upravljanju cloud arhivima
Metapodaci u upravljanju cloud arhivima obuhvaaju sljedee funkcije:
Identifikacija (na svim razinama prikupljanja) pridavanje jedinstvenog identiteta spisu,
osobi, poslovnoj djelatnosti ili drugom entitetu. Identitet nekog entiteta u digitalnom
svijetu mora biti eksplicitno odreen i oznaen odgovarajuim metapodatkom ili skupom
metapodataka. Pri tome su neki identifikacijski metapodaci jedinstveni identifikatori
nuni da bi informacijski sustav mogao pronalaziti entitete i manipulirati njima, dok su
drugi identifikacijski metapodaci, poput naslova ili naziva, namijenjeni prvenstveno
ljudima, kao podaci koji omoguuju smislenu identifikaciju i stvaranje predodbe o
identitetu informacijskog objekta.
Pronalaenje iako svaki element metapodataka moe posluiti kao kriterij za
pretraivanje i pronalaenje informacijskih objekata, neki elementi metapodataka
posebno su namijenjeni ovoj svrsi, te oblikovani i koriteni tako da se postignu odreena
kvaliteta i pouzdanost pretraivanja. Najei takvi namjenski metapodaci za
pretraivanje i pronalaenje su kljune rijei, podaci o odgovornosti za nastanak
informacijskog objekta, mjesne i vremenske odrednice i sl.
4 P. Franks, N. Kunde. Why metadata matters (2008)
http://www.arma.org/bookstore/files/Franks-Kunde1.pdf
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
13 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
Razumijevanje kada informacijski objekt pronaemo, moda emo odmah razumjeti o
emu se radi i bez dodatnih informacija pouzdano zakljuiti treba li nam taj objekt ili ne.
U mnogim sluajevima, meutim korisne su dodatne informacije koje poblie opisuju
objekt, upuuju na vrijednost ili iskoristivost informacija koje sadri, obrazlau podrijetlo
ili kontekst toga objekta, veze s drugim entitetima i sl.
Strukturiranje informacijski resurs moe se sastojati iz vie dijelova koji mogu biti u
razliitim odnosima. Metapodaci relevantni za definiranje strukture informacijskog
izvora, definiraju ili iskazuju odnose meu sastavnicama informacijskog resursa. Dobar
primjer norme za strukturne metapodatke je Metadata Encoding and Transmission
Standard (METS).
Upravljanje metapodaci koji slue obavljanju odreenih radnji s informacijskim
objektom, odnosno kontroli procesa u kojem se taj objekt moe nai. Ukljuuju npr.
podatke koji se odnose na dostupnost i pravila pristupa informacijskom objektu,
definiraju tko, kada, to i pod kojim uvjetima moe ili treba uiniti s objektom, podatke
koji dokumentiraju ili iniciraju odreenu aktivnost i sl. Ovamo se obina razvrstavaju i
tzv. preservation metadata, tj. metapodaci koji su relevantni za dugorono ouvanje
informacijskog objekta i njegovih bitnih svojstava.
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
14 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
6. Zakljuak
Arhiviranje u oblaku (engl. cloud computing) omoguava pristup raunalima i njihovim
funkcionalnostima putem Internet mree ili lokalne mree. Korisnici takvog oblaka imaju pristup
istom putem niza web usluga koje upravljaju raunalnim resursima kao to su na primjer
raunala, mrea, sustav za pohranu podataka, operativni sustav, okruje za razvoj aplikacija,
aplikacijski programi te mnogi drugi. Raunalni resursi su dodijeljeni korisniku sve dok ih korisnik
ne oslobodi. Uz cloud, trokovi interne infrastrukture smanjuju se i do 80 posto, a pada i niz
operativnih trokova ili poput trokova odravanja, trokova administracije. Padaju i trokovi
skaliranja informatike infrastrukture moe se jednostavno iznajmiti vie prostora u cloudu
umjesto kupovine posve novih, skupih servera kojima je svako toliko potrebno unaprijeivanje.
Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec
15 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu
7. Literatura
Dino Kljuo, Cloud Computing, http://hardwarebase.net/teme/11735/uvod-u-cloud-
computing
Tomislav Brozin, Dobria Adamec : Uzlet u oblake, Infotrend, Zagreb, srpanj 2011.
Microsoft predstavio cjelovitu razvojnu platformu za prijelaz na raunalstvo u oblaku,
http://www.microsoft.com/croatia/press/windays11cloudcomputing.mspx
Alexander Lenk, Markus Klems, Jens Nimis, Stefan Tai, Thomas Sandholm: Whats Inside
the Cloud? An Architectural Map of the Cloud Landscape, 2009.
SkyDrive, https://skydrive.live.com/
Stani, Rajh, Miloevi : Influence of Cloud Computing on the Archival Theory and
Practice
Electronic Records Management Guidelines. (2012)
http://www.mnhs.org/preserve/records/electronicrecords/erguidelines.html
P. Franks, N. Kunde. Why metadata matters (2008)
http://www.arma.org/bookstore/files/Franks-Kunde1.pdf
1.to je oblak?2.Razvoj tehnologija za arhive temeljene na cloud tehnologijama3.Prelazak na digitalne cloud arhive4. Organizacija arhiva5. Metapodaci u upravljanju cloud arhivima6. Zakljuak7. Literatura