15
Filozofski fakultet Sveučilišta u Zagrebu David Ahrendt Informacijske i komunikacijske znanosti Ivor Varošanec Kolegij: Uvod u arhivistiku Arhiviranje u oblaku (cloud)

Cloud Arhivi (2)

Embed Size (px)

DESCRIPTION

Seminarski rad o arhivima u oblaku

Citation preview

  • Filozofski fakultet Sveuilita u Zagrebu David Ahrendt

    Informacijske i komunikacijske znanosti Ivor Varoanec

    Kolegij: Uvod u arhivistiku

    Arhiviranje u oblaku (cloud)

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    2 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    Sadraj

    1.to je oblak? ..................................................................................................... 3

    2.Razvoj tehnologija za arhive temeljene na cloud tehnologijama .......................... 7

    3.Prelazak na digitalne cloud arhive ........................................................................ 8

    4. Organizacija arhiva ............................................................................................ 10

    5. Metapodaci u upravljanju cloud arhivima ......................................................... 12

    6. Zakljuak ........................................................................................................... 14

    7. Literatura .......................................................................................................... 15

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    3 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    1.to je oblak?

    Po definiciji, oblak je skup udaljenih servera spojenih na internet koji slue za spremanje,

    organizaciju i obradu podataka. Cloud computing nudi rjeenje brojnih poslovnih problema.

    Idealan je za poduzea koja imaju potrebu za naprednim uslugama na postojeim

    infrastrukturama ali bez investiranja u novu infrastrukturu i kadrove. Aplikacije u infrastrukturi

    oblaka ne bi se smjele mijeati s aplikacijama koje rade u internet preglednicima. Veina cloud

    computing servisa radi po principu SaaS (Software as a Service), gdje korisnik preko interneta

    samo pristupa programu. Internet je u tom sluaju samo sredstvo za prijenos podataka, a

    program je smjeten na udaljenom serveru. 1

    Funkcionalnost programa ostaje ista i nije niim ograniena u odnosu na klasini nain rada u

    programu koji se instalira na raunalo. Internet preglednici (browseri) nisu operacijski sustavi te

    aplikacije u takvim preglednicima nemaju iste funkcije i mogunosti kao klasine aplikacije.

    Internet preglednici namijenjeni su prvenstveno pregledavanju Internet stranica, a ne za rad sa

    sloenim aplikacijama.

    1 Dino Kljuo, Cloud Computing, http://hardwarebase.net/teme/11735/uvod-u-cloud-computing

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    4 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    Slika 1. Cloud Computing(Wikipedija, http://bit.ly/1FWiCU7)

    Kada se ovakvi sustavi implantiraju u profesionalna okruenja ona donose niz prednost:

    1. Dostupnost aplikacija:

    a) sa svake lokacije koja ima pristup internetu i putem njega raunskom centru,

    b) velik broj raunala omoguava poveanje dostupnosti aplikacija zbog:

    velikog broja raunskih centara koji su distribuirani geografski,

    svaki raunski centar ima redundantnu (zalihosnu, viestruku) infrastrukturu, poevi od

    posluitelja, komunikacijskih veza, sustava napajanja, klimatizacije, automatskog

    nadgledanja i profesionalnog informatikog osoblja za podrku.

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    5 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    2. Skalabilnost aplikacija (mogunost opsluivanja velikog broja korisnika):

    a) Cloud Computing platforme omoguavaju iskoritavanje velikog broja posluitelja i

    raunskih centara na razliitim mjestima.

    b) Nova paradigma razvoja aplikacija omoguava jednostavniji razvojni proces

    programska podrka se razvija kao da se planira opsluivati jednog korisnika, a

    infrastruktura raunskog centra i platforme omoguava da se takva aplikacija "klonira" i

    opsluuje veliki broj korisnika u isto vrijeme.

    c) U konfiguraciji Cloud Computing platforme mogue je podesiti kada e se koristiti

    dodatni resursi, ime se optimizira cijena koritenja infrastrukture sa stvarnim

    potrebama da bi se efikasno opsluivalo vie ili manje korisnika.

    3. Fleksibilnost u mijenjanju i prilagodbi aplikacija:

    a) Aplikacija se aurira samo na jednom mjestu, korisnici dobivaju novu verziju prilikom

    sljedeeg pristupa.

    b) Parametrima konfiguracije aplikacija se moe prilagoditi svakoj grupi korisnika.

    4. Stalno praenje rada i odravanje infrastrukture:

    a) Veliki dio trokova za informatiku i osiguranje rada programskih rjeenja odnosi se

    upravo na osiguranje infrastrukture za njihov rad, sigurnost, pohranu podataka i

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    6 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    konfiguraciju sustava te stalni nadzor performansi rada.

    b) Smjetajem aplikacija u "oblak", taj troak je viestruko manji, a kvaliteta usluge i

    performanse se esto poveavaju.

    Iako navedene prednosti izgledaju kao "obeana zemlja", postoje i nedostaci koje treba uzeti u

    obzir kada se pone razmiljati o razvoju aplikacija koje e se smjestiti u "oblak":

    1. Mora se usvojiti nov nain razvoja aplikacija:

    a) Platforme koje danas nude razliiti proizvoai ili ponuditelji poput Microsofta i

    Amazona vrlo su razliite i zahtijevaju poseban nain projektiranja arhitekture takvih

    aplikacija.

    b) Nije mogue (jednostavno) premjetati postojee aplikacije.

    2. Ne postoje standardi za:

    povezivanje aplikacija (servisa) u "oblacima" razliitih proizvoaa (ili ak istog

    proizvoaa),

    razmjenu podatka,

    premjetanje podataka i programske podrke iz "oblaka" jednog proizvoaa u drugi.

    3. Problem sigurnosti, odnosno povjerenja da "vlasnik oblaka" nee preuzeti korisnike

    aplikacije, ukrasti podatke ili samu aplikaciju.

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    7 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    2.Razvoj tehnologija za arhive temeljene na cloud tehnologijama

    Sa trenutanim stanjem u ekonomije sve kompanije pokuavaju smanjiti trokove svog

    poslovanja te su u stalnoj potrazi za novim tehnologijama koje bi smanjile iste trokove. Tako u

    posljednijih nekoliko godina moemo uoiti digitalizaciju arhiva te njihovo seljenje u oblak.

    Prema procjenama u 2011. godini ve je dvadeset posto kompanija poelo koristiti cloud

    tehnologije za arhiviranje podataka o korisnicima, a takoer se procjenjuje da e do 2016.

    godine pedeset posto kompanije uiniti isto. Postoji nekoliko pristupa problemu prijelazu na

    cloud tehnologije te se koriste 4 razliite podvrste clouda, a to su Privatni cloud, Drutveni

    cloud, Javni cloud i Hibridni cloud.

    Privatni cloud: koristi ga samo jedna kompanija ili korporacija i u veini sluajeva ima

    tendenciju da je specifinog dizajna koji tono pokriva potrebe te organizacije

    Drutveni cloud: fizika infrastruktura je implantirana, administrirana te organizirana od

    strane nekoliko kompanija koje imaju sline ili iste ciljeve i zahtjeve koje cloud mora

    ispuniti za njih

    Javni cloud: namjenjen da bi bio iznajmljen od strane companije ili osobe

    Hibridni cloud: Kombinacija dva ili vie fizikih cloud infrastruktura iz razliitih

    gore navedene implementacije modela koji su fiziki odvojeni, ali su povezani putem

    zajedniki koritenih podataka i aplikacija ili su hijerarhiski povezani

    Ove tehnologije nude brz i efikasan nain za arhiviranje digitalnih zapisa s mogunou da

    organizacije same rjeavaju probleme u sustavu bez skupe strune pomoi kako bi se dobilo

    najbolje mogue iskustvo za krajnjeg korisnika. Veina takvih sustava temeljenja je na vizualnim

    sueljima kako bi olakala baratanje sustavom. Takoer takvi sustavi omoguavaju automatsko

    arhiviranje nekih vrsta dokumenata,naprimjer arhiviranje elektronike pote, to uvelike

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    8 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    olakava rad arhivskih strunjaka. Kada jo nisu postojala rjeenja za digitalne arhive svi

    dokumenti bi se ispisivali te spremali u klasine arhive. Takav nain rada sa sobom donosi veliki

    troak, a i teko pronalaenje potrebnih dokumenata. Zbog brzog razvoja tehnologije

    tehnoloka okruenja i rjeenja na tritu treba promatrati kao trenutno dostupne alate i

    zadatak arhivskim strunjacima. Nijhov je zadatak da procjene koji su alati i platforme

    najprilagoenije za njihov tip arhiva te koje donose najvie prednosti sa to manjim rizikom.

    3.Prelazak na digitalne cloud arhive

    Digitalizacija arhivske grae je proces pretvaranja fizikih dokumenata u digitalne slike ili

    elektronike zapise putem skeniranja. Takav postupak zahtijeva puno manje vremena i truda

    nego metoda ponovnog tipkanja cijeloga teksta; prije nego to je skeniranje postalo izvedivo,

    ponovno tipkanje je obino bilo jedina opcija. Nakon skeniranja veina datoteka prolazi kroz

    OCR programe. OCR (Optical Character Recognition) je tehnologija koja omoguava pretvaranje

    razliitih vrsta dokumenata, kao to su skenirani papirnati dokumenti, PDF datoteke ili slike

    snimljene digitalnom kamerom u digitalni tekst koji je mogue editirati. Problem takvih

    programa to nisu sto posto precizni pogotovo kod starih dokumenata koji nisu u dobrom

    stanju, zbog toga nakon obrade OCR programom moraju se ispravljati pogreke. Zato jer je to

    jako mukotrpan i dugotrajan posao esto se za taj proces koristi crowdsourcing.

    Primjer takvog crowdsourcing projekta je reChapta, alat koji developer web stranica koriste za

    zatitu od botova. Princip funkcioniranja je taj da se prva prikazana rije koristi za potvrdu da

    podatcima pristupa ovjek a druga rije je dio nekog spisa gdje OCR program nije uspio

    prepoznati o kojoj se rijei radi te je potrebna pomo ovjeka.2

    2 Alexander Lenk, Markus Klems, Jens Nimis, Stefan Tai, Thomas Sandholm: Whats Inside the Cloud? An

    Architectural Map of the Cloud Landscape, 2009.

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    9 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    Slika 2.reCAPTCHA inter-workings (www.gravitatedesign.com)

    Pri digitalizaciji te pohrani podataka takoer je jako vano paziti na format u kojem se spremaju

    dokumenti da bi oni bili itljivi i za nekoliko godina. Neki formati koji su bili popularni prije

    desetak godina danas su gotovo neitljivi. Digitalizacija jest mukotrpan posao no jako je vana

    da bi se dokumenti u arhivima ouvali za budunost te da se pretraivanje arhiva uini to brim

    i uinkovitijim.

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    10 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    4. Organizacija arhiva

    Upravo zbog brze pretrage vana je dobra organizacija dokumenata i zapisa.

    Arhitektura i organizacija arhiva programskih sustava ukljuenih u cloud computing tipino

    ukljuuje viestruku meusobnu komunikaciju komponenata oblaka. Komunikacija se obavlja

    preko aplikacijskog programskog suelja, uobiajeno preko web posluitelja. Cloud arhitekture

    rjeavaju nekoliko kljunih problema koji su bitni za obradu velike koliine podataka.

    U tradicionalnoj obradi podataka teko je dobiti koliinu raunala koliko je pojedinoj aplikaciji

    potrebno. Jo tee je dobiti potrebna raunala u trenutku kada su potrebni. Pojavljuju se mnoge

    potekoe u raspodjeli i koordiniranju mnotva poslova na razliitim raunalima, pokretanju

    procesa na njima i osiguravanju dodatnog raunala u sluaju da jedno od koritenih sluajno

    zakae. Teko je automatski procijeniti poraste i padove dinamikog optereenja. Nakon

    obavljenog posla teko se rijeiti svih tih koritenih raunala.

    Cloud arhitektura rjeava sve te probleme. Aplikacije izgraene na cloud arhitekturi pokreu se

    u oblaku gdje fiziko mjesto infrastrukture odreuje davatelj usluge. Oni iskoritavaju

    jednostavna API (eng. Application Programming Interface) suelja usluga dostupnih na

    Internetu. Rasporeivanje se izvodi na zahtjev, a logika raspodjele i pouzdana logika usluga

    ostaje implementirana i skrivena u oblaku. Koritenje resursa u cloud arhitekturi je po potrebi

    ponekada kratkotrajno, a ponekada se javlja vie puta, ali s odreenim razmacima.

    Zbog upravo gore nabrojanih razloga je ova arhitektura optimalna i jako iskoristiva. Prednosti

    organizacije arhiva uz pomo cloud arhitekture su smanjivanje vremena izvoenja i vremena

    odziva, smanjivanje rizika, infrastruktura koja funkcionira tono na vrijeme, mali poetni

    trokovi, povean tempo inovacija, uinkovitije koritenje resursa, trokovi na temelju uporabe i

    potencijal smanjivanja vremena obrade.

    Neizostavno bitna stavka koja nam pomae da se snaemo u svim arhiviranim podacima u

    cloudu su upravo metapodaci. Uobiajeno je da se metapodaci definiraju kao podaci o

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    11 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    podacima, to je u irem smislu tono, ali ne pomae razumijevanju sloenosti i snazi

    metapodataka.

    U ISO 15489-1, osnovnom internacionalnom standardu na podruju upravljanja spisima,

    metapodaci su opisani detaljnije: Podaci koji opisuju kontekst, sadraj i strukturu zapisa i

    upravljanje njima tijekom vremena. Dijelovi ove reenice stavljaju naglasak na koritenju

    metapodataka u svrhu opisivanja raznih svojstava spisa.

    U podruju upravljanja spisima metapodaci trebaju biti definirani i shvaeni u okvirima funkcija

    koje predstavljaju, tako da se ne vrednuje sami dokument, nego i nain na koji taj dokument

    funkcionira u okolini.

    Minessota Electronic Records Management Guidelines daju jednu od praktinijih definicija

    metapodataka: Metapodaci doputaju da korisnici lociraju i procijene podatke bez potrebe za

    tim da ih se kasnije ponovno mora nanovo otkrivati sa svakim koritenjem. Njihovi osnovni

    elementi su svrhovit sadraj, strukturiranost oblika i dobro definiran rjenik, to doputa

    precizan i razumljiv opis sadraja, lokacije te vrijednosti dokumenta.3

    National Information Standards Organisation definira metapodatke kao strukturirane

    informacije koje opisuju, objanjavaju, lociraju ili olakavaju pronalazak, koritenje ili upravljanje

    informacijskim izvorima. Osim toga, spominje se i vanost izvornosti; spisi moraju biti

    jedinstveno identificirani i autentini.

    Metapodaci su sastavljeni od elemenata. Oni opisuju karakteristike informacijskih objekata ili

    izvora. Dobro poznati elementi metapodataka su npr. autor, naslov i tema. Oni imaju

    standardiziranu prezentaciju (izgled i sadraj) ime se omoguuje interoperabilnost

    metapodataka i korist njihovim korisnicima. Veina elemenata koristi dodatna pravila, standarde

    ili kodirane sheme za osiguranje dosljedne prezentacije njihovog sadraja. Elementi

    metapodataka ujedno opisuju izvor na standardiziran nain, dosljednim rjenikom kako bi

    omoguili i olakali pretraivanje i rukovanje informacijama. Drugim rijeima, metapodaci

    3 Electronic Records Management Guidelines. (2012)

    http://www.mnhs.org/preserve/records/electronicrecords/erguidelines.html

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    12 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    nameu strukturu nestrukturiranim informacijama (tj. dokumentima, mapama, audiovizualnom

    materijalu), te nadodaju vie strukture onima koji su ve strukturirani (primjerice baza

    podataka).4

    Struktura metapodataka na taj nain je iskoristiva za svrhe pronalaska informacija,

    administracije, upravljanja spisima i uvanja.

    5. Metapodaci u upravljanju cloud arhivima

    Metapodaci u upravljanju cloud arhivima obuhvaaju sljedee funkcije:

    Identifikacija (na svim razinama prikupljanja) pridavanje jedinstvenog identiteta spisu,

    osobi, poslovnoj djelatnosti ili drugom entitetu. Identitet nekog entiteta u digitalnom

    svijetu mora biti eksplicitno odreen i oznaen odgovarajuim metapodatkom ili skupom

    metapodataka. Pri tome su neki identifikacijski metapodaci jedinstveni identifikatori

    nuni da bi informacijski sustav mogao pronalaziti entitete i manipulirati njima, dok su

    drugi identifikacijski metapodaci, poput naslova ili naziva, namijenjeni prvenstveno

    ljudima, kao podaci koji omoguuju smislenu identifikaciju i stvaranje predodbe o

    identitetu informacijskog objekta.

    Pronalaenje iako svaki element metapodataka moe posluiti kao kriterij za

    pretraivanje i pronalaenje informacijskih objekata, neki elementi metapodataka

    posebno su namijenjeni ovoj svrsi, te oblikovani i koriteni tako da se postignu odreena

    kvaliteta i pouzdanost pretraivanja. Najei takvi namjenski metapodaci za

    pretraivanje i pronalaenje su kljune rijei, podaci o odgovornosti za nastanak

    informacijskog objekta, mjesne i vremenske odrednice i sl.

    4 P. Franks, N. Kunde. Why metadata matters (2008)

    http://www.arma.org/bookstore/files/Franks-Kunde1.pdf

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    13 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    Razumijevanje kada informacijski objekt pronaemo, moda emo odmah razumjeti o

    emu se radi i bez dodatnih informacija pouzdano zakljuiti treba li nam taj objekt ili ne.

    U mnogim sluajevima, meutim korisne su dodatne informacije koje poblie opisuju

    objekt, upuuju na vrijednost ili iskoristivost informacija koje sadri, obrazlau podrijetlo

    ili kontekst toga objekta, veze s drugim entitetima i sl.

    Strukturiranje informacijski resurs moe se sastojati iz vie dijelova koji mogu biti u

    razliitim odnosima. Metapodaci relevantni za definiranje strukture informacijskog

    izvora, definiraju ili iskazuju odnose meu sastavnicama informacijskog resursa. Dobar

    primjer norme za strukturne metapodatke je Metadata Encoding and Transmission

    Standard (METS).

    Upravljanje metapodaci koji slue obavljanju odreenih radnji s informacijskim

    objektom, odnosno kontroli procesa u kojem se taj objekt moe nai. Ukljuuju npr.

    podatke koji se odnose na dostupnost i pravila pristupa informacijskom objektu,

    definiraju tko, kada, to i pod kojim uvjetima moe ili treba uiniti s objektom, podatke

    koji dokumentiraju ili iniciraju odreenu aktivnost i sl. Ovamo se obina razvrstavaju i

    tzv. preservation metadata, tj. metapodaci koji su relevantni za dugorono ouvanje

    informacijskog objekta i njegovih bitnih svojstava.

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    14 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    6. Zakljuak

    Arhiviranje u oblaku (engl. cloud computing) omoguava pristup raunalima i njihovim

    funkcionalnostima putem Internet mree ili lokalne mree. Korisnici takvog oblaka imaju pristup

    istom putem niza web usluga koje upravljaju raunalnim resursima kao to su na primjer

    raunala, mrea, sustav za pohranu podataka, operativni sustav, okruje za razvoj aplikacija,

    aplikacijski programi te mnogi drugi. Raunalni resursi su dodijeljeni korisniku sve dok ih korisnik

    ne oslobodi. Uz cloud, trokovi interne infrastrukture smanjuju se i do 80 posto, a pada i niz

    operativnih trokova ili poput trokova odravanja, trokova administracije. Padaju i trokovi

    skaliranja informatike infrastrukture moe se jednostavno iznajmiti vie prostora u cloudu

    umjesto kupovine posve novih, skupih servera kojima je svako toliko potrebno unaprijeivanje.

  • Arhiviranje u oblaku (cloud) David Ahrendt, Ivor Varoanec

    15 Kolegij: Uvod u arhivsku teoriju i praksu, Filozofski fakultet Sveuilita u Zagrebu

    7. Literatura

    Dino Kljuo, Cloud Computing, http://hardwarebase.net/teme/11735/uvod-u-cloud-

    computing

    Tomislav Brozin, Dobria Adamec : Uzlet u oblake, Infotrend, Zagreb, srpanj 2011.

    Microsoft predstavio cjelovitu razvojnu platformu za prijelaz na raunalstvo u oblaku,

    http://www.microsoft.com/croatia/press/windays11cloudcomputing.mspx

    Alexander Lenk, Markus Klems, Jens Nimis, Stefan Tai, Thomas Sandholm: Whats Inside

    the Cloud? An Architectural Map of the Cloud Landscape, 2009.

    SkyDrive, https://skydrive.live.com/

    Stani, Rajh, Miloevi : Influence of Cloud Computing on the Archival Theory and

    Practice

    Electronic Records Management Guidelines. (2012)

    http://www.mnhs.org/preserve/records/electronicrecords/erguidelines.html

    P. Franks, N. Kunde. Why metadata matters (2008)

    http://www.arma.org/bookstore/files/Franks-Kunde1.pdf

    1.to je oblak?2.Razvoj tehnologija za arhive temeljene na cloud tehnologijama3.Prelazak na digitalne cloud arhive4. Organizacija arhiva5. Metapodaci u upravljanju cloud arhivima6. Zakljuak7. Literatura