Upload
giacomo-rollins
View
44
Download
0
Embed Size (px)
DESCRIPTION
Vård och långsiktigt bevarande av digitalt material. Jens Granlund. Innehåll. Lagringsmedier Dokumentformat Långsiktigt Digitalt Bevarande Säkerhet / Säkerhetskopiering Rutiner. Papper vs. Digitalt material. Papper kan läsas direkt av en människa - PowerPoint PPT Presentation
Citation preview
Vård och långsiktigt bevarande av digitalt material
Jens Granlund
Innehåll
Lagringsmedier Dokumentformat Långsiktigt Digitalt Bevarande Säkerhet / Säkerhetskopiering
Rutiner
Papper vs. Digitalt material
Papper kan läsas direkt av en människa Digitalt material kräver en maskin som förstår
sig på mediet och formatet Vi vet rätt bra hur vi skall vårda och bevara
pappersdokument svårare med digitalt Flera kopior är en säkerhet: lätt, snabbt och
billigt att kopiera digitalt. Kopior av digitalt material är exakta kopior.Vid
analog kopiering försämras materialet ofta från generation till generation.
Problem med att läsa digitalt material
Den digitala informationen är beroende av tekniken för att kunna uppfattas, den är endast maskinläsbar. Utan tillgång till och kunskap om nödvändig hårdvara, operativsystem och applikationsprogram i rätt versioner förblir informationen en samling otydbara binära tecken.
Förlorat material
Långtidslagring av digitala data är ett svårt och allvarligt problem för hela det moderna samhället och många frågor återstår att lösa.
Det strategiska konceptet för digitalt bevarande är och har länge varit öppna, leverantörsoberoende standarder och en kontinuerlig överflyttning av data till nya lagringsmedia. Detta medför dock stora kostnader, kontinuitetsproblem och risker vad gäller dataintegriteten.
Mycket data från datorns barndom har gått förlorat.
Lagringsmediums fysiska livslängd
Digitala lagringsmedia har (vanligen) kortare fysisk livslängd än papper och mikrofilm.
Disketter, CDn, hårdskivor mm. håller inte för evigt!
Det finns förväntad fysisk livslängd som varierar beroende på lagringsmedium.
Teknisk livslängd
Den digitala informationen har en teknisk livslängd. Hårdvara, mjukvara och filformat åldras hastigt. Det som är tillgängligt i dag kan redan om några år var oläsligt. Digitalt material kräver en mer aktiv övervakning än pappersbaserat arkivmaterial.
Exempel: har en fungerande 8 tums diskett, men: Var hittar jag en diskettstation? Kan den anslutas
fysiskt till datorn? Drivrutiner för operativsystemet? Kan filsystemet läsas? Kan dokumentformatet förstås? Har vi ännu samma teckenuppsättning?
Autenticitet
Digital information är lättare att kopiera, redigera och manipulera på annat sätt. Det kan därför vara svårt att fastställa ett digitalt dokuments autenticitet.
Kopiera digitalt material
Digital lagring gör det vanligtvis mycket snabbare, enklare och billigare att skapa flera kopior av materialet. Jämför: böcker, fotografier, analogt lagrat ljud
och film. Föreklar skapande av säkerhetskopior. I
princip borde digitalt material vara säkrare än analogt. Hur är det i praktiken??? Ibland är det säkrast att printa ut på papper ...
Exempel personliga fotografier
Vanligtvis har man vanliga analoga foton lagrade i fotoalbum och negativen lagrade i närheten... Vem har negativen på annat håll än hemma?
2 kopior ger bra skydd bara de lagras på olika håll. Digitala foton får inga (egentliga) negativ ...
Dyrt att ta kopior på negativ och pappersfoton (jämfört med digitalt lagrade)
Digitala foton kan mycket billigt kopieras t.ex. Till olika CDn eller DVD skivor, vilka kan placeras på olika håll.
Själv tar jag ut de viktigaste digifotona på papper (ej enbart av säkerhetsskäl)
Strategiska koncept för långtidslagring
Använd leverantörsoberoende standarder Kontinuerlig överflyttning av data till nya
lagringsmedia Detta medför dock stora kostnader,
kontinuitetsproblem och risker vad gäller dataintegriteten
Konvertering & migrering
Konvertering: förflyttning mellan olika versioner av ett program. Till nyaste versionen, den förväntas stödas i
många år ... Migrering: Ny systemmiljö eller tillämpning.
Om ett medium överlever 50år, kan vi läsa det?
Med jämna mellanrum borde gamla data migreras till nu gällande systemmiljö och tillämpning
Lagringsmedier ändras Medier som jag använt under min tid som datoranvändare.
(hålkort / hålremsor) C-kasett !!! (1983) Magnetband (stora öppna rullar) DAT DDS, DDS3, DDS4, DLT (olika versioner)
Massor av bandtyper har existerat Disketter 8 tum Disketter 5 ¼ tum, olika format Disketter 3 ½ tum CD DVD Olika typer av skivminnen, ZIP, JAZZ USB minnen. Hårdskivor (olika typer och standarder)
Många av dessa är svåra att läsa idag
Lagring av media
Magnetiska och optiska databärare bör förvaras i + 15 grader C (+/- 2 grader) vid 30 % relativ luftfuktighet (+/- 5 %)
Magnetiska databärare skall dessutom skyddas mot skadlig elektromagnetisk påverkan.
Ju mer förvaringsklimatet avviker från rekommenderade värden, desto kortare blir den fysiska livslängden.
CD
En CD-ROM rymmer cirka 600 MB (megabytes). En CD-skivas fysiska livslängd är beroende av dess kvalitet och
kan även variera mellan enskilda exemplar. Längst håller skivormed guldlager i glas men den vanligaste materialkombinationen är zinklager i plast.
Förutsatt att förslutningen runt kanterna är helt tät kan en ordinär CD-skiva med zinklager i plast ha en förväntad livslängd på 20 - 50 år. En försiktig policy är att räkna med 10 år.
Tack vare den stora spridning CD-formatet fått på marknaden är risken liten att formatet och standarden plötsligt skulle försvinna.
Nya optiska lagringsmedia som DVD förutsätts vara kompatibla med CD-standarden. Prognoserna för den tekniska livslängden är alltså för närvarande god.
Kodak GOLD 100-tals år???
DVD
Digital Versatile Disc (DVD) är CD-ROM-skivans efterföljare.
Den har samma fysiska storlek men en lagringskapacitet som vida överstiger CD:n. För närvarande finns DVD-skivor som klarar att lagra 4.7 GB - 18 GB, d v s en kapacitet som motsvarar 8 - 30 CD. Den fysiska livslängden är densamma som för CD, och hållbarheten bör inte beräknas till mer än 10 år.
prognosen för den tekniska livslängden måste anses som god.
BlueRay och HD-DVD nästa.
Magnetband
De stora rullar med magnetband som en gång var symbolen för storebrorsamhället och den automatiska databehandlingen är idag så gott som helt försvunna. Data som finns på s k öppen rulle bör snarast migreras till annan typ av databärare.
Bandkassetter
Massor av typer Bör skrivas om med jämna mellanrum
Disketter
Disketter olika typer, håller några år Read error
ZIP, JAZZ Dagens (bärbara)datorer saknar
diskettstation (3 ½ tum).
Rutiner
System för att sköta konvertering och Migrering
Plan eller strategi Principer för arkivering och gallring
Format för datalagring
Val av format har betydelse för den tekniska livslängden. Hur ofta man måste konvertera eller migrera
data Finns inga riktigt bra lösningar, men vissa
rekommendationer kan göras.
Långtidslagring av olika data
Texter: ASCII (1963) eller Unicode. .TXT eller .RTF ej gärna t.ex. .DOC
PDF & SGML Databaser: Som ej används aktivt (dumpas
som t.ex. Textfiler) Rastergrafik: TIFF eller JPEG Ljud & Film: MPEG-1 och MPEG-2, MP3
Digital Negative (DNG)
Råfilsformaten blir allt vanligare inom digitalfotografin eftersom de ger yrkesfotografen bättre kreativ kontroll. Men kamerorna har många olika råformat – för vilka specifikationerna inte är allmänt tillgängliga; detta medför att inte alla råfiler kan läsas av alla program. Specialformaten utgör en osäkerhetsfaktor vid långtidsarkivering och kan försvåra användning av dem i komplexa arbetsflöden.
Lösningen på problemet? DNG-formatet (Digital Negative) är ett öppet arkiveringsformat för råfiler från digitalkameror. Genom att tillgodose behovet av en öppen standard för råfiler från olika kameramodeller kan DNG bidra till att bildfilerna kan öppnas även i framtiden
Säkerhetskopiering
Vad kopieras? Hur ofta? Till vilket medium? I vilket format lagras data? Var lagras kopiorna? Hur länge sparas kopiorna? Regelbundna rutiner! Verifiering av säkerhetskopiorna!
Vad kopieras
I dagens läge lagras enorma mängder data på våra datorer. Om man tar regelbundna kopior och sparar många generationer, blir det dyrt att ta kopior på allt.
Man bör noga göra upp en plan på vad som skall säkerhetskopieras.
Hur ofta tas kopior?
En av de enklare frågorna: Hur mycket data är du beredd att förlora?
Nyhet: Continuous Backup (Countinuous Data Protection) Backup genast då ändringar sker.
Till vilket medium
Hur dyrt? Hur hållbart?
Om kopiorna skall lagras länge Hur snabbt?
Viktigt om stora datamängder Viktigt om man snabbt måste få tillbaka
materialet
Var lagras kopiorna För att uppnå hög säkerhet bör säkerhetskopiorna lagras på
annat ställe än de data som säkerhetskopieras Gärna minst 10km åtskilda Gärna i låsta utrymmen Gärna brandsäkert förvar Gärna krypterade??? Faror
Brand Stöld Skadegörelse Naturkatastrofer Krig Datorvirus Mjukvarufel
Hur länge lagras kopiorna?
Hur många veckor/månader/år vill man ha möjlighet att hämta tillbaka material från?
Om dator/skivminne går sönder är det oftast den senaste säkerhetskopian som är intressant.
Om information strukits/förstörts vid okänd tidpunkt, vill man kunna gå tillbaka och söka efter senast fungerande kopia.
Lagstiftning & andra regler
Hur många generationer sparas?
Vanligt fel: Endast en säkerhetskopia sparas Fel i data på datorn -> samma fel på
säkerhetskopian Felet har upptäckts för sent Om man sparar flera generationer kan man gå
tillbaka till fungerande version
Regelbundna rutiner
För att säkerhetskopieringen skall fungera, bör man ha rutiner som efterlevs.
Typexempel: Brukar ta säkerhetskopia varje fredag. Maskin går sönder
Förra fredagen var jag på semester Fredagen före satt jag i möte Fredagen före det var jag på arbetsresa Senast en kopia togs var för 2 månader sedan ...
Automatisera säkerhetskopieringen!
Verifiering av säkerhetskopiorna
Man måste använda säkerhetskopiorna eller på annat sätt verifiera att man verkligen har användbara data på backuperna.
Typexempel: Kopior tas regelbundet Någon kollar t.o.m. i loggfiler att kopieringen skett Alla kopior är ändå obrukbara av någon orsak
Finns fall där man tagit 10-tals eller 100-tals kopior som alla är obrukbara, ingen har någonsin kollat att rutinerna och utrustningen fungerar, före katastrofen är ett faktum.
Automatisk verifiering är bra, men manuell verifiering är nödvändig!
Depåbibliotek Lagring av pappersmaterial tar mycket utrymme och
kostar ... Nationalbiblioteket ansvar för kulturarvet i de flesta
länder (pliktexemplar) Inga pliktexemplar för elektroniskt material. För tillfäller rekommenderas PDF och SGML som
standard för dokumentlagring. Material som skall långtidsarkiverad borde konverteras till dessa format.
XML är en annan vedertagen standard