29
Ukládání a archivace dat vzniklých digitalizací v Digitálním archivu SOA v Třeboni

Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Ukládání a archivace dat vzniklých digitalizací

v Digitálním archivu

SOA v Třeboni

Page 2: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Vytvořit systém, který bude zaštiťovat postupy spojené s digitalizací archivních materiálů

• vytváření archivních databází a metadat

• kompletní správa datového úložiště

• import snímků z digitalizačních pracovišť

• zpracování snímků

• bezpečné uložení a archivace snímků

• export snímků pro vnější potřeby

• zpřístupnění materiálů uživatelům

Základní cíle projektu

Page 3: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

DigiArchiv

ÚLOŽIŠTĚ MHTF (prohlížecí formát)

ÚLOŽIŠTĚ TIFF (archivní formát)

DigiDepot

Přístup uživatelů přes Internet

WWW rozhraní administrace

IMPORT

přidávání nových

materiálů

EXPORT

export uložených

materiálů

D

A

T

A

B

Á

Z

E

EXPORT ARCHIV

export uložených

materiálů ve formě

balíčků do vnějšího

úložiště

Webová aplikace Datové úložiště

Page 4: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat

1. Databáze metadat materiálů

Page 5: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

1. Databáze popisů materiálů – DigiArchiv

Page 6: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat

2. Import snímků

3. Zpracování snímků

Page 7: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

2. Import snímků – webové rozhraní DigiDepotu

Page 8: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

3. Zpracování snímků – webové rozhraní DigiDepotu

Page 9: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat

4. Export snímků

Page 10: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

4. Export snímků – webové rozhraní DigiDepotu

Page 11: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat

5. Zpřístupňování materiálů

Page 12: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

4. Zpřístupňování materiálů – DigiArchiv

Page 13: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat

Správa datového úložiště

Page 14: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Při vývoji DigiDepotu byly zohledněny především tyto požadavky

• nezávislost na speciálním hardware (DigiDepot přistupuje k úložišti přes standardní systém souborů)

• automatická správa více úložišť (obejití maximální velikosti 2TB volume v operačním systému)

• nulové zásahy ze strany administrátora do systému souborů (práce s originálními snímky bez nutnosti znalosti jejich umístění v datovém úložišti)

• žádný blackbox (data v úložištích ve standardních formátech jsou v případě potřeby dostupná jiným způsobem)

• dodržování standardů (snímky TIFF, popis Dublin Core atd.)

Datové úložiště - DigiDepot

Page 15: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Hardware

• disková pole Petastore Alnico připojená přes optické rozhraní k serveru

• konfigurace RAID6

• rozdělená na volume po 2 TB

Datové úložiště - DigiDepot

Page 16: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Datové úložiště - DigiDepot Princip ukládání originálních snímků

DigiDepot

server

Složka pro import

Data 1 Data 2 Data 3 Data 4 Data 5 Data 6 . . . . . . . .

plná úložiště prázdná úložiště

Složka pro export

Export / Import

vnější archiv

Administrátor

Page 17: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Datové úložiště - DigiDepot On-line zjištění stavu úložišť

Page 18: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Základní funkce DigiDepotu spojené s ukládáním materiálů

• hledání volného úložiště

• konverze snímků a vytváření standardních metadatových souborů

• řešení přesunů dat mezi úložišti

• řešení oprav snímků (mazání, přidávání, přečíslování)

• řešení kontrol snímků (kontrola obsahu na sha1 hash)

• administrátor pracuje pouze se složkami import/export, potřebné vnitřní přesuny realizuje DigiDepot automaticky

Datové úložiště - DigiDepot

Page 19: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat

Archivace dat

Page 20: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Při řešení archivace byly zohledněny především tyto požadavky

• co největší integrace s DigiDepotem

• automatická, pokud možno bezzásahová archivace na páskovou knihovnu

• automatická správa záloh (hlídání změn)

• aplikace mechanizmů kontroly dat na páskách

• 2 sady pásek v geograficky oddělených lokalitách

• možnost automaticky plánovaných kontrol pásek

Archivace dat

Page 21: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Archivace dat Hardware

• pásková knihovna Quantum Scalar i500 připojená přes optické rozhraní k serveru

• 96 slotů, 2 páskové jednotky, robotické podávání

• pásky LTO4 (800GB nekomprimovaně)

• použitý software Netvault Backup (Quest)

Page 22: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Archivace dat Princip původní archivace

DigiDepot

server

Složka pro import

Data 1 Data 2 Data 3 Data 4 Data 5 Data 6 . . . . . . . .

Složka pro export

Export / Import

vnější archiv

Admin

Netvault Pásková knihovna Admin

Page 23: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Původní způsob archivace pouze přes software Netvault nevyhovuje

• nutnost přístupu ke všem úložištím

• úložiště jsou dynamicky přidělována DigiDepotem, pozice materiálu se může změnit => nutno ručně měnit zálohovací joby

• problém s obnovou (pozice materiálu se může změnit)

• nelze kontrolovat obsah pásky (dá se pouze obnovit)

• problém s velkými zálohami – nutnost odzálohovat celý jeden typ materiálu (např. 18 pásek pro matriky)

Archivace dat

Page 24: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Archivace dat Nový princip archivace

DigiDepot

server

Složka pro import

Data 1 Data 2 Data 3 Data 4 Data 5

Složka pro export

Export / Import

vnější archiv

Admin

Netvault

Pásková knihovna

Backup složka

Page 25: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Nový způsob archivace

• přístup Netvaultu pouze k jediné složce „Backup“

• DigiDepot vytváří zálohovací balíčky, ukládá jejich hash do databáze pro kontrolu, automaticky ovládá archivaci do knihovny / obnovu z knihovny

• řešení nezávislé na uložení materiálů v úložištích

• možnost automatické kontroly obsahu pásek

• správa archivace přes webové rozhraní

Archivace dat

Page 26: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Archivace dat Správa záloh z webového rozhraní

Page 27: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Digitalizace snímků digitalizační pracoviště

Import snímků

Zpracování snímků DigiDepot

Datové úložiště DigiDepot

Databáze Databáze metadat DigiArchiv

Export snímků DigiDepot

Potřebné funkce digitálního archivu

Zpřístupňování DigiArchiv

Archivace dat DigiDepot

Page 28: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Podařilo se vytvořit systém, který zahrnuje všechny potřebné funkce pro digitalizaci od ukládání digitalizovaných materiálů a vznik databází metadat po zpřístupnění materiálů badatelům.

Závěr

Page 29: Ukládání a archivace datbulletin.skipcr.cz/prezentace/archivy-2013/Hankovec.pdf · Potřebné funkce digitálního archivu ... (kontrola obsahu na sha1 hash) • administrátor

Děkuji za pozornost

Martin Hankovec