19
Metadata & Webarchiv Jaroslav Kvasnica

Metadata & Webarchiv

Embed Size (px)

Citation preview

Page 1: Metadata & Webarchiv

Metadata &

Webarchiv

Jaroslav Kvasnica

Page 2: Metadata & Webarchiv

Metadata

data o datech

popis (čehokoli)

Page 3: Metadata & Webarchiv
Page 4: Metadata & Webarchiv

date

title

rights

description

author

subject

data

Page 5: Metadata & Webarchiv
Page 6: Metadata & Webarchiv

Data nebo metadata???

Page 7: Metadata & Webarchiv
Page 8: Metadata & Webarchiv

Typy metadat

• popisné (co je to za objekt, jak jej nalézt)

• administrativní (jak objekt spravovat)

• technické (technický popis objektu)

• strukturální (vnitřní uspořadaní objektu)

Page 9: Metadata & Webarchiv

MARC

http://marc-must-die.info/

Page 10: Metadata & Webarchiv

XML!• Dublin Core, MODS, PREMIS, MIX, METS a jiné…

MARC21 MODS

245 $b

600

<subTitle>

<name>534 $c, 760 762, 765, 767, 770, 772, 773, 774, 775, 776, 777, 780, 785, 786, 787 $d <publisher>

020 $a <identifier type=“isbn”>

Page 11: Metadata & Webarchiv

Webarchiv

• digitální archiv českých webových zdrojů

• proč archivovat zrovna web? • ochrana netištěné kulturní, umělecké a historické

produkce pro další generace • přesun publikační činnosti na internet • prchavost elektronických zdrojů

Page 12: Metadata & Webarchiv

Český web?

• bohemikální charakter • území • jazyk • autorství • předmět / obsah

Page 13: Metadata & Webarchiv

Sklízení• Celoplošné sklizně

• doména .cz • seznam URL poskytovaný CZ.NIC

• Výběrové sklizně• manuální výběr zdrojů v rámci temat. kategorií • větší hloubka sklízení

• Tematické sklizně• kolekce URL k vybraným událostem (volby,

olympijské hry atd.)

Page 14: Metadata & Webarchiv

Výběrové sklizně• priority pro tematické oblasti (organizace s celostátní

působností, vědecké zdroje, periodika atd.)

• návrhy od vydavatelů

• technické problémy

• aktivní oslovování vydavatelů

• uzavírání spolupráce

• katalogizace

Page 15: Metadata & Webarchiv

Přístup

• Celoplošné a tematické sklizně • přístupné pouze z terminálů v budově knihovny

• Výběrové sklizně • přístupné online • smlouva • licence Creative Commons

Page 16: Metadata & Webarchiv

Právní otázky• Legal deposit - el. povinný výtisk - pouze v

zahraničí

• Autorský zákon• “knihovní licence” • umožňuje vytváření rozmnoženin díla pouze pro

své archivní a konzervační účely • není možné je sdílet veřejnosti

Page 17: Metadata & Webarchiv

Archiv

• velikost archivu: ~100 TB komprimovaných dat

• stáří archivu: 3. 9. 2001

• frekvence sklízení: 1-12x ročně

• hloubka sklízení: 5000-15000 objektů

Page 18: Metadata & Webarchiv

Spolupráce

Staňte se našimi kurátory!

Page 19: Metadata & Webarchiv

Děkuji za pozornost!

Jaroslav Kvasnica

[email protected]

www.webarchiv.cz

http://www.slideshare.net/raiszt