2
Místo úvoduREALITA = mnoho digitalizovaných a
digitálních objektů doplněných různě provázanou množinou metadat:– popisná metadata (abychom mohli objekt
nalézt)– technická metadata (abychom mohli vyjádřit
vlastnosti objektu – obrázek, text, audio, ...)– strukturální metadata (abychom mohli propojit
objekty a metadata mezi sebou)– administrativní metadata (abychom mohli
objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)
3
Místo úvodu – příklad
PŘÍKLAD – periodikum 19./20. století:– vícenásobná struktura (roky, ročníky,
svazky, čísla, strany, články)• metadata titulu vs. metadata čísla vs.
metadata článku• metadata pro vyhledávání (např. získaná
OCR)• objekty pro zobrazování a služby pro
dodávání (např. konverze do djvu/pdf formátu)
4
5
METS – základní informace• METS = standard pro zachycení a výměnu
metadat v prostředí digitálních a digitalizovaných objektů
• METS = schéma založené na XML• z iniciativy Digital Library Federation (DLF,
http://www.diglib.org/)• správcem je Kongresová knihovna (viz www
http://www.loc.gov/standards/mets/), která provozuje elektronickou konferenci na [email protected]
• od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)
6
METS – proč ?• analogická situace s automatizací knihovního
prostředí 70. let – potřeba výměnného formátu (ISO2709/AACR/MARC)
• cílem digitálních knihoven není pouhé seskupení dat, ale poskytování služeb, které vyžadují spolupráci (linkování, dodávání, apod.)
• digitální knihovny zpracovávají složitější části reality než tradiční knihovní systémy
• speciálním úkolem digitálních knihoven je dlouhodobá ochrana obsahu (OAIS: S/A/D)
• standardizace tyto úkoly řeší efektivněji
7
METS – příklad
8
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následujích 5 sekcí metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
9
METS – základní části
METS Header
Administrativemetadata
FileInventory
Structuremap
Descriptivemetadata
Behavioralmetadata
optional
optional
optional required
optional optional
převzato z prezentace Smith MacKenzie (MIT, 2003)
10
• lze je zpracovat dvojím způsobem:– odkazem <mdRef>
– druh odkazu: URN, URL, PURL, DOI ...– druh metadat: MARC, EAD, DC,
NISOIMG, TEI, ...– popisek
METS – <dmdSec> odkazem
11
METS – <dmdSec> přímo– přímo v METS dokumentu
<mdWrap>:
12
METS – popisná metadata• přímé vkládání i volání odkazem lze
kombinovat• pro stejný objekt lze použít
vícenásobný různý zápis (TEI, MARC i DC)
• důležité je zachování identifikátorů (jak uvidíme záhy)
• využití existujících popisů! (i když každý objekt má mít svůj vlastní popis)
13
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
14
METS – <amdSec>vyjadřuje různé aspekty objektů:
– technické údaje (formát, typ, velikost, ...)– autorská práva– informace o zdroji, ze kterého digitalizované
verze vznikla (popisné, administrativní)– informace o cestě, jakou objekt ze zdroje
vznikl (konverze, kopie, verze, ...)
15
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
16
METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>
<FLocat> vyjadřuje umístění souboru
<FContent> nabízí použití kontrolních součtů např. MD5
<GroupID> umožňuje vyjádřit manifestace
17
METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>
<FLocat> vyjadřuje umístění souboru
<FContent> nabízí použití kontrolních součtů např. MD5
<GroupID> umožňuje vyjádřit manifestace
e tc ., e tc ., e tc.
F ile G ro up F ile
F ile G ro up F ile
F ile In ve n to ry(F ile G ro u p)
převzato z prezentace Smith MacKenzie (MIT, 2003)
18
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
19
METS – <structMap>• jádro METS dokumentu, které spojuje
jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů
• vazba je realizována prostřednictvím:– <fptr> ... ukazatel na fyzický soubor v
rámci aktuálního METS dokumentu– <mptr> ... ukazatel na jiný METS
dokument, který obsahuje požadovanou informaci
20
<div> vyjadřuje jednotlivé části dokumentu
<fptr> odkazuje na identifikátory použité v sekci <fileSec>
<mptr> umožňuje zachovat rozumnou velikost METS souborů u složitých reprezentací (např. periodika)
<area> <par> <seq>
21
e tc ., e tc. e tc ....
D iv is io n M E T S P o in te r F ile P o in te r
D iv is io n M E T S P o in te r F ile P o in te r
D iv is io n
S tru c tu ra l M ap
METS – <structMap>
převzato z prezentace Smith MacKenzie (MIT, 2003)
22
METS – praktické dopady• poměrně náročná datová struktura, kterou
nelze pohodlně vytvářet s běžným editorem• vyžaduje koordinaci při implementaci:
– existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat
– existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat
23
METS – přehled implementacíhttp://sunsite.berkeley.edu/mets/registry/
– UC, Berkeley (EAD<>METS)– National Library of Portugal (eContent editor)– California Digital Library (TEI, EAD<>METS)– Culturnet Cymru (TEI<>METS)– FCLA (conversion ETD<>METS)– Harvard, Göttingen, Library of Congress,
Oxford, MIT, OCLC, RLG, Stanford, Graz aj.
implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...
24
METS – současný stav• z amerického standardu se stává
světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005)
• rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí)
• předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)
25
METS pro uživatele
26
METS záznamu strany
27
METS záznamu svazku
28
... jhove, textMD