Stručný úvod do METS

Preview:

DESCRIPTION

Stručný úvod do METS. Martin Vojnar Vědecká knihovna v Olomouci . Místo úvodu. REALITA = mnoho digitalizovaných a digitálních objektů doplněných různě provázanou množinou metadat: popisná metadata (abychom mohli objekt nalézt) - PowerPoint PPT Presentation

Citation preview

Stručný úvod do METS

Martin VojnarVědecká knihovna v Olomouci

<vojnar@vkol.cz>

2

Místo úvoduREALITA = mnoho digitalizovaných a

digitálních objektů doplněných různě provázanou množinou metadat:– popisná metadata (abychom mohli objekt

nalézt)– technická metadata (abychom mohli vyjádřit

vlastnosti objektu – obrázek, text, audio, ...)– strukturální metadata (abychom mohli propojit

objekty a metadata mezi sebou)– administrativní metadata (abychom mohli

objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)

3

Místo úvodu – příklad

PŘÍKLAD – periodikum 19./20. století:– vícenásobná struktura (roky, ročníky,

svazky, čísla, strany, články)• metadata titulu vs. metadata čísla vs.

metadata článku• metadata pro vyhledávání (např. získaná

OCR)• objekty pro zobrazování a služby pro

dodávání (např. konverze do djvu/pdf formátu)

4

5

METS – základní informace• METS = standard pro zachycení a výměnu

metadat v prostředí digitálních a digitalizovaných objektů

• METS = schéma založené na XML• z iniciativy Digital Library Federation (DLF,

http://www.diglib.org/)• správcem je Kongresová knihovna (viz www

http://www.loc.gov/standards/mets/), která provozuje elektronickou konferenci na mets@loc.gov

• od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)

6

METS – proč ?• analogická situace s automatizací knihovního

prostředí 70. let – potřeba výměnného formátu (ISO2709/AACR/MARC)

• cílem digitálních knihoven není pouhé seskupení dat, ale poskytování služeb, které vyžadují spolupráci (linkování, dodávání, apod.)

• digitální knihovny zpracovávají složitější části reality než tradiční knihovní systémy

• speciálním úkolem digitálních knihoven je dlouhodobá ochrana obsahu (OAIS: S/A/D)

• standardizace tyto úkoly řeší efektivněji

7

METS – příklad

8

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následujích 5 sekcí metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

9

METS – základní části

METS Header

Administrativemetadata

FileInventory

Structuremap

Descriptivemetadata

Behavioralmetadata

optional

optional

optional required

optional optional

převzato z prezentace Smith MacKenzie (MIT, 2003)

10

• lze je zpracovat dvojím způsobem:– odkazem <mdRef>

– druh odkazu: URN, URL, PURL, DOI ...– druh metadat: MARC, EAD, DC,

NISOIMG, TEI, ...– popisek

METS – <dmdSec> odkazem

11

METS – <dmdSec> přímo– přímo v METS dokumentu

<mdWrap>:

12

METS – popisná metadata• přímé vkládání i volání odkazem lze

kombinovat• pro stejný objekt lze použít

vícenásobný různý zápis (TEI, MARC i DC)

• důležité je zachování identifikátorů (jak uvidíme záhy)

• využití existujících popisů! (i když každý objekt má mít svůj vlastní popis)

13

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

14

METS – <amdSec>vyjadřuje různé aspekty objektů:

– technické údaje (formát, typ, velikost, ...)– autorská práva– informace o zdroji, ze kterého digitalizované

verze vznikla (popisné, administrativní)– informace o cestě, jakou objekt ze zdroje

vznikl (konverze, kopie, verze, ...)

15

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

16

METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>

<FLocat> vyjadřuje umístění souboru

<FContent> nabízí použití kontrolních součtů např. MD5

<GroupID> umožňuje vyjádřit manifestace

17

METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>

<FLocat> vyjadřuje umístění souboru

<FContent> nabízí použití kontrolních součtů např. MD5

<GroupID> umožňuje vyjádřit manifestace

e tc ., e tc ., e tc.

F ile G ro up F ile

F ile G ro up F ile

F ile In ve n to ry(F ile G ro u p)

převzato z prezentace Smith MacKenzie (MIT, 2003)

18

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

19

METS – <structMap>• jádro METS dokumentu, které spojuje

jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů

• vazba je realizována prostřednictvím:– <fptr> ... ukazatel na fyzický soubor v

rámci aktuálního METS dokumentu– <mptr> ... ukazatel na jiný METS

dokument, který obsahuje požadovanou informaci

20

<div> vyjadřuje jednotlivé části dokumentu

<fptr> odkazuje na identifikátory použité v sekci <fileSec>

<mptr> umožňuje zachovat rozumnou velikost METS souborů u složitých reprezentací (např. periodika)

<area> <par> <seq>

21

e tc ., e tc. e tc ....

D iv is io n M E T S P o in te r F ile P o in te r

D iv is io n M E T S P o in te r F ile P o in te r

D iv is io n

S tru c tu ra l M ap

METS – <structMap>

převzato z prezentace Smith MacKenzie (MIT, 2003)

22

METS – praktické dopady• poměrně náročná datová struktura, kterou

nelze pohodlně vytvářet s běžným editorem• vyžaduje koordinaci při implementaci:

– existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat

– existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat

23

METS – přehled implementacíhttp://sunsite.berkeley.edu/mets/registry/

– UC, Berkeley (EAD<>METS)– National Library of Portugal (eContent editor)– California Digital Library (TEI, EAD<>METS)– Culturnet Cymru (TEI<>METS)– FCLA (conversion ETD<>METS)– Harvard, Göttingen, Library of Congress,

Oxford, MIT, OCLC, RLG, Stanford, Graz aj.

implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...

24

METS – současný stav• z amerického standardu se stává

světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005)

• rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí)

• předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)

25

METS pro uživatele

26

METS záznamu strany

27

METS záznamu svazku

28

... jhove, textMD

Otázky ?

Martin VojnarVědecká knihovna v Olomouci

<vojnar@vkol.cz>

Recommended