29
Stručný úvod do METS Martin Vojnar Vědecká knihovna v Olomouci <[email protected]>

Stručný úvod do METS

  • Upload
    robert

  • View
    31

  • Download
    0

Embed Size (px)

DESCRIPTION

Stručný úvod do METS. Martin Vojnar Vědecká knihovna v Olomouci . Místo úvodu. REALITA = mnoho digitalizovaných a digitálních objektů doplněných různě provázanou množinou metadat: popisná metadata (abychom mohli objekt nalézt) - PowerPoint PPT Presentation

Citation preview

Page 1: Stručný úvod do METS

Stručný úvod do METS

Martin VojnarVědecká knihovna v Olomouci

<[email protected]>

Page 2: Stručný úvod do METS

2

Místo úvoduREALITA = mnoho digitalizovaných a

digitálních objektů doplněných různě provázanou množinou metadat:– popisná metadata (abychom mohli objekt

nalézt)– technická metadata (abychom mohli vyjádřit

vlastnosti objektu – obrázek, text, audio, ...)– strukturální metadata (abychom mohli propojit

objekty a metadata mezi sebou)– administrativní metadata (abychom mohli

objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)

Page 3: Stručný úvod do METS

3

Místo úvodu – příklad

PŘÍKLAD – periodikum 19./20. století:– vícenásobná struktura (roky, ročníky,

svazky, čísla, strany, články)• metadata titulu vs. metadata čísla vs.

metadata článku• metadata pro vyhledávání (např. získaná

OCR)• objekty pro zobrazování a služby pro

dodávání (např. konverze do djvu/pdf formátu)

Page 4: Stručný úvod do METS

4

Page 5: Stručný úvod do METS

5

METS – základní informace• METS = standard pro zachycení a výměnu

metadat v prostředí digitálních a digitalizovaných objektů

• METS = schéma založené na XML• z iniciativy Digital Library Federation (DLF,

http://www.diglib.org/)• správcem je Kongresová knihovna (viz www

http://www.loc.gov/standards/mets/), která provozuje elektronickou konferenci na [email protected]

• od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)

Page 6: Stručný úvod do METS

6

METS – proč ?• analogická situace s automatizací knihovního

prostředí 70. let – potřeba výměnného formátu (ISO2709/AACR/MARC)

• cílem digitálních knihoven není pouhé seskupení dat, ale poskytování služeb, které vyžadují spolupráci (linkování, dodávání, apod.)

• digitální knihovny zpracovávají složitější části reality než tradiční knihovní systémy

• speciálním úkolem digitálních knihoven je dlouhodobá ochrana obsahu (OAIS: S/A/D)

• standardizace tyto úkoly řeší efektivněji

Page 7: Stručný úvod do METS

7

METS – příklad

Page 8: Stručný úvod do METS

8

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následujích 5 sekcí metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

Page 9: Stručný úvod do METS

9

METS – základní části

METS Header

Administrativemetadata

FileInventory

Structuremap

Descriptivemetadata

Behavioralmetadata

optional

optional

optional required

optional optional

převzato z prezentace Smith MacKenzie (MIT, 2003)

Page 10: Stručný úvod do METS

10

• lze je zpracovat dvojím způsobem:– odkazem <mdRef>

– druh odkazu: URN, URL, PURL, DOI ...– druh metadat: MARC, EAD, DC,

NISOIMG, TEI, ...– popisek

METS – <dmdSec> odkazem

Page 11: Stručný úvod do METS

11

METS – <dmdSec> přímo– přímo v METS dokumentu

<mdWrap>:

Page 12: Stručný úvod do METS

12

METS – popisná metadata• přímé vkládání i volání odkazem lze

kombinovat• pro stejný objekt lze použít

vícenásobný různý zápis (TEI, MARC i DC)

• důležité je zachování identifikátorů (jak uvidíme záhy)

• využití existujících popisů! (i když každý objekt má mít svůj vlastní popis)

Page 13: Stručný úvod do METS

13

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

Page 14: Stručný úvod do METS

14

METS – <amdSec>vyjadřuje různé aspekty objektů:

– technické údaje (formát, typ, velikost, ...)– autorská práva– informace o zdroji, ze kterého digitalizované

verze vznikla (popisné, administrativní)– informace o cestě, jakou objekt ze zdroje

vznikl (konverze, kopie, verze, ...)

Page 15: Stručný úvod do METS

15

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

Page 16: Stručný úvod do METS

16

METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>

<FLocat> vyjadřuje umístění souboru

<FContent> nabízí použití kontrolních součtů např. MD5

<GroupID> umožňuje vyjádřit manifestace

Page 17: Stručný úvod do METS

17

METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>

<FLocat> vyjadřuje umístění souboru

<FContent> nabízí použití kontrolních součtů např. MD5

<GroupID> umožňuje vyjádřit manifestace

e tc ., e tc ., e tc.

F ile G ro up F ile

F ile G ro up F ile

F ile In ve n to ry(F ile G ro u p)

převzato z prezentace Smith MacKenzie (MIT, 2003)

Page 18: Stručný úvod do METS

18

METS – základní částiMETS obsahuje (ale primárně

nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>

Page 19: Stručný úvod do METS

19

METS – <structMap>• jádro METS dokumentu, které spojuje

jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů

• vazba je realizována prostřednictvím:– <fptr> ... ukazatel na fyzický soubor v

rámci aktuálního METS dokumentu– <mptr> ... ukazatel na jiný METS

dokument, který obsahuje požadovanou informaci

Page 20: Stručný úvod do METS

20

<div> vyjadřuje jednotlivé části dokumentu

<fptr> odkazuje na identifikátory použité v sekci <fileSec>

<mptr> umožňuje zachovat rozumnou velikost METS souborů u složitých reprezentací (např. periodika)

<area> <par> <seq>

Page 21: Stručný úvod do METS

21

e tc ., e tc. e tc ....

D iv is io n M E T S P o in te r F ile P o in te r

D iv is io n M E T S P o in te r F ile P o in te r

D iv is io n

S tru c tu ra l M ap

METS – <structMap>

převzato z prezentace Smith MacKenzie (MIT, 2003)

Page 22: Stručný úvod do METS

22

METS – praktické dopady• poměrně náročná datová struktura, kterou

nelze pohodlně vytvářet s běžným editorem• vyžaduje koordinaci při implementaci:

– existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat

– existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat

Page 23: Stručný úvod do METS

23

METS – přehled implementacíhttp://sunsite.berkeley.edu/mets/registry/

– UC, Berkeley (EAD<>METS)– National Library of Portugal (eContent editor)– California Digital Library (TEI, EAD<>METS)– Culturnet Cymru (TEI<>METS)– FCLA (conversion ETD<>METS)– Harvard, Göttingen, Library of Congress,

Oxford, MIT, OCLC, RLG, Stanford, Graz aj.

implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...

Page 24: Stručný úvod do METS

24

METS – současný stav• z amerického standardu se stává

světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005)

• rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí)

• předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)

Page 25: Stručný úvod do METS

25

METS pro uživatele

Page 26: Stručný úvod do METS

26

METS záznamu strany

Page 27: Stručný úvod do METS

27

METS záznamu svazku

Page 28: Stručný úvod do METS

28

... jhove, textMD

Page 29: Stručný úvod do METS

Otázky ?

Martin VojnarVědecká knihovna v Olomouci

<[email protected]>