33
Digitální zpřístupnění Digitální zpřístupnění knihovních sbírek knihovních sbírek Adolf Knoll Adolf Knoll Národní knihovna České Národní knihovna České republiky republiky [email protected] [email protected]

Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Embed Size (px)

Citation preview

Page 1: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Digitální zpřístupnění Digitální zpřístupnění knihovních sbírekknihovních sbírek

Adolf KnollAdolf KnollNárodní knihovna České Národní knihovna České

[email protected]@nkp.cz

Page 2: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Page 3: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Digitalizační aktivityDigitalizační aktivity► 1992/1993 – První pilotní projekt programu 1992/1993 – První pilotní projekt programu

UNESCO Paměť světaUNESCO Paměť světa► 1995 – další pilotní projekty1995 – další pilotní projekty► 1996 – počátek rutinní digitalizace1996 – počátek rutinní digitalizace► 2000 – národní programy2000 – národní programy► 2003/2004 – spuštění digitálních knihoven2003/2004 – spuštění digitálních knihoven► ->-> 2010 – vytvoření virtuálního 2010 – vytvoření virtuálního

badatelského prostředí pro historické badatelského prostředí pro historické dokumenty a sbírkydokumenty a sbírky

Page 4: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

StandardizaceStandardizace► Složený digitální Složený digitální

dokument:dokument: Datová částDatová část Metadatová částMetadatová část

► Jak strukturovat?Jak strukturovat?

► Komplexní Komplexní dokumentový formátdokumentový formát

Page 5: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Značkovací jazykyZnačkovací jazyky►Platforma SGML je pro takový formát Platforma SGML je pro takový formát

ideálníideální►Naše programy:Naše programy:

Vlastní SGML implementace (DOBM) – 1996 Vlastní SGML implementace (DOBM) – 1996 – v r. 1999 jako doporučení UNESCO– v r. 1999 jako doporučení UNESCO

XML platforma od r. 2003/2004XML platforma od r. 2003/2004►Namapování standardů pro popis Namapování standardů pro popis

obsahu, doporučených postupů a dalších obsahu, doporučených postupů a dalších řešenířešení

Page 6: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Metadata

Page 7: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Metadata – co popsatMetadata – co popsat► IdentifikaceIdentifikace►ObsahObsah►StrukturaStruktura►Technické parametryTechnické parametry►KomunikaceKomunikace

► Jak: naše konkrétní řešení jsou Jak: naše konkrétní řešení jsou promítnuta do těchto strukturálních promítnuta do těchto strukturálních součástísoučástí

ZPŘÍSTUPNĚNÍ PROSTŘEDNICTVÍM DEFINOVANÉ KOMPATIBILITY

Page 8: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Identifikační metadataIdentifikační metadata► Katalogizační a další identifikační pravidlaKatalogizační a další identifikační pravidla► MARC, Dublin Core, MASTER, …, v knihovnáchMARC, Dublin Core, MASTER, …, v knihovnách► EAD v archivechEAD v archivech► AMICO, CIDOC, REACH Element Set, …, v AMICO, CIDOC, REACH Element Set, …, v

muzeíchmuzeích► … … in …in …

► ROLE: identifikovat virtuální reprezentaci ROLE: identifikovat virtuální reprezentaci originálu (ve vztahu k originálu)originálu (ve vztahu k originálu)

Page 9: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Metadata pro popis obsahuMetadata pro popis obsahu► Žádná pevná pravidla nejsou k dispozici – nebo Žádná pevná pravidla nejsou k dispozici – nebo

jen částečně – většinou ověřené praktické jen částečně – většinou ověřené praktické postupypostupy

►Musíme je vzít a formálně zabudovat do Musíme je vzít a formálně zabudovat do struktury dokumentustruktury dokumentu

► Většinou základní povinná úroveň je velmi Většinou základní povinná úroveň je velmi jednoduchá, ale musí vyhovět nejčastějším jednoduchá, ale musí vyhovět nejčastějším uživatelským potřebámuživatelským potřebám

Page 10: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Strukturální metadataStrukturální metadata►Musí být namapována struktura celého Musí být namapována struktura celého

dokumentu (se všemi nejčastějšími dokumentu (se všemi nejčastějšími zvláštnostmi):zvláštnostmi): Fyzické částiFyzické části Logické části, které chceme specifickým Logické části, které chceme specifickým

způsobem pojednat (články, kapitoly, způsobem pojednat (články, kapitoly, vztažené objekty, …)vztažené objekty, …)

►Zde je často nesnadné stanovit Zde je často nesnadné stanovit povinné elementypovinné elementy

Page 11: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Page 12: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Technická metadataTechnická metadataExistence vysoce profesionálních standardůExistence vysoce profesionálních standardů

vs.vs.Naše pragmatické a skutečné potřebyNaše pragmatické a skutečné potřeby

► Rigorózní standardy je třeba aplikovat tam, Rigorózní standardy je třeba aplikovat tam, kde mohou dobře sloužit cílům projektu, ale kde mohou dobře sloužit cílům projektu, ale tam, kde by byly jen cílem pro sebe sama, tam, kde by byly jen cílem pro sebe sama, bychom měli mít odvahu se rozhodnout jinakbychom měli mít odvahu se rozhodnout jinak

► ROLE: vyřešit současné a budoucí zobrazení, ROLE: vyřešit současné a budoucí zobrazení, přehrání nebo tisk správně a na nezbytné přehrání nebo tisk správně a na nezbytné kvalitativní úrovnikvalitativní úrovni

Page 13: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Komunikační metadataKomunikační metadata►Zajišťují integraci do širšího virtuálního Zajišťují integraci do širšího virtuálního

prostředíprostředí►Komunikace mezi aplikacemi digitální Komunikace mezi aplikacemi digitální

knihovny a vyhledávacími portályknihovny a vyhledávacími portály►Standardizované protokoly: Z39.50, Standardizované protokoly: Z39.50,

OAI-PMHOAI-PMH, …, …► Je třeba si odsouhlasit profily, tj. Je třeba si odsouhlasit profily, tj.

minimální identifikační záznamyminimální identifikační záznamy

Page 14: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Digital Library Applications

Manuscriptorium Kramerius

KATALOGY(Souborný katalog ČR bude mít funkci

souborného katalogu digitálního obsahu)

PORTÁLY

TEL (http://theeuropeanlibrary.org)JIB (http://www.jib.cz)

CERL-MSS (https://diva.ub.uu.se/test/cerl/index.xml)

Page 15: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Metadata: jak popsatMetadata: jak popsat► Cílem je strukturovaný formát definovaný Cílem je strukturovaný formát definovaný

formálně jako DTD nebo W3C Schémaformálně jako DTD nebo W3C Schéma

►Mnoho z výše uvedených skutečností závisí Mnoho z výše uvedených skutečností závisí na našem výběru/rozhodnutína našem výběru/rozhodnutí

►Naše formáty pro digitalizované dokumenty: Naše formáty pro digitalizované dokumenty: rukopisy, periodika, monografie, zvukové rukopisy, periodika, monografie, zvukové dokumenty, sbírkové předměty, dokumenty, sbírkové předměty, komunikační profily, historický fultextkomunikační profily, historický fultext

Page 16: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Budoucí vývojBudoucí vývoj► XML platforma se zdá zatím dostatečně XML platforma se zdá zatím dostatečně

robustnírobustní►Nové přístupy a dílčí platformy se budou Nové přístupy a dílčí platformy se budou

objevovat – například METS (strukturovaná objevovat – například METS (strukturovaná kontejnerizace)kontejnerizace)

► Jestliže jsou naše analýzy správné, budou starší Jestliže jsou naše analýzy správné, budou starší a novější základně mezi sebou kompatibilnía novější základně mezi sebou kompatibilní

► Změny stojí peníze: nástroje na výrobu Změny stojí peníze: nástroje na výrobu digitálních dokumentů, na jejich zpřístupnění, digitálních dokumentů, na jejich zpřístupnění, na…na…

Page 17: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Data

Page 18: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Data: co ukázatData: co ukázat►Datové soubory jsou cílem Datové soubory jsou cílem

uživatelského zájmu (obrazy, fulltext, uživatelského zájmu (obrazy, fulltext, audio nebo video soubory)audio nebo video soubory)

►Originál je jimi přímo reprezentovánOriginál je jimi přímo reprezentován►Kvalita dat:Kvalita dat:

Archivní souboryArchivní soubory Uživatelské souboryUživatelské soubory

►Obě úrovně jsou primárně definovány Obě úrovně jsou primárně definovány cíli našich projektůcíli našich projektů

Page 19: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Archivní souboryArchivní soubory► Funkce ochrany a záchrany originálůFunkce ochrany a záchrany originálů► Většinou ISO nebo velmi rozšířené standardy:Většinou ISO nebo velmi rozšířené standardy:

TIFF, JPEGTIFF, JPEG WAVWAV MPEGMPEG

NekomprimovanéNekomprimované KomprimovanéKomprimované

►bezeztrátověbezeztrátově► ztrátověztrátově

Page 20: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Uživatelské souboryUživatelské soubory►Redukce objemu dat:Redukce objemu dat:

Snížení rozlišení nebo toku dat (bit rate)Snížení rozlišení nebo toku dat (bit rate) Komprese Komprese

Pouze obrazy (+ je třeba zvážit i snížení Pouze obrazy (+ je třeba zvážit i snížení počtu barev):počtu barev):►Mixed Raster ContentMixed Raster Content►Multiresolutional imageMultiresolutional image►Obrazové serveryObrazové servery

Page 21: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Snížení rozlišení/toku datSnížení rozlišení/toku dat► Použití pouze známých formátůPoužití pouze známých formátů►Definovat cíle a smysl dodávání datDefinovat cíle a smysl dodávání dat►Dodávat jen takové rozlišení, které je Dodávat jen takové rozlišení, které je

mírně vyšší než požadovaný limit (náhled, mírně vyšší než požadovaný limit (náhled, základní kvality, normální kvalita, …)základní kvality, normální kvalita, …)

► Většinou oblast JPEG nebo TIFF/GIF Většinou oblast JPEG nebo TIFF/GIF (černobílý obraz); MP3 nebo WMA; WMV (černobílý obraz); MP3 nebo WMA; WMV nebo MPEG4 na Internetunebo MPEG4 na Internetu

Page 22: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Ztrátová kompreseZtrátová komprese►Tradiční schémata: Tradiční schémata:

DCT JPEGDCT JPEG MPEG1, MPEG2MPEG1, MPEG2

►Nová schémata:Nová schémata: JBIG pro černobílý obraz (zatím nerozšířeno)JBIG pro černobílý obraz (zatím nerozšířeno) Wavelet schémata (JPEG 2000 a další Wavelet schémata (JPEG 2000 a další

formáty)formáty) MPEG4MPEG4

Page 23: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Mixed Raster ContentMixed Raster Content

Page 24: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Multiresolutional imageMultiresolutional image

ALL in ONE FILE

Page 25: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Obrazové serveryObrazové serveryDynamické generování požadovaných Dynamické generování požadovaných

částí obrazu resp. kvalitových hladinčástí obrazu resp. kvalitových hladin

Page 26: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

ManuscriptoriumManuscriptoriumSkutečnostSkutečnost

ManuscriptoriumManuscriptorium►souborný katalog vč. některých souborný katalog vč. některých

zahraničních institucízahraničních institucí►ca. 1700 dokumentů, tj. cca 800 000 ca. 1700 dokumentů, tj. cca 800 000

stran vč. několika zahraničníchstran vč. několika zahraničních►obrazový Express Server na mapyobrazový Express Server na mapy►Komunikace Z39.50 (MARC21), OAI-Komunikace Z39.50 (MARC21), OAI-

PMH (DC, MARC21, OpenM, MODS)PMH (DC, MARC21, OpenM, MODS)

Page 27: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

ManuscriptoriumManuscriptoriumZáměryZáměry

► TEI strukturované texty (pilot nyní)TEI strukturované texty (pilot nyní)► CERL-MSS CERL-MSS

https://diva.ub.uu.se/test/cerl/index.xmlhttps://diva.ub.uu.se/test/cerl/index.xml► TELTEL► Audio dataAudio data►Mezinárodní rozšíření – nástroje pro jeho Mezinárodní rozšíření – nástroje pro jeho

podporu, výzva dalším institucím, podporu, výzva dalším institucím, mezinárodní workshop před Inforemmezinárodní workshop před Inforem

► Účast v mezinárodních projektechÚčast v mezinárodních projektech

Page 28: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

KrameriusKrameriusSoučasnostSoučasnost

►1,5 milionu stran (dalších 0,5 milionu 1,5 milionu stran (dalších 0,5 milionu připraveno)připraveno)

►2 velké aplikace (NK, Akademie věd)2 velké aplikace (NK, Akademie věd)►Zabudováno v komerčních nástrojích Zabudováno v komerčních nástrojích

firmy Elsys Engineeringfirmy Elsys Engineering►Wavelet a Mixed Raster Content Wavelet a Mixed Raster Content

technologietechnologie

Page 29: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

KrameriusKrameriusSoučasnostSoučasnost

►Zlepšení komunikace OAI-PMH (DC Zlepšení komunikace OAI-PMH (DC qualified)qualified)

►Dokončení provázanosti na Souborný Dokončení provázanosti na Souborný katalog ČR (vzájemná propojenost)katalog ČR (vzájemná propojenost)

►Další dokumenty: t.č. implementace Další dokumenty: t.č. implementace DTD pro sbírkové předměty, návrh pro DTD pro sbírkové předměty, návrh pro zvukové dokumentyzvukové dokumenty

Page 30: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek

Digitální knihovny a zdrojeDigitální knihovny a zdroje►http://www.manuscriptorium.comhttp://www.manuscriptorium.com►http://kramerius.nkp.czhttp://kramerius.nkp.cz

►Zdroje:Zdroje: http://digit.nkp.czhttp://digit.nkp.cz (naše DTD) (naše DTD)

Page 31: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Page 32: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek
Page 33: Adolf Knoll: Digitální zpřístupnění historických a vzácných knihovních sbírek