37
VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL NEDOSTUPNÝCH NA TRHU KRAMERIUS, DNNT Kolokvium knižnično-informačných expertov krajín V4+ 18. června 2019 Anna Cajthamlová, Národní knihovna ČR Pavel Kocourek, INOVATIKA

VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE

DIEL NEDOSTUPNÝCH NA TRHU KRAMERIUS, DNNT

Kolokvium knižnično-informačných expertov krajín V4+ 18. června 2019

Anna Cajthamlová, Národní knihovna ČR

Pavel Kocourek, INOVATIKA

Page 2: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

O ČEM

● DNNT ○ právní rámec ○ projekt RightLib

● Systém KRAMERIUS ○ Kramerius, kdo ho používá a aktuální stav ○ implementace DNNT ○ plánovaný vývoj

● Systém PROARC ○ aktuální stav ○ na čem se pracuje

Page 3: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

PRÁVNÍ RÁMEC PRO DÍLA NEDOSTUPNÁ NA TRHU

DNNT

INOVɅTIKɅ

Page 4: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

NOVELA AUTORSKÉHO ZÁKONA 121/2000 Sb.

▪ Schválení v březnu 2017

▪ Vzniká oprávnění k výkonu práva na „zhotovení rozmnoženiny díla

zařazeného v seznamu děl na trhu nedostupných a zpřístupňování

takové rozmnoženiny díla podle § 18 odst. 2 knihovnou podle

knihovního zákona jednotlivcům ze strany veřejnosti na dobu

nepřesahující 5 kalendářních roků, a to i opakovaně“

Page 6: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

DÍLA NEDOSTUPNÁ NA TRHU

= autorská díla, jejichž doba ochrany autorských práv dosud neuplynula a která na základě rozhodnutí autora či jiného

nositele práv nejsou komerčně dostupná bez ohledu na to, zda v knihovnách a mezi veřejností existují hmotné rozmnoženiny

tohoto díla*

Podle novely AZ zařadí NK do Seznamu dílo, které nebylo možno ve

lhůtě 6 měsíců od navržení na zařazení do Seznamu opatřit za úplatu v

běžné obchodní síti (+ periodika starší 10 let)

Nositel práv je oprávněn vyzvat NK k vyřazení svého díla ze Seznamu

(NK tak učiní nejpozději poslední den následujícího kalendářního

měsíce)

*HAVLOVÁ, Jaroslava. Dílo nedostupné na trhu. In: KTD: Česká terminologická databáze knihovnictví a informační vědy (TDKIV) [online]. Praha : Národní knihovna ČR, 2003- [cit. 2019-06-14]. Dostupné z: http://aleph.nkp.cz/F/?func=direct&doc_number=000014966&local_base=KTD.

Page 7: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

VYJEDNÁVÁNÍ O POPLATCÍCH

▪ Po schválení novely bylo zahájeno vyjednávání o licenčních poplatcích za

zpřístupnění digitalizovaných dokumentů s kolektivními správci (Dilia, OOA-S)

▪ Licenční poplatek bude hrazen roční paušální platbou za všechny knihovny – mělo by

být hrazeno Národní knihovnou, která by na to měla dostat částku z MK ČR – jednání

pokračují

▪ Nejprve bude licence omezena na díla vydaná do konce r. 1989, od r. 2020 na díla

vydaná do konce r. 2007

Page 8: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

PROJEKT RIGHTLIB – ELEKTRONICKÉ ZPŘÍSTUPNĚNÍ CHRÁNĚNÝCH PUBLIKACÍ

▪ Projekt NAKI financovaný Ministerstvem kultury ČR, trvání 2018 –

2022

▪ Řešitelé: Knihovna AV ČR, Národní knihovna ČR, Moravská zemská

knihovna v Brně

▪ Hlavní cíle projektu:

▪ Vytvoření prostředí pro zajištění přístupu k publikacím v digitální podobě, které jsou chráněny

autorským zákonem

▪ Zajištění implementace nových možností zpřístupnění v souvislosti s novelou autorského zákona

▪ Aplikace pro mobilní zařízení

▪ Vytvoření metodiky pro zajištění bezpečného dálkového přístupu i přístupu „na místě samém“

Page 9: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE

DIEL NEDOSTUPNÝCH NA TRHU KRAMERIUS, DNNT

INOVɅTIKɅ

Page 10: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

● open source řešení pro digitální knihovny

● technologie JAVA, Tomcat, PostgresSQL, Apache SOLR Fedora Commons Repository/Akubra

● Kompatibilní s FOXML, METS, MODS, Dublin Core a OAI-PMH

● Od roku 2018 v rámci projektu RightLib Vývoj od 2003 - Národní knihovna, Knihovna akademie věd, MZK a další spolupracující instituce

KRAMERIUS INOVɅTIKɅ

Page 11: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

KRAMERIUS

https://registrkrameriu.mzk.cz/ 40 + digitálních knihoven ~ 85 M skenů

INOVɅTIKɅ

Page 12: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

ČDK - CENTRÁLNÍ KRAMERIUS

• Zastřešení českých digitálních knihoven

• Jedno vyhledávání nad všemi digitalizovanými daty a plnými texty

• Sklízení metadat / indexace - dynamické nahrávání dat

• Agregátor pro projekt Europeana

• Uzavření smluv s agregovanými knihovnami

• 2019 PoC ČDK založená na indexu

https://www.czechdigitallibrary.cz

INOVɅTIKɅ

Page 13: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

https://github.com/ceskaexpedice/kramerius/wiki

KRAMERIUS - OPEN SOURCE INOVɅTIKɅ

Page 14: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

NOVÝ WEB KLIENT

• Společný vývoj v období 2018/19

• Kompletní analytika - chování/využívanost komponent

• http://www.digitalniknihovna.cz/

INOVɅTIKɅ

Page 15: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

Pro přidávání příznaku DNNT byl vytvořen proces, který čte data ze vstupního souboru a vytváří příznak v RELS-EXT a následně v indexu. Spouští se z konfigurace.

DÍLA NEDOSTUPNÁ NA TRHU INOVɅTIKɅ

Page 16: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

ZADÁNÍ • zpřístupnění v knihovně s možností číst dokument • kontrolovaný tisk a zhotovení kopie • dálkový přístup pro registrované uživatele • dočasné využití dokumentu : e-vypůjčka

DÍLA NEDOSTUPNÁ NA TRHU INOVɅTIKɅ

Page 17: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

• přístup pro čtení • autentizovaný uživatel • IP adresy

• zabezpečení přístupu k PDF a tisku (Tisk a PDF export jsou zakázány)

DNNT PRAVIDLA PRO PŘÍSTUP INOVɅTIKɅ

Page 18: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

• ELK fol Logs and Matrics • Elasticsearch • Logstash • Kibana

• Pro každý přístup • PID - pid objektu který byl dotazován. Obrázek případně deskriptor obrázku pro prohlížečku

• remoteAddr - Adresa ze které se byl poslán request

• username, email - Pokud je přihlášený uživatel, vypisuje přihlašovací jméno a email

• rootTitle - Titulek kořenového titulu

• dcTitle - Titulek dotazované stránky

• date - Datum přístupu

• rootPid - PID hlavního dokumentu

• rootModel - Model hlavního dokumentu

DNNT LOGOVÁNÍ INOVɅTIKɅ

Page 19: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

https://github.com/ceskaexpedice/kramerius/wiki/DNNT Další rozvoj - rozšířené logování a způsob označení dnnt dokumentů v UI Q2/Q3

IMPLEMETACE DNNT INOVɅTIKɅ

Page 20: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

PLÁNOVANÝ VÝVOJ INOVɅTIKɅ

Page 21: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

DA

TO

VR

ST

VA

A

PLI

KA

ČN

Í VR

STV

A

WEB

OV

Á

VR

STV

A

VÝROBA DIGITALIZACE

PROARC

PUBLIKACE DIGITÁLNÍ KNIHOVNY

KRAMERIUS

ADMINISTRAČNÍ

PROSTŘEDÍ

APLIKACE

PROARC

JÁDRO

KRAMERIUS

SPRÁVA UŽIVATELŮ

SOLR

API API API

FS PUBLIKAČNÍ ÚLOŽIŠTĚ ÚLOŽIŠTĚ VÝROBNÍHO

NÁSTROJE AR

CH

IV

API API

PSP IMPORT

PSP EXPORT

INTEGRAČNÍ

MODUL

RÁMCOVÁ ARCHITEKTURA OPEN SOURCE ŘEŠENÍ PRO DIGITÁLNÍ KNIHOVNU KRAMERIUS (2018+)

Page 22: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

ÚLOŽIŠTĚ

Společná verze úložiště pro Kramerius a ProArc Akubra - pluggable file storage interface - modul obsluhující souborový systém Implementace Akubra pro Kramerius - nové komunikační API [vyvinuté pro PoC F4] - SOLR implementace resource indexu - datový formát FOXML

Při přechodu na novou vezi Krameria tak nebude nutné migrovat původní objektové úložiště, ale "pouze" přegenerovat resource index.

- Synchronizaci zápisu dat mezi procesy (instancemi jádra Krameria) řeší paměťová db Hazelcast.

INOVɅTIKɅ

Page 23: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

ÚLOŽIŠTĚ INOVɅTIKɅ

Page 24: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

OPTIMALIZACE SOLR SCHEMATU

• Verzované schema SOLR

• Optimimalizace

• nový indexer

• odstranění nepoužívaných polí

• provedená na základě požadavků na vyhledávání

• jmenné konvence pro vsechna pole (pro trideni s podtrzitkem _sort, pro lemmatizovana pole _lemmatized, atd.. )

• Implementace vyhledávacích operátorů (set využívaný CPK)

INOVɅTIKɅ

Page 25: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

SPRÁVA UŽIVATELŮ

přihlášený uživatel Centrální správa uživatelů, Přihlašování uživatelů přes email/heslo, Google Account, Facebook / Jedno přihlášení na všech instalacích Krameria a klienta, Provázání s klientem

Použití pro

• Oblíbené • Záložky • Poznámky • Komentáře

INOVɅTIKɅ

Page 26: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

SPRÁVA UŽIVATELŮ

ověřený uživatel (DNNT)

Přihlašování přes OpenID a Shibboleth

Přidělování práva na přístup k dnnt dokumentům přes

• Přihlášením přes důvěryhodný kanál

• Ručním přidělením osobou s dostatečnými právy

• Další požadované metody

Provázanost s jádrem Krameria pro ověření dnnt přístupu

INOVɅTIKɅ

Page 27: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

SPRÁVA UŽIVATELŮ

autorizovaný uživatel

Určeno pro správu jednotlivých instalací Krameriu

Uživatelské role a práva pro jednotlivé instalace Krameria

Provázanost s administrátorským rozhraním a “editorem”, systémem ProArc

Širší provázanost s jádrem Krameria a zabezpečení

INOVɅTIKɅ

Page 28: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

NOVÉ VIRTUÁLNÍ SBÍRKY

Sbírky (rozšířená verze stávajících virtuálních sbírek) uloženo k příslušném Krameriu

Seznamy (koncoví uživatelé) - Řešení v rámci správy uživatelů.

• Sbírka bude reprezentovat pro Kramerius model dokumentu Tím půjde využít stávající funkcionalitu Krameria

• Sbírka bude mít hierarchickou strukturu, podobnou modelu periodika “Dokument” může být ve více “Sbírkách”. A “Sbírka” může být zařazena ve “Sbírce”

• Sbírka musí být vyhledatelná (bude se chovat, jako TypDokumentu)

Bude implementováno geografické procházení / zobrazení / vyhledávání

INOVɅTIKɅ

Page 29: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

PROARC VÝVOJ VÝROBNÉHO NÁSTROJA PRE DIGITALIZÁCIU

INOVɅTIKɅ

Page 30: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

• Produkce digitálních dokumentů

• standardy NK ČR - kompletní PSP balíček NDK

(METS, MODS, MIX, PREMIS, ALTO, Dublin Core)

• Zpracování periodik, monografií a článků, eBorn dokumentů, zvukových

dokumentů

• Přebírání dat z externích systémů (Aleph, registrdigitalizace.cz)

• Kompatibilita se systémem Kramerius

• Podpora identifikátorů URN:NBN, UUID, DOI

• Validace dat

PRODUKČNÍ A ARCHIVAČNÍ SYSTÉM INOVɅTIKɅ

Page 31: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

• Open source založený na Fedora Commons repository / Akubra

• archivace digitálních dokumentů – propojení na Archivematica

• Instalace KNAV, MZK, SVKHK, MKP, NM

PRODUKČNÍ A ARCHIVAČNÍ SYSTÉM INOVɅTIKɅ

Page 32: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

Metadatový popis na všech úrovních

PROARC INOVɅTIKɅ

Page 33: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

Validace dat

Exporty

PROARC INOVɅTIKɅ

Page 34: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

• Komponenta pro sledování digitalizačního workflow

• Úzké propojení s produkčním systémem ProArc rychlé zaznamenávání

jednotlivých digitalizačních kroků

• Aktualizace dat do Registru digitalizace

• V současné době je možné zaznamenávat údaje při zpracování

monografií a periodik

KOMPONENTA RDFLOW INOVɅTIKɅ

Page 35: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

DALŠÍ VÝVOJ

Probíhá sjednocování technologií se systémem Kramerius

●API jádra ProArcu

●Je vyvíjen nový klient (UI technologie)

●Úložiště Akubra

●Nová funkcionalita

○ geo data

○ návaznost na Virtuální sbírky

INOVɅTIKɅ

Page 36: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

NÁHLED ... INOVɅTIKɅ

Page 37: VÝVOJ KRAMERIA AKO NÁSTROJA NA SPRÍSTUPNENIE DIEL ... · (METS, MODS, MIX, PREMIS, ALTO, Dublin Core) • Zpracování periodik, monografií a lánků, eBorn dokumentů, zvukových

OTÁZKY ? DĚKUJEME ZA POZORNOST

INOVɅTIKɅ

[email protected] [email protected]