45
Problematika velkého indexu Martin Vojnar [email protected]

Problematika velkého indexu

Embed Size (px)

DESCRIPTION

Problematika velkého indexu. Martin Vojnar [email protected]. Obsah. předehra: jednotné prostředí velký index vs. metavyhledávání vytváření velkého indexu a jeho vlastnosti velký index a český obsah malá úskalí velkého indexu praktické ukázky otázky / diskuse. 1a: jednotné prostředí. - PowerPoint PPT Presentation

Citation preview

Page 1: Problematika velkého indexu

Problematika velkého indexu

Martin [email protected]

Page 2: Problematika velkého indexu

2 Problematika velkého indexu, 30.3. 2011

Obsah

• předehra: jednotné prostředí• velký index vs. metavyhledávání• vytváření velkého indexu a jeho vlastnosti• velký index a český obsah• malá úskalí velkého indexu• praktické ukázky

• otázky / diskuse

Page 3: Problematika velkého indexu

3 Problematika velkého indexu, 30.3. 2011

1a: jednotné prostředí

Page 4: Problematika velkého indexu

4 Problematika velkého indexu, 30.3. 2011

Jednotné prostředí

• pro vyhledávání informací a dokumentů• pro dodávání informací a dokumentů• pro objevení nového

• používáte ho každý den

• ukázka

Page 5: Problematika velkého indexu

5 Problematika velkého indexu, 30.3. 2011

Proč ?

• v rámci vyhledávání a dodávání informací zahájily před ca 5 lety nástup nové nástroje

• byly původně označovány jako katalogy nové generace (next-gen OPACs)

• postupně se vyvinuly v tzv. „discovery“ systémy

• jejich hlavní důraz je kladen na koncového uživatele, jeho potřeby a prostředí, samostatnost a spokojenost

• užitečný nástroj v kontextu informační gramotnosti

Page 6: Problematika velkého indexu

6 Problematika velkého indexu, 30.3. 2011

Cíle jednotného prostředí

• každý dotaz musí být prováděn ve všech zdrojích knihovny (tištěné, elektronické, digitalizované, …)

• výsledky jsou zobrazeny v jedné výsledkové množině s jednotnou relevancí a s úplnou navigací

• zobrazení plného textu na jedno kliknutí• podpora SSO, integrace objednávání a čtenářského

konta

Page 7: Problematika velkého indexu

7 Problematika velkého indexu, 30.3. 2011

Co není jednotné prostředí

• pokud uživatel musí přecházet do jiných systémů• pokud se musí uživatel opakovaně přihlašovat• pokud uživatel ztrácí kontinuitu svého vyhledávání• pokud uživatel musí začínat v „discovery“ systému

(příklad)

• pokud rozhraní nenabízí jednotné výsledky• pokud rozhraní neumožňuje začlenění libovolného

zdroje

Page 8: Problematika velkého indexu

8 Problematika velkého indexu, 30.3. 2011

1b: „discovery“ systémy

Page 9: Problematika velkého indexu

9 Problematika velkého indexu, 30.3. 2011

Očekávání ze strany uživatelů*

• rychlé, jednoduché, intuitivní používání• jediné rozhraní• navigace pomocí faset• DYM, návrhy/našeptávání• RSS• pokrytí relevantního obsahu

• základní přehled „discovery“ systémůhttp://www.librarytechnology.org/discovery.pl

*Marshall Breeding

Page 10: Problematika velkého indexu

10 Problematika velkého indexu, 30.3. 2011

Přidaná hodnota „discovery“

• jedno společné rozhraní = méně práce s lepším výsledkem

• konec informačního přehlcení díky:

• konfigurovatelné relevanci (zlato vs. šum)• personalizaci výpočtu relevance• seskupování výsledků (FRBR)• doporučení

• zapojení uživatelů• integrace s jejich prostředím• komentáře / hodnocení• čtenářské konto• sledování novinek• virtuální knihovnička

Page 11: Problematika velkého indexu

11 Problematika velkého indexu, 30.3. 2011

Typické zdroje pro „discovery“

• knihovní fond• licencované databáze• volně dostupné dokumenty a data (open access)• digitální knihovny• institucionální repozitáře … a další dle potřeb

uživatelů

• různé formáty, různé oprávnění, různé instituce, různý význam

• discovery také může být zdrojem pro vyšší třídu vyhledávačů

Page 12: Problematika velkého indexu

12 Problematika velkého indexu, 30.3. 2011

UIdiscovery

discovery index

Page 13: Problematika velkého indexu

13 Problematika velkého indexu, 30.3. 2011

UI discovery

discovery index obsahuje různé zdroje

Page 14: Problematika velkého indexu

14 Problematika velkého indexu, 30.3. 2011

UI discovery

včetně elektronických zdrojů

Page 15: Problematika velkého indexu

15 Problematika velkého indexu, 30.3. 2011

Page 16: Problematika velkého indexu

16 Problematika velkého indexu, 30.3. 2011

Anatomie vyhledávání

• index lokálních zdrojů• index elektronických zdrojů (tzv. velký index)

• paralelní vyhledávání (tzv. metavyhledávání) – více v kapitole 2

• externí vyhledávání (sám sebe, Solr, API, …)

• zadávání dotazů a jejich typy

Page 17: Problematika velkého indexu

17 Problematika velkého indexu, 30.3. 2011

1c: ukázka ~ Primo od Ex Libris

Page 18: Problematika velkého indexu

18 Problematika velkého indexu, 30.3. 2011

Ukázka systému Primo (naživo později)

• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost

• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)

• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu

• webové rozhraní pro administrátora

Page 19: Problematika velkého indexu

19 Problematika velkého indexu, 30.3. 2011

1d: konec úvodu

Page 20: Problematika velkého indexu

20 Problematika velkého indexu, 30.3. 2011

Výzva pro knihovny

• sjednocení vyhledávacího prostředí• sjednocení služeb na něj navázaných

• výsledek:• efektivnější využívání zdrojů knihovny• častější využívání zdrojů knihovny• získání nových uživatelů• opakované využívání zdrojů knihovny

Page 21: Problematika velkého indexu

21 Problematika velkého indexu, 30.3. 2011

UI discovery

včetně elektronických zdrojů

ukázka: video

Page 22: Problematika velkého indexu

22 Problematika velkého indexu, 30.3. 2011

2: velký index vs. metavyhledávání

Page 23: Problematika velkého indexu

23 Problematika velkého indexu, 30.3. 2011

Změna filozofie velkého indexu

• paralelní vyhledávání = ve sbírkách• velký index = v obsahu

• oddělení fáze vyhledávání a dodávání

• nepřihlášeným uživatelům:• povoleno obojí• povoleno jen vyhledávání• není povoleno ani vyhledávání

• dodávání na základě elektronických holdingů (dostupnost)

Page 24: Problematika velkého indexu

24 Problematika velkého indexu, 30.3. 2011

Příklad dostupnosti

• např. ve formátu pro Google Scholar

<item type="electronic"> <sfx_id>954921333005</sfx_id> <object_type>JOURNAL</object_type> <title>Abacus</title> <title>ABACUS A JOURNAL OF ACCOUNTING FINANCE AND BUSINESS

STUDIES</title> <title>ABACUS OXFORD</title> <issn>0001-3072</issn> <eissn>1467-6281</eissn> <coverage> <from> <year>1965</year> </from> <to></to> <embargo> <days_not_available>365</days_not_available> </embargo> </coverage> </item>

Page 25: Problematika velkého indexu

25 Problematika velkého indexu, 30.3. 2011

Pro uživatele Metalibu

• význam paralelního vyhledávání

• velký index jako cíl v paralelním vyhledávání (obrat 180°)

• paralelní vyhledávání jako doplňková metoda přístupu v UI rozhraní velkého indexu

• příklad

Page 26: Problematika velkého indexu

26 Problematika velkého indexu, 30.3. 2011

3: jak vzniká velký index

Page 27: Problematika velkého indexu

27 Problematika velkého indexu, 30.3. 2011

Plnění velkého indexu

• Ex Libris vs. tradiční agregátoři• open aktivity v rámci JISC (RDTF, KBART, lis-oss aj.)

• smlouvy s poskytovateli různého typu (typicky na 3 roky)

• rozsah získávaných metadat:• základní metadata• + věcný popis• + abstrakt• + plný text

Page 28: Problematika velkého indexu

28 Problematika velkého indexu, 30.3. 2011

Váš obsah ve velkém indexu (dnes)

• sbírky vs. tituly• profil velkého indexu• dostupnost na úrovni instituce

• analýza procentuálního zastoupení titulů• počet elektronických titulů (ISSN/ISBN/název)• počet předplácených titulů• počet recenzovaných titulů

Page 29: Problematika velkého indexu

29 Problematika velkého indexu, 30.3. 2011

Váš obsah ve velkém indexu (zítra)

• plnění je nekonečný proces• řídí se podle cestovní mapy (ukázka)

• nikdy nebude 100%-ně úplný• nikdy nebude 100%-ně aktuální

• petice IGELU

Page 30: Problematika velkého indexu

30 Problematika velkého indexu, 30.3. 2011

Důraz na otevřenost velkého indexu

• během plnění (open discovery)• jeho obsahu (open access, open data)• jeho dostupnosti (open platform)• zařazení do jiných rozhraní (open source)

• v budoucnu lze očekávat i kombinování více velkých indexů (např. lokální/globální, více globálních apod.), bude-li úspěšně vyřešena normalizace relevance

Page 31: Problematika velkého indexu

31 Problematika velkého indexu, 30.3. 2011

Co je nejdůležitější na velkém indexu ?

• pokrytí• relevance• dostupnost• rychlost odezvy• neutralita• možnosti konfigurace (jaké?)

• jak moc je důležité pokrytí lokálního obsahu ?

Page 32: Problematika velkého indexu

32 Problematika velkého indexu, 30.3. 2011

4: český obsah ve velkém indexu

Page 33: Problematika velkého indexu

33 Problematika velkého indexu, 30.3. 2011

Dvě dimenze obsahu velkého indexu

• (nějaký) obsah je k dispozici online• dostupnost obsahu pro daného uživatele (tj.

instituci)

• jaký český obsah je k dispozici ?

Page 34: Problematika velkého indexu

34 Problematika velkého indexu, 30.3. 2011

Potenciál českého obsahu

• SK ČR, ANL, registr digitalizace• oborové bibliografie• národní digitální knihovny (M+K+W)• oborové digitální knihovny (DML-CZ)• NUŠL• placené zdroje

(Anopress IT, Newton Media, Infobanka ČTK, Beck online, ASPI, …)

• nová média: wiki, archivy vysílání, e-knihy• publikační činnost / výstupy VaV• nástroje pro podporu vzdělávání, doporučená

literatura• institucionální repozitáře

(DSpaceCZ, digitalizace KNAV ČR, …)

• a další (?)

Page 35: Problematika velkého indexu

35 Problematika velkého indexu, 30.3. 2011

Potenciál českého obsahu – pár čísel

• experiment v testovacím prostředí UK:• katalog + kvalifikační práce ca 1 mil. záznamů• ostatní ca 800 tis. záznamů, v tom:

• cswiki ca 200 tis. záznamů• manuscriptorium ca 200 tis. záznamů• ANL (online) ca 200 tis. záznamů• BMČ (online), BDÚ (online), ZPB (online),

GEOBIBLINE ca 60 tis. záznamů• DML-CZ a NUŠL ca 100 tis. záznamů• různé ca 50 tis. záznamů (Forum, Anopress IT,

Kramerius NKP, …)

Page 36: Problematika velkého indexu

36 Problematika velkého indexu, 30.3. 2011

Oborové bibliografie

• hlavní zdroj: oborové bibliografie• týká se ANL• týká se národních digitálních knihoven (K)• týká se institucionálních repozitářů (digitalizace

KNAV ČR)

• ukončení plnění ANL v NK ČR, udržování pro další knihovny

• průzkum stavu oborových bibliografií

Page 37: Problematika velkého indexu

37 Problematika velkého indexu, 30.3. 2011

Oborové bibliografie - výběr

Page 38: Problematika velkého indexu

38 Problematika velkého indexu, 30.3. 2011

Spojení českého obsahu

• opravdu na jednom místě

• praktické zkušenosti: jednání, vysvětlování, …• licencovaný obsah limitován předchozími smlouvami

• jak a kdo [bude chtít | by měl | může] tuto službu nabízet (knihovny vs. dodavatelé, licence, smlouvy, …)

• bylo by velmi vhodné zahrnout do strategie knihoven

• pár ukázek

Page 39: Problematika velkého indexu

39 Problematika velkého indexu, 30.3. 2011

5: ukázka ~ Primo od Ex Libris

Page 40: Problematika velkého indexu

40 Problematika velkého indexu, 30.3. 2011

Ukázka systému Primo

• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost

• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)

• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu

• webové rozhraní pro administrátora

Page 41: Problematika velkého indexu

41 Problematika velkého indexu, 30.3. 2011

6: shrnutí

Page 42: Problematika velkého indexu

42 Problematika velkého indexu, 30.3. 2011

Pár zajímavých odkazů

• přehled nejlepších v analýze „Web Scale Discovery Services“ (Jason Vaughan, obsah není volně dostupný)http://www.alatechsource.org/taxonomy/term/106/web-scale-discovery-services

• Federated Search blog (Sol Lederman)http://federatedsearchblog.com/2011/01/21/must-read-article-on-discovery-services/

• Informační gramotnost uživatelů vs. vyhledávací nástroje nové generace (Vilém Sklenák, ProInflow)http://pro.inflow.cz/informacni-gramotnost-uzivatelu-vs-vyhledavaci-nastroje-nove-generace

Page 43: Problematika velkého indexu

43 Problematika velkého indexu, 30.3. 2011

Jedno prostředí pro uživatele

• vyhledávací nástroje nové generace se na Vás tlačí

• velký index je toho součástí (jak moc je důležitý?)

• každý velký index jde svou cestou

• důraz na otevřenost

• jak velká míra kontrola ze strany knihovny je třeba?

Page 44: Problematika velkého indexu

44 Problematika velkého indexu, 30.3. 2011

Otázky / [email protected]

Page 45: Problematika velkého indexu

45 Problematika velkého indexu, 30.3. 2011

Některé z otázek

• je velký index luxus ?• záleží na velikosti indexu ?• jak otestovat rozsah indexu ?• má smysl podpořit Open Discovery ?• co to stojí a kdo to platí ?• proč si to knihovny neudělají samy a lépe ?• jakou míru kontroly chci mít nad velkým indexem ?• jaké z mých sbírek jsou ve velkém indexu ?• jaké zdroje / jaký obsah by tam mí uživatelé rádi viděli ?