Upload
tyler-hopkins
View
49
Download
3
Embed Size (px)
DESCRIPTION
Problematika velkého indexu. Martin Vojnar [email protected]. Obsah. předehra: jednotné prostředí velký index vs. metavyhledávání vytváření velkého indexu a jeho vlastnosti velký index a český obsah malá úskalí velkého indexu praktické ukázky otázky / diskuse. 1a: jednotné prostředí. - PowerPoint PPT Presentation
Citation preview
2 Problematika velkého indexu, 30.3. 2011
Obsah
• předehra: jednotné prostředí• velký index vs. metavyhledávání• vytváření velkého indexu a jeho vlastnosti• velký index a český obsah• malá úskalí velkého indexu• praktické ukázky
• otázky / diskuse
3 Problematika velkého indexu, 30.3. 2011
1a: jednotné prostředí
4 Problematika velkého indexu, 30.3. 2011
Jednotné prostředí
• pro vyhledávání informací a dokumentů• pro dodávání informací a dokumentů• pro objevení nového
• používáte ho každý den
• ukázka
5 Problematika velkého indexu, 30.3. 2011
Proč ?
• v rámci vyhledávání a dodávání informací zahájily před ca 5 lety nástup nové nástroje
• byly původně označovány jako katalogy nové generace (next-gen OPACs)
• postupně se vyvinuly v tzv. „discovery“ systémy
• jejich hlavní důraz je kladen na koncového uživatele, jeho potřeby a prostředí, samostatnost a spokojenost
• užitečný nástroj v kontextu informační gramotnosti
6 Problematika velkého indexu, 30.3. 2011
Cíle jednotného prostředí
• každý dotaz musí být prováděn ve všech zdrojích knihovny (tištěné, elektronické, digitalizované, …)
• výsledky jsou zobrazeny v jedné výsledkové množině s jednotnou relevancí a s úplnou navigací
• zobrazení plného textu na jedno kliknutí• podpora SSO, integrace objednávání a čtenářského
konta
7 Problematika velkého indexu, 30.3. 2011
Co není jednotné prostředí
• pokud uživatel musí přecházet do jiných systémů• pokud se musí uživatel opakovaně přihlašovat• pokud uživatel ztrácí kontinuitu svého vyhledávání• pokud uživatel musí začínat v „discovery“ systému
(příklad)
• pokud rozhraní nenabízí jednotné výsledky• pokud rozhraní neumožňuje začlenění libovolného
zdroje
8 Problematika velkého indexu, 30.3. 2011
1b: „discovery“ systémy
9 Problematika velkého indexu, 30.3. 2011
Očekávání ze strany uživatelů*
• rychlé, jednoduché, intuitivní používání• jediné rozhraní• navigace pomocí faset• DYM, návrhy/našeptávání• RSS• pokrytí relevantního obsahu
• základní přehled „discovery“ systémůhttp://www.librarytechnology.org/discovery.pl
*Marshall Breeding
10 Problematika velkého indexu, 30.3. 2011
Přidaná hodnota „discovery“
• jedno společné rozhraní = méně práce s lepším výsledkem
• konec informačního přehlcení díky:
• konfigurovatelné relevanci (zlato vs. šum)• personalizaci výpočtu relevance• seskupování výsledků (FRBR)• doporučení
• zapojení uživatelů• integrace s jejich prostředím• komentáře / hodnocení• čtenářské konto• sledování novinek• virtuální knihovnička
11 Problematika velkého indexu, 30.3. 2011
Typické zdroje pro „discovery“
• knihovní fond• licencované databáze• volně dostupné dokumenty a data (open access)• digitální knihovny• institucionální repozitáře … a další dle potřeb
uživatelů
• různé formáty, různé oprávnění, různé instituce, různý význam
• discovery také může být zdrojem pro vyšší třídu vyhledávačů
12 Problematika velkého indexu, 30.3. 2011
UIdiscovery
discovery index
13 Problematika velkého indexu, 30.3. 2011
UI discovery
discovery index obsahuje různé zdroje
14 Problematika velkého indexu, 30.3. 2011
UI discovery
včetně elektronických zdrojů
15 Problematika velkého indexu, 30.3. 2011
16 Problematika velkého indexu, 30.3. 2011
Anatomie vyhledávání
• index lokálních zdrojů• index elektronických zdrojů (tzv. velký index)
• paralelní vyhledávání (tzv. metavyhledávání) – více v kapitole 2
• externí vyhledávání (sám sebe, Solr, API, …)
• zadávání dotazů a jejich typy
17 Problematika velkého indexu, 30.3. 2011
1c: ukázka ~ Primo od Ex Libris
18 Problematika velkého indexu, 30.3. 2011
Ukázka systému Primo (naživo později)
• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost
• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)
• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu
• webové rozhraní pro administrátora
19 Problematika velkého indexu, 30.3. 2011
1d: konec úvodu
20 Problematika velkého indexu, 30.3. 2011
Výzva pro knihovny
• sjednocení vyhledávacího prostředí• sjednocení služeb na něj navázaných
• výsledek:• efektivnější využívání zdrojů knihovny• častější využívání zdrojů knihovny• získání nových uživatelů• opakované využívání zdrojů knihovny
21 Problematika velkého indexu, 30.3. 2011
UI discovery
včetně elektronických zdrojů
ukázka: video
22 Problematika velkého indexu, 30.3. 2011
2: velký index vs. metavyhledávání
23 Problematika velkého indexu, 30.3. 2011
Změna filozofie velkého indexu
• paralelní vyhledávání = ve sbírkách• velký index = v obsahu
• oddělení fáze vyhledávání a dodávání
• nepřihlášeným uživatelům:• povoleno obojí• povoleno jen vyhledávání• není povoleno ani vyhledávání
• dodávání na základě elektronických holdingů (dostupnost)
24 Problematika velkého indexu, 30.3. 2011
Příklad dostupnosti
• např. ve formátu pro Google Scholar
<item type="electronic"> <sfx_id>954921333005</sfx_id> <object_type>JOURNAL</object_type> <title>Abacus</title> <title>ABACUS A JOURNAL OF ACCOUNTING FINANCE AND BUSINESS
STUDIES</title> <title>ABACUS OXFORD</title> <issn>0001-3072</issn> <eissn>1467-6281</eissn> <coverage> <from> <year>1965</year> </from> <to></to> <embargo> <days_not_available>365</days_not_available> </embargo> </coverage> </item>
25 Problematika velkého indexu, 30.3. 2011
Pro uživatele Metalibu
• význam paralelního vyhledávání
• velký index jako cíl v paralelním vyhledávání (obrat 180°)
• paralelní vyhledávání jako doplňková metoda přístupu v UI rozhraní velkého indexu
• příklad
26 Problematika velkého indexu, 30.3. 2011
3: jak vzniká velký index
27 Problematika velkého indexu, 30.3. 2011
Plnění velkého indexu
• Ex Libris vs. tradiční agregátoři• open aktivity v rámci JISC (RDTF, KBART, lis-oss aj.)
• smlouvy s poskytovateli různého typu (typicky na 3 roky)
• rozsah získávaných metadat:• základní metadata• + věcný popis• + abstrakt• + plný text
28 Problematika velkého indexu, 30.3. 2011
Váš obsah ve velkém indexu (dnes)
• sbírky vs. tituly• profil velkého indexu• dostupnost na úrovni instituce
• analýza procentuálního zastoupení titulů• počet elektronických titulů (ISSN/ISBN/název)• počet předplácených titulů• počet recenzovaných titulů
29 Problematika velkého indexu, 30.3. 2011
Váš obsah ve velkém indexu (zítra)
• plnění je nekonečný proces• řídí se podle cestovní mapy (ukázka)
• nikdy nebude 100%-ně úplný• nikdy nebude 100%-ně aktuální
• petice IGELU
30 Problematika velkého indexu, 30.3. 2011
Důraz na otevřenost velkého indexu
• během plnění (open discovery)• jeho obsahu (open access, open data)• jeho dostupnosti (open platform)• zařazení do jiných rozhraní (open source)
• v budoucnu lze očekávat i kombinování více velkých indexů (např. lokální/globální, více globálních apod.), bude-li úspěšně vyřešena normalizace relevance
31 Problematika velkého indexu, 30.3. 2011
Co je nejdůležitější na velkém indexu ?
• pokrytí• relevance• dostupnost• rychlost odezvy• neutralita• možnosti konfigurace (jaké?)
• jak moc je důležité pokrytí lokálního obsahu ?
32 Problematika velkého indexu, 30.3. 2011
4: český obsah ve velkém indexu
33 Problematika velkého indexu, 30.3. 2011
Dvě dimenze obsahu velkého indexu
• (nějaký) obsah je k dispozici online• dostupnost obsahu pro daného uživatele (tj.
instituci)
• jaký český obsah je k dispozici ?
34 Problematika velkého indexu, 30.3. 2011
Potenciál českého obsahu
• SK ČR, ANL, registr digitalizace• oborové bibliografie• národní digitální knihovny (M+K+W)• oborové digitální knihovny (DML-CZ)• NUŠL• placené zdroje
(Anopress IT, Newton Media, Infobanka ČTK, Beck online, ASPI, …)
• nová média: wiki, archivy vysílání, e-knihy• publikační činnost / výstupy VaV• nástroje pro podporu vzdělávání, doporučená
literatura• institucionální repozitáře
(DSpaceCZ, digitalizace KNAV ČR, …)
• a další (?)
35 Problematika velkého indexu, 30.3. 2011
Potenciál českého obsahu – pár čísel
• experiment v testovacím prostředí UK:• katalog + kvalifikační práce ca 1 mil. záznamů• ostatní ca 800 tis. záznamů, v tom:
• cswiki ca 200 tis. záznamů• manuscriptorium ca 200 tis. záznamů• ANL (online) ca 200 tis. záznamů• BMČ (online), BDÚ (online), ZPB (online),
GEOBIBLINE ca 60 tis. záznamů• DML-CZ a NUŠL ca 100 tis. záznamů• různé ca 50 tis. záznamů (Forum, Anopress IT,
Kramerius NKP, …)
36 Problematika velkého indexu, 30.3. 2011
Oborové bibliografie
• hlavní zdroj: oborové bibliografie• týká se ANL• týká se národních digitálních knihoven (K)• týká se institucionálních repozitářů (digitalizace
KNAV ČR)
• ukončení plnění ANL v NK ČR, udržování pro další knihovny
• průzkum stavu oborových bibliografií
37 Problematika velkého indexu, 30.3. 2011
Oborové bibliografie - výběr
38 Problematika velkého indexu, 30.3. 2011
Spojení českého obsahu
• opravdu na jednom místě
• praktické zkušenosti: jednání, vysvětlování, …• licencovaný obsah limitován předchozími smlouvami
• jak a kdo [bude chtít | by měl | může] tuto službu nabízet (knihovny vs. dodavatelé, licence, smlouvy, …)
• bylo by velmi vhodné zahrnout do strategie knihoven
• pár ukázek
39 Problematika velkého indexu, 30.3. 2011
5: ukázka ~ Primo od Ex Libris
40 Problematika velkého indexu, 30.3. 2011
Ukázka systému Primo
• elektronické zdroje:• získání plného textu (přímé linkování, více zdrojů)• doporučení, citovanost
• dostupnost• seskupení (FRBR)• čtenářské konto a objednávání z knihovního fondu• otevřenost (aktuální články)
• lokální obsah (wikipedie, www stránky, české zdroje)• metavyhledávání vs. velký index• filozofie velkého indexu
• webové rozhraní pro administrátora
41 Problematika velkého indexu, 30.3. 2011
6: shrnutí
42 Problematika velkého indexu, 30.3. 2011
Pár zajímavých odkazů
• přehled nejlepších v analýze „Web Scale Discovery Services“ (Jason Vaughan, obsah není volně dostupný)http://www.alatechsource.org/taxonomy/term/106/web-scale-discovery-services
• Federated Search blog (Sol Lederman)http://federatedsearchblog.com/2011/01/21/must-read-article-on-discovery-services/
• Informační gramotnost uživatelů vs. vyhledávací nástroje nové generace (Vilém Sklenák, ProInflow)http://pro.inflow.cz/informacni-gramotnost-uzivatelu-vs-vyhledavaci-nastroje-nove-generace
43 Problematika velkého indexu, 30.3. 2011
Jedno prostředí pro uživatele
• vyhledávací nástroje nové generace se na Vás tlačí
• velký index je toho součástí (jak moc je důležitý?)
• každý velký index jde svou cestou
• důraz na otevřenost
• jak velká míra kontrola ze strany knihovny je třeba?
44 Problematika velkého indexu, 30.3. 2011
Otázky / [email protected]
45 Problematika velkého indexu, 30.3. 2011
Některé z otázek
• je velký index luxus ?• záleží na velikosti indexu ?• jak otestovat rozsah indexu ?• má smysl podpořit Open Discovery ?• co to stojí a kdo to platí ?• proč si to knihovny neudělají samy a lépe ?• jakou míru kontroly chci mít nad velkým indexem ?• jaké z mých sbírek jsou ve velkém indexu ?• jaké zdroje / jaký obsah by tam mí uživatelé rádi viděli ?