Upload
ole-husby
View
1.403
Download
3
Embed Size (px)
DESCRIPTION
Prepared presentation about search services in general and discovery services in particular, for an internal workshop at the NTNU University Library.
Citation preview
SøketjenesterKollokvium
20. mars 2013 [email protected]
OBS!Denne presentasjonen er laget for et internt kollokvium ved NTNU 20. mars 2013. Tatt ut av denne sammenhengen kan den være ufullstendig. Fordi dette var et kollokvium, er noen av punktene en smule retoriske.
Del 1 er noe preget av den verktøysituasjonen UB er i for øyeblikket.
Del 2 er noe mer teknisk og ikke særlig UB-spesifikk.
Denne presentasjonen er underlagt en Creative Commons lisens CC BY-SA 3.0
Eksistensialistisk
Hva er
SøkingGjenfinningOppdaging
Hva er forskjellen på søking og oppdagingHva er serendipity
Hva er vi på jakt etter
TekstdokumenterAndre dokumenterInformasjonKunnskapEkspertrådFakta
Vet vi hva vi vil ha? Hva med sjanger, nivå, autoritet, språk, ventetid, format, pris,
Vet vi om vi fant det?
Er vi på jakt etter et kjent dokument er saken klar
Men ellers da?Går det an å måle det?Hva er relevans?Hva er gjenfinning og presisjon?Hva er relevansrangering?Hva er the long tail?
Innhold
1. Søkeverktøy som er dagsaktuelle ved UB
2. Tilbakeblikk og gjennomgang av mer grunnleggende begreper og teknologier
OBS: Dette er et kollokvium!
1. I dag
Google - Google Scholar - Bing - Yandex - DuckGoGo - Wikipedia - Mendeley - Primo - Discovery - EDS - Summon - VuFind - Facebook - Twitter - YouTube - WorldCat Local - BIBSYS Ask - BIBSØK -GENSØK- bokhylla.no
Discovery
handler om å oppdage eller finne ting
ikke bare vha tradisjonell søking
men via anbefalinger, sosial søking, snubling (serendipity) etc
Discovery og delivery
KunnskapsbaserERMLenketjenere Discoveryverktøy
Dette er verktøy eller tjenester som henger mer eller mindre sammen
Kunnskapsbase
fordi ikke alle eksemplarer er tilgjengelige
Spinal en plaque meningiomas: A contemporary experienceE Caroli, M Acqui, R Roperto, L Ferrante… - Neurosurgery, 2004 - journals.lww.comOBJECTIVE: Spinal en plaque meningiomas are rare and challenging lesions because of their tendency to induce spinal arachnoiditis. The surgical treatment of this type of meningioma is more complex than that of classic meningioma. METHODS: We report ..
http://journals.lww.com/neurosurgery/Abstract/2004/12000/Spinal_en_Plaque_Meningiomas__A_Contemporary.5.aspx
http://ovidsp.uk.ovid.com/sp-3.8.1a/ovidweb.cgi?QS2=434f4e1a73d37e8c740ce3cde7a33785b1e50109abeb977063eb5f5aed1249bf31d4353e62006f32ad18b794654723bb2e83912c60a4886baa4711a6ef570f9c27f69b81dbc8ccc21cc23088ac2d322773d73ec2d2541de9cef44a8fc098c80377362e88a28a1011e42a5e3415b9d29ec653b867ffa2210590e05070aa5618f2677d60027b80964b79d47b3fd4baaa344adc7b2e7c7e106f50397a112fb43625f878b9fac2fcd1c854d586ff1481a54fbae99747a473c9e7cddf3db61a877861d1a14f2960227bbd2805334bd32951ddec40ce7e361efe31e3b5d7c9bc7c450ad30947ee0b5620a4338d63a04aa7cd8c4d54adb621c146e31985d34f3d2c6d98bad152eb277ee482024854f78d7206478beec64b9581c5c7d53c636b8aab22f11e9bfeb5de941976309d9db84c5881f4059d6e4951ac6d19c49e2f959794dfe060785bb13ea315d9d69b818aeee924dcca2cdce5dc847b51638ac61d75ea82ce9b7d9e0592f879cf55d46ed3988af91a5e03f469048294d20743065f9e37b952c8e2ce916617082fea1d4578dec03cf3a15509aeab72acf08c186c6b5ad947d14b90048d923e3c9153e0dc9d15dba2b4e662677593a721cdbe8d27866bc05290
Google Scholar
Eks 1
Eks 2
Kunnskapsbase
(= Knowledge base )
Inneholder info om hvor det finnes et tilgjengelig eksemplar av et dokument
NTNU bruker kunnskapsbasen SFX Global Knowledgebase
Kunnskapsbasen SFX
inneholder informasjon om tilgjengelige eksemplarer av
● lisensierte etidsskrifter● gratis etidskrifter● ebøker (kjøpte eller via PDA)
inneholder ikke info om trykte ressurser
Kunnskapsbaser
Ex Libris SFX Global Knowledgebase
OCLC WorldCat knowledge base
EBSCO LinkSource
Serial Solutions 360 Link / KnowledgeWorks
Bibliotekbasen i BIBSYS er også en kunnskapsbase
Internasjonalt initiativ for å standardisere virkemåten til kunnskapsbasene: KBART
Mer om kunnskapsbaser
Det har siden 2000 (da kom SFX på markedet) vært en tendens til at KB har vært levert sammen med (som en del av) lenketjener.
I dagens marked er det sannsynligvis en ny retning å spore, nemlig at KB knyttes sterkere til discoveryverktøyene, slik at brukeren ser "direkte lenker" i stedet for "SFX-meny" o.l.
Det er ikke unaturlig at f.eks. OCLC er en pådriver her, ved å si at WorldCat fungerer også som KB.
ERM
( = Electronic Resources Management )
Verktøy for å administrere bibliotekets avtaler om tilgang til e-ressurser
NTNU har anskaffet ERM fra EBSCO
Lenketjener
(= Link resolver )
Nettbasert tjeneste som presenterer en klikkbar lenke til et tilgjengelig eksemplar av en ressurs
UB bruker lenketjeneren SFX i samarbeidet innen Uniport-konsortiet
SFX er valgt som lenketjener av BIBSYS
Lenketjenere
Ex Libris SFX
OCLC OCLC Link Manager
EBSCO LinkSource
Serial Solutions 360 Link
Lenketjeneren trenger en kunnskapsbase for å finne tilgjengelige eksemplarer!
Lenketjeneren SFX
SFX genererer lenker i form av en NTNU-knapp i forskjellige søkesystemer
Lenketjenere og OpenURL
OpenURL er en metadataURLstandard som tillater dynamisk lenking mellom kilde og mål
Kilde (source) = Web of Science Mål (target) = Elsevier
Slik ser en OpenURL uthttp://x-port-sfx.uio.no/sfx_ubit?sid=google&auinit=E&aulast=Caroli&atitle=Spinal+en+plaque+meningiomas:+A+contemporary+experience&title=Neurosurgery&volume=55&issue=6&date=2004&spage=1275&issn=0148-396X
Lenketjener vs direkte lenking
Brukerne oppfatter ikke det geniale ved lenketjeneren på samme måte som oss!
De synes sfx bare er et ekstra unødvendig klikk
Tendens: discoveryverktøyene har en innbygd kunnskapsbase slik at direktelenking er mulig
Lenketjenerne viktigst for "tredjepartsystemer"
LinkSource
NTNU UB har anskaffet lenketjeneren LinkSource fra EBSCO
Søkeverktøy
( = Discovery tool )
En nettbasert tjeneste for å finne alle mulige ressurstyper bl.a. ved å søke i forskjellige søkekilder
NTNU har Metalib og Primo CentralVi "har" også Google Scholar
Søkeverktøy av forskjellige typer
Terminologi og navnebruk er nokså grumset
Discovery tool brukes gjerne om systemer hvor man samler søkedata til en felles indeks (f.eks. Primo)
Federated search brukes om systemer hvor det søkes distribuert, dvs i forskjellige kilder samtidig (f.eks. Metalib)
Søkeverktøy
Ex Libris Primo / Primo Central
OCLC Worldcat Local
EBSCO EBSCO Discovery Service (EDS)
Serial Solutions Summon
Dette er de "store" verktøyene for tidaDet finnes også flere (kommersielle og frie)Og så har vi Google ScholarTida har gått fra federated search (Metalib)
Søkeverktøyet Primo
NTNU har avtale om Primo ut 2013
Primo er valgt som discoveryverktøy av BIBSYS
EDS (EBSCO Discovery System)
NTNU UB har anskaffet discoveryverktøyet EDS fra EBSCO
Her passer det å ta pause
Google Scholar
Det som gjør Google Scholar til et så bra verktøy for NTNU-brukere er ikke at det har så god gjenfinningsfunksjonalitet eller at det har så stor dekning
men
at vi har god orden på våre beholdninger via en kunnskapsbase og lenkeserver
Skifte av discoverysystem
Det som gjør at det er mulig å skifte discoverysystem på forholdsvis kort tid
eller evt anskaffe et nytt hvis Google legger inn årene
at vi har god orden på våre beholdninger via en kunnskapsbase og lenkeserver
Må vi ha discoverysystem?
Tja.
● Det perfekte søkeverktøy finnes ikke● Ingen er så omfattende at de overflødiggjør
spesialdatabaser (aka fagdatabaser)● Det er usikkert om noe er så mye bedre enn
Google Scholar at det er pengene verdt● Av hensyn til Google Scholar og fagdatabaser
må vi fortsatt ha lenketjener
Må vi ha discoverysystem?
Dette er et fiktivt strategidokument. Se mer om det på neste side.
1. UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å levere materiale som er produsert av vitenskapelige ansatte ved NTNU.
2. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger. 3. Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon. 4. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer.
5. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"
Dette var altså ren fiction
Men teksten er direkte oversatt fra et virkelig dokument fra Universitetet i Utrecht:
http://www.libereurope.eu/blog/thinking-the-unthinkable-a-library-without-a-catalogue-reconsidering-the-future-of-discovery-to
Utrecht er erstattet med NTNUOmega er erstattet med Primo CentralWebOPAC er erstattet med BIBSYS-katalogen
2. Tilbakeblikk
Gjennomgang av teknikker og begreper.Ikke nødvendigvis kronologisk
ccl: find (dylan and bob) or set=1
Ressurs
Informasjonsressurs
BokTekstdokumentBildeWebsideLydVideo osv osv osv
http://ohhaythurr.files.wordpress.com/2011/04/illum_manuscript_l1.jpg?w=570
What is a resource?
That is rather a deep question and the precise definition is still the subject of debate. For our purposes we can think of it as anything we can identify. You are a resource, as is your home page, this tutorial, the number one and the great white whale in Moby Dick.
(RDF)
Metadata
Strukturerte data som beskriver en ressurs
Typisk eksempel: bibliografiske data
100 $a Aalberg, Trond245 $a A Tool for Converting from MARC to FRBR700 $a Husby, Ole856 $u http://dx.doi.org/10.1007/11863878_41
Digresjon: Setninger
Utsagn om ting
http://orcid.org/0000-0002-9113-2142
http://dx.doi.org/10.1007/11863878_41
Ole Husby
A Tool for Converting from MARC to FRBR
isCreatorOf
hasName
hasTitle
UB skal ikke investere i et nytt discoveryverktøy. For våre brukere ville dette ha bare en marginal verdi. I stedet skal vi konsentrere innsatsen om å levere materiale som er lisensiert for NTNU-brukere, samt å levere materiale som er produsert av vitenskapelige ansatte ved NTNU. Enkelte av våre spesialsamlinger har fremdeles ikke gode nok muligheter for å bli funnet på det åpne nettet. Det er nødvendig å forbedre gjenfinningen ved å dele metadata gjennom nasjonale og internasjonale tjenester. Om nødvendig må vi fortsette å bruke BIBSYS-katalogen for å sikre tilgang inntil vi har bedre løsninger.Vi må revurdere bibliotekets rolle i tilgjengeliggjøring av vitenskapelig informasjon. Vår rolle innen gjenfinningstjenester for slik informasjon har vært en del av vår identitet i årevis. Vi innser at å gi fra seg denne rollen til andre aktører vil få oss til å føle oss nakne og usikre. Derfor må vi legge nye planer for hvordan vi skal tilby våre tjenester for tilgang til vitenskapelig informasjon. Vi vil fase ut Primo Central. For oppdaging av e-ressurseer finnes det tilstrekkelig gode alternativer. Vi må undersøke om og i tilfelle hvordan BIBSYS-katalogen kan brukes som et tilgangsverktøy for vårt trykte materiale. Den kan være nyttig som et hjelpemiddel for å finne fram til "kjente dokumenter"
The Library should not invest in a new library discovery tool. The benefit for our users will be marginal. Instead, we should concentrate on improving delivery of the materials purchased and licensed for NTNU users or produced by NTNU scholars. Discovery in the public cloud of special collections and certain other special materials is still inadequate. We need to improve findability by adding metadata to national and international initiatives. If necessary we may need to hold on to parts of the BIBSYS OPAC to ensure materials can be found until better solutions will become available. We should rethink the role of the library in giving access to scientific information. Our role in discovery of scientific information has been part of our library identity for years. We realise that relinquishing this role to other players can make us feel naked and uncertain. We have to rethink and redesign the way we offer our services for access to scientific information. We should phase out Primo. For discovery of electronic articles there are sufficient alternatives available. We should investigate if and how the BIBSYS OPAC can serve as a delivery tool for our printed materials. It might be useful as a “known item search”– tool.
Indeksering
Søking
Dokumenter
Database
Indeksering
Databaser
Referansedatabaser (A&I)laget for å gi god søking
Fulltekstdatabaserlaget for å gi tilgang til fulltekst
Bibliotekdatabaserlaget for å vise hva biblioteket har
Kunnskapsbaserlaget for å viser hva biblioteket har
Samkataloger og samsøking
Formål: søke i flere søkekilder på et sted
I gamle dager: Samkataloger = fysisk sammenslåing av flere kataloger til en
På 1990-tallet: Samsøking = metasøking = søking i forskjellige søkekilder fra ett grenssnitt
I dag: Discovery = fysisk sammenslåing av flere søkeindekser til en
Samsøking
Fungerte vha standardisering av søkeprotokoller (f.eks. Z39.50 som i MetaLib) og / eller via flerprotokollsystemer (IANI, MetaLib)
Samsøking var dømt til å mislykkes
fordi
● protokollene og standardene var for komplekse
● de lokale tolkingene av dem forskjellige● serverne var for dårlige og ustabile● sammenfletting og deduplisering av treff fra
forskjellige systemer var i praksis umulig i det virkelige liv
Søketeknologi før (IR)
Hvordan matche søketermer og indekstermer
Boolsk søking vs
Vektorsøking
Trunkering vs
Lingvistisk analyse
Søkespråk
CCL: Common Command Language (GENSØK)CQL: Contextual Query Language (Ask)
boolske operatorerfeltkodertrunkeringnærhetsoperatorersorteringvisningsformater osv osv osv
StandardiseringsbehovFrom: Even Hartmann Flood <[email protected]>
To: Ole Husby <[email protected]>
Jeg kan godt ha sagt noe slikt - jeg brukte mange systemer og det var jo ikke to som var like. Fortvilelsen var stor. Men noen tall husker jeg ikke. Jeg husker a du engang ga meg i oppdrag å skaffe eksempler på forskjellige søkespråk og jeg i et anfall av glad sadisme ga deg en rekke av de forskjellige utskriftkommandoene jeg hadde funnet i forskjellige tjenester.
Even
> >From: Ole Husby [mailto:[email protected]]
> >To: Even Hartmann Flood
> >Subject: Søkespråk
> >du sa en gang, kanskje for 20 år siden, at du hadde sjekket 50 søkesystemer
> >og funnet 49 forskjellige søkespråk. Eller kanskje var det helt andre tall.
> >Husker du?
> >
> >Ole
Søketeknologi nå (Google)
Hvordan matche søkeuttrykk og dokumenter
Kvasi-goolsk søkingStrengmatchingLenkeanalyseKontekstuelle, lokalitets-, personlige og sosiale aspekter
Ingen får vite nøyaktig hvordan dette virkerMen hvor mye har det å si?
Pathetic usersUsers are incredibly bad at finding and researching things on the web. A few years ago, I characterized users' research skills as "incompetent," and they’ve only gotten worse over time. "Pathetic" and "useless" are words that come to mind after this year's user testing.
In a recent study, for example, a user wanted to buy a highly protective yet girlish phone case as a gift for her daughter. While on Amazon.com, she engaged in random fishing expeditions into the product database, using search queries such as "pink impact resistant iphone 5 cover."
Jakob Nielsen http://www.nngroup.com/articles/search-navigation/
OK. Men er dette så patetisk da?
Hva er en søkemotor?
En tjeneste som søker fram nettsider etter en forutgående indeksering utført av en "robot"
Robotene er ikke flink til å finne deler av nettsider eller aggregat av nettsider, og klarer stort sett ikke å finne det som ikke er statiske sider med en fast adresse, f.eks. innholdet i databaser etc
Søkemotorer gjennom tidene
Hvordan jobber søkemotorene?
Hvem trenger å vite noe om det?
Hva er SEO?Hvordan virker PageRank?Hva er robots.txt?Hva er SiteMaps?Hva er schema.org og microdata?
Hvordan jobber BIBSYS Ask?
Hvem trenger å vite noe om det?
- søkeindekser- innhold i søkeindeksene (marc-felt)- søke ord, antall ord- søke fraser - lengde- spesialtegn, tegnkonvertering- basisindex