21
metasearch • wat is het probleem bij de oplossing? • welke oplossing bij welk probleem?

Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

Embed Size (px)

Citation preview

Page 1: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

metasearch

• wat is het probleem bij de oplossing?

• welke oplossing bij welk probleem?

Page 2: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

behoefte aan integreren van meer bronnen / zoeksystemen

waarom wil je dat voor je gebruikers?

• het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen

• het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben

© eric sieverts, UB Utrecht

Page 3: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Page 4: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

behoefte aan integreren van meer bronnen / zoeksystemen

waarom wil je dat voor je gebruikers?

• het is onhandig als ze dezelfde zoekvraag aan elk afzonderlijk systeem telkens weer opnieuw moeten stellen

• het is gebruikersonvriendelijk dat die systemen vaak allemaal verschillende zoekinterfaces hebben

© eric sieverts, UB Utrecht

Page 5: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?
Page 6: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

integreren van meer bronnen / zoeksystemen

globaal twee soorten aanpak:

• alle bronnen zelf in je eigen centrale systeem (zoekmachine) indexerende OMEGA-aanpak

• meta-zoeksysteem dat de bij de afzonderlijke bronnen behorende zoeksystemen in één keer parallel bevraagt (gedistribueerde zoekactie)de METALIB-aanpak

© eric sieverts, UB Utrecht

Page 7: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

indexer

internet

tekstbestanden(metadata) tekstbestanden

centrale index

zoekengeïntegreerd systeemvia lokale centrale index

indexeer-regels voor

targets

full-text links

mega

Page 8: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

eigen centrale index

voorbeelden:UB Utrecht - Omega-systeem• metadata van artikelen uit groot aantal

tijdschriften van diverse leveranciers

OAIster • via Open Archive protocol “ge-harveste”

metadata (volgens Dublin Core), uit ruim 400 “institutionele archieven” met wetenschappelijke publikaties

© eric sieverts, UB Utrecht

Page 9: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

eigen centrale index

voordelen:

• garantie van uniforme zoekmogelijkheden

• geavanceerde zoekfunctionaliteit mogelijk, want we hebben zelf in de hand welke zoekmachine we kiezen en hoe we die configureren

nadelen:

• zwaar systeem (eigen zoekmachine) te hosten en beheren

• kan niet voor alle “content”© eric sieverts, UB Utrecht

Page 10: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

wanneer eigen index ?

als je zelf beheer kunt krijgen over te doorzoeken “content”

– wel bij materiaal van (sommige / grote) uitgevers (zoals Elsevier, JStor, etc)

– niet bij materiaal van uitgevers die dat (nog) niet willen / kunnen / begrijpen

– niet bij databases waar bijbehorend zoek-systeem al verweven is met (de ontsluiting van) de gegevens (zoals Ovid, CSA, Pubmed, etc)

© eric sieverts, UB Utrecht

Page 11: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search oplossing

daarvoor is nodig:

• het betreffende materiaal / content moet al een eigen zoeksysteem hebben

• dat zoeksysteem moet extern (via internet) te benaderen zijn

• met dat zoeksysteem moet via gestructureerde interactie gecommuniceerd kunnen worden (opdrachten versturen, antwoorden binnenhalen)

© eric sieverts, UB Utrecht

Page 12: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

internet

zoekengeïntegreerd systeemvia meta-zoekmethode

index

be-stand

zoek

query-generator / antwoord-inzamelaar

index

be-stand

zoek

index

be-stand

zoek

index

be-stand

zoek

index

be-stand

zoek

index

be-stand

zoek

Z39.50

Z39.50 Z39.50

internapi

http http xml

Z39.50 http

configuratiegegevens

van targets

Page 13: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search oplossing

metasearch software (zoals Metalib) kan communiceren met verschillende soorten zoeksystemen:

– Z39.50 protocol (vooral bibliografische databases)redelijk gestandaardiseerd, maar weinig geavanceerd

– interactie op basis van xml (o.a. nieuw SRU-protocol)redelijk flexibel, maar nog geen ruime ondersteuning

– http-protocol / web-formulieren ("screen-scraping")wijd verbreid, maar niet gestructureerd / weinig stabiel

– lokale “legacy”-systemen © eric sieverts, UB Utrecht

Page 14: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search oplossing

voordelen:– geen zwaar eigen systeem te beheren

– ook geschikt voor niet zelf indexeerbare content

nadelen: – grootste gemene deler van zoekfunctionaliteit

– geen geavanceerde zoekfuncties beschikbaar

– soms ingewikkeld configuratie-werk (zowel voor Z39.50 als voor http:url-syntax en screen-scraping)

© eric sieverts, UB Utrecht

Page 15: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search toepassingen UBU

wat we zelf niet makkelijk kunnen indexeren en wel een bijbehorend zoeksysteem heeft

– full-text tijdschriften die we (nog) niet in Omega-zoekmachine hebben kunnen krijgen

– bibliografische databases, catalogi etc. die we niet zelf kunnen indexeren én niet tot de eigen full-text collectie behoort (dus eigenlijk niet in Omega-zoeksysteem thuishoort)

© eric sieverts, UB Utrecht

Page 16: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

meta-search bij Omega

uitgevers die (nog) geen metadata leveren

mogelijke problemen:

– meestal web-interfaces die configuratie met screen-scraping nodig maken

– meeste waarschijnlijk (nog) niet standaard ondersteund door Metalib (ExLibris)

© eric sieverts, UB Utrecht

Page 17: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

bibliografische meta-search

al die verschillende niet-fulltext zoeksystemen

mogelijke problemen bij Metalib:

– veel “native” interfaces bieden veel betere / geavanceerder zoekmogelijkheden

– niet meer dan 10 tegelijk doorzoekbaar te maken– samenvoegen van op relevantie geordende

zoekresultaten geeft problemen– nog niet allemaal standaard ondersteund door

Metalib– …..

© eric sieverts, UB Utrecht

Page 18: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

mogelijke scenario’s voor toepassen van meta-search

scenario 1:

we bieden gebruikers twee systemen:

– metasearch systeem dat alle bibliografische bronnen tegelijk doorzoekbaar maakt (in groepjes van maximaal 10)

– Omega-systeem dat alle full-text materiaal tegelijk doorzoekbaar maakt via:Omega-zoekmachine + metasearch van “overige” uitgevers

© eric sieverts, UB Utrecht

Page 19: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

internet

“biblio”metasearch

scenario 1

index

Aleph

zoek

index

biblograf.

zoek

index

ncc

zoek

index

bibliograf.

zoek

index

fulltext

zoek

index

fulltext

zoek

omegaindex

“full-text”metasearch

omegazoekmach.

bibliografisch zoeken omega zoeken

full-textzoeken

Page 20: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

mogelijke scenario’s voor toepassen van meta-search

scenario 2:

we bieden gebruikers één systeem:

– systeem dat “alles” tegelijk doorzoekbaar maakt via metasearch (opgedeeld in groepjes van maximaal 10)

daarónder native interfaces van alle individuele systemen; daarbij behalve Pubmed, Psycinfo, catalogus enz., óók Omega dat alle full-text materiaal tegelijk doorzoekbaar maakt

© eric sieverts, UB Utrecht

Page 21: Metasearch wat is het probleem bij de oplossing? welke oplossing bij welk probleem?

internet

“alles”metasearch

scenario 2

index

Aleph

zoek

index

biblograf.

zoek

index

ncc

zoek

index

bibliograf.

zoek

index

fulltext

zoek

index

fulltext

zoek

omegaindex

“full-text”metasearch

omegazoekmach.

alles zoekenomega

full-text zoeken

index

bibliograf.

zoek

pubmed

catalogus