Pres c7 hoofdstuk3

Hoofdstuk 3 : Evaluatie Hoofdstuk 3 : Evaluatie en bibliometrische en bibliometrische

aspectenaspecten

Finding the norm

1. Inleiding (1)1. Inleiding (1)

Waarom evalueren?

Efficientie en effectiviteit van IRS Uitbreiding hiervan :

Geld Invloed eindgebruiker

1. Inleiding (2)1. Inleiding (2)

Criteria voor evaluatie :

Recall and precision Response time Gebruiksvriendelijkheid Presentatievorm Collectiebereik

2. Evaluatie van 2. Evaluatie van ongerangschikte resultaten ongerangschikte resultaten (1)(1)

1.Precision :

2.Recall :


3.Miss : Fractie van relevante niet gevonden documenten

4.Fall-out :


5.Accuracy : Fractie van juist geklasseerde resultaten

6.F-Measure : Gewogen gemiddelde van Precision en recall


R en P zijn omgekeerd evenredig

Records zijn relevant of niet-relevant, zonder tussenweg

Moeilijk om relevantie te bepalen

Nog moeilijker om recall te bepalen

2. Oefening (1)2. Oefening (1)




Bereken telkens :

Recall Precision Accuracy Miss (F-Measure)

2. P en R in IR (1)2. P en R in IR (1)

P en R = Goede maten voor discipline gebonden DB

Maar niet voor “moderne” zoekmachines Exhausitiviteit is niet belangrijk Veel informatie Precision is belangrijk Relevantie is minder belangrijk ranking



3. Gerangschikte resultaten 3. Gerangschikte resultaten (1)(1)

Problematiek van gerangschikte resultaten :

Zie voorbeeld

Dus Nieuwe criteria voor beoordeling : vb.

Precision bij een bepaalde rangschikking Precision bij laatste relevante document Precision bij een bepaalde recall



1. Ranking effectiveness and avering


1. Ranking effectiveness and avering


2. Top documents focus

Eindgebruikers : bekijken enkel top documenten

Recall is niet van belang Meten hoe goed een IRS

topdocumenten weergeeft Recall vastleggenop bepaalde

rankings Precision berekenen op die rankings


3. Discounted cumulative gain

Uitgangspunt Hoger gerangschikt is relevanter Lager gerangschikt is minder nut

Graded relevance berekenen “Gain” cumuleren “Gain” neemt relatief af


3. Discounted cumulative gain

4. Kwalitatieve benadering4. Kwalitatieve benadering

Elapsed indexing time :

Indexing processor time :

Query throughput :

Query latency :

Indexing temporary space :

Index size :

5. Andere bibliometrische 5. Andere bibliometrische berekeningen (1)berekeningen (1)

Bibliometrische informatieVs.Bibliografische informatie

Twee databanken :WoSGoogle Scholar


1. WoS

Journal Impact factor 2-jaarlijks 5-jaarlijks

Journal self cites Journal immediacy index Journal cited half-life Journal citing half-life


1. WoS

Eigen factor Gebaseerd op JIF Houdt rekening met gewicht citerende TS

Journal influence score Gebaseerd op Eigenfactor Mediaan =1


1. WoS : Researchers

Totaal artikels Totaal citaties H-index


2. Google Scholar : Tijdschriften

H-index H5-index

2. Google Scholar : Onderzoekers

H-index H5-index I5-index


Nadelen

Impactfactor is te eenvoudig Nadelen voor humane wetenschappen

Geen boeken / vaktijdschriften / nationale publicaties

Vooral Engelstalig Te korte berekeningsperiodes

Grote databanken Fouten in persoonsnamen Fouten in instelllingen Nieuwe publicaties duurt lang


Nadelen

Google Scholar Onduidelijkheid over herkomst Vindt niet alles Fouten en onnauwkeurigheden

Gemakkelijk fraude Citatie-analyse context


Voordelen

Duidelijke (kwantitatieve) manier van werken

Geeft indicaties over de kwaliteit Relaties tussen publicaties en

onderzoekers Er is niets anders Bruikbaar in een breder veld

Documents

Pres c7 hoofdstuk3