Upload
giorgina-valentini
View
214
Download
1
Embed Size (px)
Citation preview
Gestire le collezioni elettroniche con dati qualitativi e quantitativi
Il case-study di Wiley-Blackwell all’Università degli Studi di Milano
Tiziana Morocutti e Federica Zanardini
Parte 1. sviluppo di un toolkit per la raccolta e l’analisi dei dati
SISTEMA BIBLIOTECARIO DI ATENEO
Le ragioni di questo lavoro : gestire la collezione in tempi di crisi economica
Analizziamo le relazioni tra le entità in gioco
content usefulnes
s
prices
(ingranaggi o mine vaganti?)
SISTEMA BIBLIOTECARIO DI ATENEO
Il primo case-study: la collezione Wiley-Blackwell
I dati a nostra disposizione:
• Statistiche d’uso (2008 JR1)• Dati economici (2009 listino prezzi, termini contrattuali)• Dati bibliografici (2009 lista dei titoli, copertura disciplinare)• Dati demografici sugli utenti (anagrafica UNIMI 2009)• Risultati del questionario agli utenti (2009)
Recuperare dati qualitativi: un questionario online per verificare il grado di interesse dei titoli Wiley
• Per ogni titolo del catalogo Wiley 2009 è stato chiesto di indicare se “utile” o “irrinunciabile”
• Non voto = non utile• Somministrato a docenti e ricercatori (2.440 persone)• Aperto per 40 giorni• Il 25% del campione ha risposto (650 persone)
SISTEMA BIBLIOTECARIO DI ATENEO
Distribuzione dei prezzi dei titoli W-B
SISTEMA BIBLIOTECARIO DI ATENEO
Distribuzione dell’uso (f.t. scaricati)
• 2008 downloads = 157,606
• 30% dei titoli => 85% dell’uso
(sottoscritti e non in carta)
• 4% dei titoli mai scaricati
• Nella classe[0-100 dw] – sono contenuti 850 titoli– corrispondenti a 23.000 dw– È una long-tail?
SISTEMA BIBLIOTECARIO DI ATENEO
SISTEMA BIBLIOTECARIO DI ATENEO
Distribuzione del valore percepito (questionario)
• “Quali riviste Wiley-Blackwell sono importanti per te?”• 94% dei titoli sono stati selezionati• 35% dei titoli sono stati selezionati da almeno 10 utenti
Relazione tra uso e valore percepito
• Uso e valore percepito sono correlati e/o connessi?
• Rappresento i dati su uno scatter plot: ogni titolo è rappresentato da una coppia di valori
• => l’area a maggior densità è quella del basso-uso e basso valore percepito
SISTEMA BIBLIOTECARIO DI ATENEO
Relationship between usage and perceived value
0
1000
2000
3000
4000
5000
6000
7000
8000
0 20 40 60 80 100 120
#selezioni
#d
ow
nlo
ad
La correlazione tra le due variabili è lineare?
• Si calcola l’indice di Pearson R, cioè il grado di correlazione lineare
• R è adimensionale (0< R < 1)
• Si ottiene:– R = 0.55 titoli con #download > 100 (media correlazione
lineare)– R = 0.35 titoli con #downloads <= 100 (scarsa
correlazione lineare)
SISTEMA BIBLIOTECARIO DI ATENEO
SISTEMA BIBLIOTECARIO DI ATENEO
Un altro tool del kit: l’indice di anomalia
Journal ranking 1/2
• L’utilità viene definita attraverso un algoritmo che combina dati sull’uso e valore percepito:
U = (e + 0.2u) * downloadsU = utilitàe = numero di selezioni “irrinunciabile”u = numero di selezioni “utile”
• Ai titoli viene assegnato un punteggio e una classifica• Considerando anche il prezzo di listino (p+e) la lista
può essere usata per calcolare il risparmio in relazione alle cancellazioni
SISTEMA BIBLIOTECARIO DI ATENEO
SISTEMA BIBLIOTECARIO DI ATENEO
Journal ranking 2/2
Con l’attuale modello di pricing risparmi apprezzabili rispetto al Big Deal sono raggiunti solo tagliando un numero considerevole di titoli
I primi 300 titoli costano quanto l’intero pacchetto sottoscritto in Big Deal