Indici di Variabilità
• NdE
• Range (o campo di variabilità)
• Scarto medio assoluto
• Somma dei quadrati
• Varianza e deviazione standard
Il concetto di variabilità
• La variabilità è una misura della dispersione di una distribuzione di frequenza
• La variabilità determina il grado in cui una singola misura è rappresentativa della popolazione
65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Q.I.
N.
stu
den
ti
Elevata variabilità
65 75 85 95 105 115 125 135
0
1
2
3
4
5
6
7
8
9
10
Q.I.
N.
stu
den
ti
Bassa variabilità
Variabilità e statistica inferenziale
65 75 85 95 105 115 125 135
0
1
2
3
4
5
6
7
8
9
10
Gruppo 1
Gruppo 2
Q.I.
N.
Stu
den
ti
65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Gruppo 1
Gruppo 2
Q.I.
N.
stu
den
ti
Nell’assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo
Nella presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I.
Indici di variabilità
Due distribuzioni possono avere stessi indici di centralità (media, mediana, moda) ma essere diversamente dispersi.
Il campo di variazione o RANGE
Il campo di variazione di una distribuzione è la differenza fra il valore massimo e il valore minimo rilevati.
Range = Val max- Val min
Osservazioni: 1,2,5,7,8,9
Valore massimo: 9
Valore minimo: 1
Campo di variazione: 8
Il campo di variazione come misura della variabilità
Il campo di variazione si esprime in valori assoluti.
Non dice nulla su come i valori assunti dalla variabile sono distribuiti.
Osservazioni di altezza (mm): 1600,1520, 1720,1670, 1700
Osservazioni di peso (kg) 50, 70, 110, 73, 80 Kg.
Scarto medio assoluto dalla media aritmetica
Lo scarto medio assoluto dalla media aritmetica è la somma degli scarti dei vari dati rispetto alla loro media aritmetica considerati in valore assoluto. Lo scarto medio assoluto non è altro che la media aritmetica delle distanza di ciascun dato dalla media.
Scarto medio assoluto dalla media aritmetica
Varianza e deviazione standard
Definizione intuitiva della variabilità: la variabilità come distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione
Alcune distanze sono negative, alcune positive
La somma di tutte le distanze è pari a zero
La media delle distanze è pari a zero
Non possiamo utilizzare la somma delle distanza come misura di dispersione
65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Q.I.
N.
stu
den
ti
Valore medio
Distanza rispetto alla media
Somma dei quadratiLa somma dei quadrati della distanza fra la media (µ) e il valore dell’osservazione
L’utilizzo del quadratoElimina i valori negativiDa maggior peso alle osservazioni lontane dalla media
Il valore della somma dei quadrati aumenta con il numero delle osservazioni.
OsservazioneX ¼ X-¼ (X-¼)^2
1 14 15,6 -1,6 2,562 17 15,6 1,4 1,963 18 15,6 2,4 5,764 22 15,6 6,4 40,965 12 15,6 -3,6 12,966 4 15,6 -11,6 134,567 6 15,6 -9,6 92,168 30 15,6 14,4 207,369 33 15,6 17,4 302,76
10 0 15,6 -15,6 243,36
2)( X
La varianza di una popolazione
• La varianza si calcola come la media del quadrato della distanza fra il valore della singola osservazione e il valore medio per l’insieme delle osservazioni
• La varianza è una misura finalizzata alla standardizzazione delle misure di variabilità
• Il valore della varianza è indipendente rispetto al numero delle osservazioni
N
X 2)(
OsservazioneX ¼ X-¼ (X-¼)^2
1 14 15,6 -1,6 2,562 17 15,6 1,4 1,963 18 15,6 2,4 5,764 22 15,6 6,4 40,965 12 15,6 -3,6 12,966 4 15,6 -11,6 134,567 6 15,6 -9,6 92,168 30 15,6 14,4 207,369 33 15,6 17,4 302,76
10 0 15,6 -15,6 243,36Somma 1044,4N 10Varianza 104,44
La deviazione standard
• La varianza non costituisce una misura “intuitiva” dalla distanza fra una “osservazione tipica” e il valore medio
• Tale distanza è rappresentata dalla deviazione standard
• La deviazione standard di una popolazione è rappresentata dal radice quadrata della varianza della popolazione
N
X
2)(
OsservazioneX ? X-? (X-?)^2
1 14 15,6 -1,6 2,562 17 15,6 1,4 1,963 18 15,6 2,4 5,764 22 15,6 6,4 40,965 12 15,6 -3,6 12,966 4 15,6 -11,6 134,567 6 15,6 -9,6 92,168 30 15,6 14,4 207,369 33 15,6 17,4 302,76
10 0 15,6 -15,6 243,36Somma 1044,4N 10Varianza 104,44Dev. St. 10,22
Esempio
1. Calcolare la varianza e la deviazione standard del seguente insieme di dati
– 10,10,10,10,10
2. Calcolare la varianza e la deviazione standard del seguente insieme di dati
– 1,3,3,4,9
Prima esercitazione
OsservazioneX ¼ X-¼ (X-¼)^2
1 10 10 0 02 10 10 0 03 10 10 0 04 10 10 0 05 10 10 0 0
Media= 10Somma distanze 2̂ 0N 5Varianza 0Dev. St. 0
Completa assenza di variabilità
Seconda esercitazione
OsservazioneX ¼ X-¼ (X-¼)^2
1 1 4 -3 92 3 4 -1 13 3 4 -1 14 4 4 0 05 9 4 5 25
Media= 4Somma distanze 2̂ 36N 5Varianza 7,2Dev. St. 2,68
Visualizzare la deviazione standard
65 75 85 95 105 115 125 135
0
0,25
0,5
0,75
1
1,25
1,5
1,75
2
2,25
2,5
2,75
3
Q.I.
N.
stu
den
ti
=17,2
Questa osservazione è distante 1 Dev. St. rispetto alla media
La Varianza e la Deviazione Standard
La deviazione standard è l’indice normalmente utilizzato per calcolare la dispersione di una distribuzione di dati. Si può affermare che la deviazione standard calcola la “quantità” media di deviazione dalla media. E’ una misura lineare della dispersione dei dati.
La varianza è invece una media di aree e non è mai negativa.
La deviazione standard nella letteratura scientifica
Forma standardizzata di presentazione
forma breve
forma tabellare
Importante indicare la numerosità di ciascuno dei gruppi e sottogruppi
CartoonViolento ControlloMaschi M=15,72 M=6,92
Dev. St.=4,43 Dev.St.=2,26Femmine M=3,47 M=2,61
Dev. St.=1,12 Dev.DSt=0,98
“I bambini che hanno visionato il cartoon hanno mostrato un indice di aggressività (M=12,45, Dev St.=3,7) superiore rispetto al Gruppo di controllo (M=4,22, Dev. St.=1,04)”
Esempio1: distribuzione poco dispersa
Peso (kg) Fa Fa*xi scarto Scarto quadratoScarto
quadratoPonderato
48 0 0,0 -19,7 388,7 0,0
53 0 0,0 -14,7 216,5 0,0
55 0 0,0 -12,7 161,7 0,0
60 0 0,0 -7,7 59,5 0,0
65 24 1560,0 -2,7 7,4 176,8
68 60 4080,0 0,3 0,1 4,9
70 21 1470,0 2,3 5,2 109,7
74 0 0,0 6,3 39,5 0,0
78 0 0,0 10,3 105,8 0,0
80 0 0,0 12,3 150,9 0,0
84 0 0,0 16,3 265,2 0,0
105 7110,0 Somma quadrati 291,4
Media(kg)
67,7 Varianza 2,8
Dev. standard(kg)
1,7
Grafico 1: distribuzione poco dispersa
Distribuzione "concentrata"
0
10
20
30
40
50
60
70
48 53 55 60 65 68 70 74 78 80 84
Peso (kg)
Fre
qu
en
za
Esempio2: bassa dispersione
Peso (kg) Fa Fa*xi Scarto Scarto quadratoScarto quadrato
ponderato
48 0 0,0 -19,7 389,8 0,0
53 0 0,0 -14,7 217,4 0,0
55 2 110,0 -12,7 162,4 324,8
60 5 300,0 -7,7 60,0 299,8
65 17 1105,0 -2,7 7,5 127,9
68 54 3672,0 0,3 0,1 3,6
70 20 1400,0 2,3 5,1 101,9
74 5 370,0 6,3 39,2 195,8
78 2 156,0 10,3 105,2 210,4
80 0 0,0 12,3 150,2 0,0
84 0 0,0 16,3 264,3 0,0
Totale 105 7113,0 Somma quadrati 1264,1
Media (kg) 67,7 Varianza 12,0
Dev. Standard (kg) 3,5
Grafico2: bassa dispersione
Bassa dispersione
0
10
20
30
40
50
60
48 53 55 60 65 68 70 74 78 80 84
peso (kg)
fre
qu
en
za
Esempio3: alta dispersione
Peso (kg) Fa Fa*xi Scarto Scarto quadratoScarto quadrato
ponderato
48 2 96,0 -19,7 389,0 778,1
53 5 265,0 -14,7 216,8 1084,0
55 7 385,0 -12,7 161,9 1133,3
60 10 600,0 -7,7 59,7 596,6
65 15 975,0 -2,7 7,4 111,3
68 22 1496,0 0,3 0,1 1,7
70 18 1260,0 2,3 5,2 93,3
74 7 518,0 6,3 39,4 275,7
78 10 780,0 10,3 105,6 1056,0
80 5 400,0 12,3 150,7 753,5
84 4 336,0 16,3 264,9 1059,7
Totale 105 7111,0 Somma quadrati 6943,0
Media(kg)
67,7 Varianza 66,1
Dev. Standard(kg)
8,1
Grafico3: alta dispersione
Alta dispersione
0
5
10
15
20
25
48 53 55 60 65 68 70 74 78 80 84
peso (kg)
Fre
qu
en
za
Esempio4: dispersione molto elevata
Peso (kg) Fa Fa*xi scarto Scarto quadratoScarto quadrato
ponderato
48 6 288,0 -19,7 389,8 2338,7
53 8 424,0 -14,7 217,4 1738,8
55 8 440,0 -12,7 162,4 1299,0
60 9 540,0 -7,7 60,0 539,6
65 9 585,0 -2,7 7,5 67,7
68 15 1020,0 0,3 0,1 1,0
70 13 910,0 2,3 5,1 66,2
74 11 814,0 6,3 39,2 430,7
78 10 780,0 10,3 105,2 1052,1
80 8 640,0 12,3 150,2 1201,9
84 8 672,0 16,3 264,3 2114,4
Totale 105 7113,0 Somma quadrati 10850,1
Media(kg)
67,7 Varianza 103,3
Dev. Standard (kg 10,2
Grafico4: dispersione molto elevata
Molto dispersa
0
2
4
6
8
10
12
14
16
48 53 55 60 65 68 70 74 78 80 84
peso (kg)
Fre
qu
en
za
Confronto Range – Deviazione standard - Percentili
www.quadernodiepidemiologia.it