Upload
giorgio-corsini
View
217
Download
2
Embed Size (px)
Citation preview
Elementi di Statistica I
05 aprile 2008
Repetita iuvantLa statistica studia i fenomeni, le loro caratteristiche, se e comeessi variano nel tempo e nello spazio;in alcuni casi può generalizzare il fenomeno osservato su un “ridottogruppo di elementi”in alcuni casi può fare previsioni
CostanteCaratteristica che non cambia nelle diverse Osservazioni
VariabileManifestazione, misurabile su una scala predefinita, del fenomeno oggetto di studio o del concetto oggetto di studio
Unità StatisticaElemento portatore della/e variabile/i in esame
Master in Neuropsicologia Clinica
1/26
Elementi di Statistica I
Modalitàinsieme di stati significativamente distinti tra loro assumibili della variabile in oggetto (esaustivi non sovrapposti)
OsservazioneDeterminazione numerica, o stato, della variabile effettivamente rilevata sulle unità statistiche.
Universo (popolazione)Insieme di unità statistiche in studio cui si vogliono riferire i risultati dell’analisi
CampioneSottoinsieme di unità statistiche (dette unità campionarie) estratte dalla popolazione.
Master in Neuropsicologia Clinica
05 aprile 2008 2/26
Elementi di Statistica I
Misurazionestabilire e applicare regole di assegnazione di numeri o etichette a proprietà di oggetti o eventi in modo tale da poter attribuire alcune delle caratteristiche dei numeri alle proprietà stesse (scaling)
Classificazione delle variabili1. Qualitative – le cui modalità sono etichette, categorie…2. Quantitative – le cui modalità sono espresse da valori
o classi di valori numerici3. Stevens
Master in Neuropsicologia Clinica
05 aprile 2008 3/26
Master in Neuropsicologia Clinica Elementi di Statistica I
Scala di misura
Nominale Ordinale Intervalli Rapporti
Tipo divariabile
Qualitativa Quantitativa
Proprietà Classificazione Ordinamento Esiste unità di misuraRelazione tra le distanze/differenze
Zero assoluto
Rapporto tra modalità
Operazioni = ≠ = ≠ = ≠ (X-Y)/(Z-L)
= ≠ (X-Y)/(Z-L)
X/Y
Esempio Genere Grado di Neoplasia
Temperatura °C
Pressione arteriosa
Direzione
cumulativa
delle proprietà
05 aprile 2008 4/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Esempio:Corsa campestre
Numero di maglia (basato su assegnazione casuale)
1
3
2
5
4
Numero di maglia: scala nominale
1 ≠ 2 ≠ 3 ≠ 4 ≠ 5
05 aprile 2008 5/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Ordine di arrivo
primo ultimo
13 25 4
II III IV
Ordine di arrivo: scala ordinale
Orario di arrivo: scala intervalli
Orario di arrivo
13:30 13:50
13 25 4
13:32 13:38 13:41
3 1 5 4 2
2 5
1 3
126
2
t t
t t
05 aprile 2008 6/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Tempo di percorrenza
00:20 00:40
13 25 4
00:22 00:28 00:3100:00
Tempo di percorrenza: scala rapporti
2
1
402
20
t
t
05 aprile 2008 7/26
Elementi di Statistica I
1. organizzazione dei datia. matrice dei dati
Analisi Univariata
Unità Genere Età Tumore SNC Neoplasia Anno prima diagnosi …
1 M 34 Meningioma Grado I 2000
2 M 49 Craniofaringioma Grado II 2003
3 F 52 Medulloblastoma Grado II 1999
… … … … … …
180 F 64 Tum. pineale Grado I 2001
Sintesi statistica di una variabilequalitativa nominale
Master in Neuropsicologia Clinica
05 aprile 2008 8/26
Elementi di Statistica I
Unità statistica: individuo
Variabile oggetto di studio: tipologia del tumore SNC
Modalità: Medulloblastoma (A)Meningioma (B)Schwannoma (C)Craniofaringioma (D)Tumore delle cellule germinali (E)Tumore della regione pineale (F)
Gruppo di osservazione: 180 unità
Master in Neuropsicologia Clinica
05 aprile 2008 9/26
Elementi di Statistica I
TumoreSNC
A
B
C
D
E
F
IIII
II
IIII
IIII I
0
III
Totale 180
ni
141
9
9
14
0
7
180
fi
0,78
0,05
0,05
0,08
0,00
0,04
1,00
Master in Neuropsicologia Clinica
05 aprile 2008
Tabella della distribuzione di frequenze frequenze assolute
frequenze relative:ni/n
10/26
Elementi di Statistica I
Sintesi numerica?Tendenza centrale
Moda = Modalità i tale che ni o fi sia max
…la modalità che viene rilevata più volte…
Master in Neuropsicologia Clinica
Tumore SNC
ni fi
A 141 0,78
B 9 0,05
C 9 0,05
D 14 0,07
E 0 0,00
F 7 0,04
Totale 180 1,00
05 aprile 2008 11/26
Elementi di Statistica I
Variabilità:(“capacità” delle osservazioni di assumere valori diversi)
?Minima variabilità: tutte le unità sono caratterizzate dalla stessa modalità
(omogeneità)
Master in Neuropsicologia Clinica
Tumore SNC
ni fi
A 0 0,00
B 180 1,00
C 0 0,00
D 0 0,00
E 0 0,00
F 0 0,00
Totale 180 1,00
05 aprile 2008 12/26
Elementi di Statistica I
Variabilità:
?Massima variabilità: tutte le unità si
distribuiscono ‘equamente’ fra le modalità
Master in Neuropsicologia Clinica
Tumore SNC
ni fi
A 30 0,17
B 30 0,17
C 30 0,17
D 30 0,17
E 30 0,17
F 30 0,17
Totale 180 1,02
05 aprile 2008 13/26
Elementi di Statistica I
Indice di eterogeneità di Gini
2
1
G 1m
ii
f
21
min G 1 1 0
1 1 1max G 1 1
m
i
m
m m m
Master in Neuropsicologia Clinica
05 aprile 2008
Tumore SNC
ni fi
A 0 0,00
B 180 1,00
C 0 0,00
D 0 0,00
E 0 0,00
F 0 0,00
Totale 180 1,00
Tumore SNC
ni fi
A 30 0,17
B 30 0,17
C 30 0,17
D 30 0,17
E 30 0,17
F 30 0,17
Totale 180 1,02
14/26
m = numero di modalità
Elementi di Statistica IMaster in Neuropsicologia Clinica
Tumore SNC
ni fi fi2
A 141 0,78 0,608
B 9 0,05 0,003
C 9 0,05 0,003
D 14 0,07 0,006
E 0 0,00 0,000
F 7 0,04 0,002
Totale 180 1,00 0,622
62
1
G 1 1 0,622 0,378ii
f
05 aprile 2008
max (G) = (6-1) / 6 = 0,833
15/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Genere ni fi fi2
M 148 0,82 0,672
F 32 0,18 0,032
Totale 180 1,00 0,704
22
1
G 1 1 0,704 0,296ii
f
05 aprile 2008 16/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Quale variabile presenta maggiore variabilità?
Tumore: G 0,378
Genere: G 0,296
Tum
Gen
Confronti?
Indice di eterogeneità relativa
2
1
GG 1
max G 1
m
ii
mf
m
2
1
G 1m
ii
f m f
05 aprile 2008 17/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
max (GTum) = (6-1) / 6 = 0,833
max (GGen) = (2-1) / 2 = 0,500
G 0,378
G 0,454max G 0,833
TumTum
Tum
G 0,296
G 0,592max G 0,500
GenGen
Gen
05 aprile 2008 18/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Sintesi statistica di una variabilequalitativa ordinale
Sintesi numerica?
Tendenza centrale:oltre alla MODA, è possibile calcolare un indicatore di tendenza centrale che sfrutta l’informazione contenuta nell’ordinamento…
Mediana
05 aprile 2008 19/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Mediana
Quel valore di una distribuzione ordinata che divide la distribuzione in due parti uguali, tali che il numero di
osservazioni uguale o maggiore della mediana coincide con il numero di osservazioni uguale o minore della mediana
Esempio 1: 5 unità statistiche – var: grado di neoplasia – modalità: grado I, grado II, grado III, grado IV
05 aprile 2008 20/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Mediana(individuazione)
1. si ordinano le unità statistiche (in senso crescente)
2. si individua l’unità centrale, ovvero quella che nella sequenza ordinata delle u.s. ha tante u.s. caratterizzate da modalità uguali o inferiori alla propria quante da modalità maggiori (o uguali) alla propria
3. la mediana sarà la modalità che caratterizza l’u.s. centrale
05 aprile 2008 21/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
05 aprile 2008
La mediana è Grado II
Esempio 1: 5 unità statistiche – var: grado di neoplasia – modalità: grado I, grado II, grado III, grado IV
Dati: unità: 1 2 3 4 5neopl.: II I III II III
Distrib. ordinata: posizione: (1) (2) (3) (4) (5)modalità: I II II III IIIunità: 2 1 4 3 5
22/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
In pratica:
• Si ordina la sequenza
• Se n è dispari:l’unità centrale è quella che occupa la POSIZIONE (n+1)/2 nella sequenza ordinata
• Se n è pari:le unità centrali sono due e occupano le POSIZIONI n/2 e n/2+1 nella sequenza ordinata
• La mediana sarà la modalità che caratterizza l’unità (o le unità) centrale(/i)
05 aprile 2008 23/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Esempio 2
Gruppo di 180 soggetti affetti da tumore sui quali è statavalutato il grado di neoplasia.
Variabile: grado di neoplasiaModalità:Grado I
Grado IIGrado IIIGrado IV
Scala di misura: Ordinale
u.s. 11 53 61 … … 9 27 80 88 … … 8 98 108
modalità I I I … … III III III III … … IV IV IV
(posizione) (1) (2) (3) … …(89)(90)(91)(92) … … (178) (179) (180)
05 aprile 2008 24/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Esempio 3 Neoplasia ni fi
Grado I 56 0,31 56 0,31
Grado II 28 0,16 84 0,47
Grado III 76 0,42 160 0,89
Grado IV 20 0,11 180 1,00
Totale 180 1,00 ?? ??
05 aprile 2008
Frequenze assolute cumulate
Ni
Ni = Ni-1 + ni
Fi
Frequenze relative cumulate
Fi = Fi-1 + fi
Grado I56 unità
Grado II28 unità
Grado I e II84 unità
Grado III76 unità
Grado I, II e III160 unità
Grado IV20 unità
Grado I, II, III e IV180 unità
Grado I e II47% unità
Grado I31% unità
Grado II16% unità
Grado I, II e III89% unità
Grado III42% unità
Grado IV11% unità
Grado I, II, III E IV100% unità
25/26
Elementi di Statistica IMaster in Neuropsicologia Clinica
Esempio 3 Neoplasia ni fi
Grado I 56 0,31 56 0,31
Grado II 28 0,16 84 0,47
Grado III 76 0,42 160 0,89
Grado IV 20 0,11 180 1,00
Totale 180 1,00
n = 180 → pari → due u.s.(n/2) = (90)(n/2 + 1) = (91)
Cerco u.s. ordinate (90) e (91) → x(90) = III x(91) = III
Oppure:Modalità i tale che min(Ni) ≥ 90Modalità i tale che min(Fi) ≥ 0,50
La mediana è Grado III
05 aprile 2008
Ni Fi
26/26