Upload
clemente-mancini
View
214
Download
3
Embed Size (px)
Citation preview
Lecco, 15 dic 2005 Francesco Ronzon1
Statistica
applicata all’analisi
microbiologica
Lecco, 15 dic 2005Francesco Ronzon2
Licenza
Tu sei libero:• di riprodurre, distribuire, comunicare al pubblico, esporre in pubblico, rappresentare, eseguire o recitare quest’opera• di creare opere derivate
alle condizioni citate in:http://creativecommons.org/licenses/by-nc-sa/2.5/
per informazioni contatta Francesco Ronzon
e.mail:
Questa presentazione è parte del progetto:
http://www.iperserver.it/mediawiki/
Lecco, 15 dic 2005Francesco Ronzon3
Obiettivo
“presentare statistica applicata all’analisi microbiologica con approccio pragmatico”
“chiarire aspetti relativi al corretto utilizzo di alcune tecniche statistiche e loro significato interpretativo”
Lecco, 15 dic 2005Francesco Ronzon4
Quadro generale
Perché la statistica? difficoltà intrinseche all’analisi microbiologica (fattori della variabilità)
alta variabilità = bassa qualità Con la Statistica voglio:
– Tenere sotto controllo variabilità– Valutare metodi– Avere una misura dell’errore delle mie affermazioni
(valutazione quantitativa dell’incertezza) Quale parte della statistica si applica nel laboratorio di
microbiologia?
Oggi
vedremo
Lecco, 15 dic 2005Francesco Ronzon5
Argomenti affrontati
Statistica descrittiva e inferenziale Concetti di base Distribuzioni statistiche Stime, Intervalli di confidenza, Test La variabilità nel campione microbiologico Test specifici del laboratorio microbiologico Esercizi pratici
Lecco, 15 dic 2005Francesco Ronzon6
Iniziamo…
S ta tis t ica d esc rit t iva S ta tis t ica in fe ren z ia le
S ta tis t ica
Lecco, 15 dic 2005Francesco Ronzon7
Quando entra in gioco la probabilità?
S ta tis t ica d esc rit t iva S ta tis t ica in fe ren z ia le
S ta tis t ica
Conosco tutto Conosco parte (campione)! Certezza Incertezza ?
Lecco, 15 dic 2005Francesco Ronzon8
Quadro argomenti
in d ic i d ip os iz ion e
(e s . m e d ia )
in d ic i d id isp ers ion e
(e s . va ria n za )
In d ic i G ra fic i
S ta tis t ica d esc ritt iva
S tim aP u n tu a le
In te rva lli d icon fid en za(e s . 9 5 % )
S tim a interva llare
S tim e
Tes t S p ec ific id i m ic ro b io lo g ia
Tes t d i s ig n ifica tività(e s . 5 % )
S ta tis t ica in fe ren z ia le
S ta tis t ica
Lecco, 15 dic 2005Francesco Ronzon9
Statistica descrittiva - Grafici
0
20
40
60
80
100
120
140
2001 2002 2003 2004
0
20
40
60
80
100
120
140
A20
0220
0320
0120
0220
030
5
10
15
20
2001 2002 2003
Lecco, 15 dic 2005Francesco Ronzon10
Istogramma
Es. Confronto conteggio tra operatori
0
50
100
150
200
250
Capsula I Capsula II Capsula III
UFC Operatore A
Operatore B
Resp. Sez.
Lecco, 15 dic 2005Francesco Ronzon11
Grafico a torta
% Conteggi accettabili operatore x
14%
86%
Conteggi risultati accettabili
Conteggi risultati non accettabili
Lecco, 15 dic 2005Francesco Ronzon12
Grafici da evitare
0
50
100
150
200
250
Istogramma 3D
Lecco, 15 dic 2005Francesco Ronzon13
Grafici da evitare
0
50
100
150
200
250
Linee 3D
Lecco, 15 dic 2005Francesco Ronzon14
Grafici da evitare
Torte 3D
Conteggi risultati accettabili Conteggi risultati non accettabili
Lecco, 15 dic 2005Francesco Ronzon15
Statistica descrittiva - Indici
In d ic i d i p os iz ion e(o te n d e n za ce n tra le )
In d ic i d i d isp ers ion e(va ria b ilità )
S ta tis t ica d esc ritt ivaIndici
Lecco, 15 dic 2005Francesco Ronzon16
Statistica descrittiva - Indici
Indici di Posizione(ordine di grandezza)
Media– Aritmetica– Quadratica
Quartili, percentili Moda Mediana
Indici di Dispersione(variabilità)
Valore max, min Campo di variazione Varianza Deviazione Standard Coefficiente di
variazione (CV)
Lecco, 15 dic 2005Francesco Ronzon17
Indici di posizione(misure di tendenza centrale)
Media: è il valore “medio” dei miei datiMediana: è il valore centrale dei miei dati
(dopo che li ho ordinati, dal più piccolo al più grande)
Moda: è la caratteristica o valore che si presenta più frequentemente
Lecco, 15 dic 2005Francesco Ronzon18
Indici di posizione
Media aritmetica
N
ii
N
xN
N
xxx
1
21
1
...
In Excel: MEDIA(dati)
Lecco, 15 dic 2005Francesco Ronzon19
Indici di posizione
Media quadratica
Esempio:
la ripetibilità di conteggio totale del laboratorio è la media quadratica delle ripetibilità dei singoli operatori.
N
x
N
xxx
N
ii
q
Nq
1
2
222
21 ...
Lecco, 15 dic 2005Francesco Ronzon20
Indici di posizione
Mediana
È il valore “x” che mi permette di dire che il 50% dei valori sono maggiori di “x” ed il 50% sono più minori.
1, 3, 5, 7, 18
3, 5, 7, 9
Mediana = 5
Mediana = 6In Excel: MEDIANA(dati)
Lecco, 15 dic 2005Francesco Ronzon21
Quartili e percentili
Una volta ordinati i dati: Con la mediana li divide in due gruppi: 50% e 50% Con i quartili li divido in 4 gruppi (da 25%) Con i percentili li divido in 100 gruppi (da 1%)
– Il 25° percentile viene chiamato primo quartile,– il 50° coincide con il secondo quartile ovvero con la mediana– il 75° percentile viene detto terzo quartile.
Lecco, 15 dic 2005Francesco Ronzon22
Indici di posizione
Moda
È il valore + frequente(il punto più alto nei grafici di frequenze)Utile per descrivere dati in categorie
Es. (8,3,8,9,2,4,3,8,8,4,2,8,5,2,8,8,2,6,8)
Moda=8 (Mediana=6, Media=5,58)
In Excel: MODA(dati)
Lecco, 15 dic 2005Francesco Ronzon23
Media, moda e mediana - esempio
Media, moda e mediana
0
1
2
3
4
5
6
7
8
9
10
Dati
Media
Moda
Mediana
Lecco, 15 dic 2005Francesco Ronzon24
ma… la “posizione” non basta
distribuzioni con stessa media e “variabilità” diverse
Lecco, 15 dic 2005Francesco Ronzon25
Indici di dispersione(misure di variabilità)
Valore max, min Campo di variazione = max–min (ingl. Range) Deviazione Standard Varianza Coefficiente di variazione (CV)
Lecco, 15 dic 2005Francesco Ronzon26
Deviazione standard (popolazione)
In Excel: DEV.ST.POP(dati)
N
iiNx
1
21
Lecco, 15 dic 2005Francesco Ronzon27
Deviazione standard (popolazione)
È espressa nella stessa unità di misura dei dati Detta anche:
– Scarto tipo (fr. Écart type) – Scarto quadratico medio– Standard Deviation
Da non confondere con Devianza o Errore Standard:
N
iiNx
1
21
2
1
2 Nidevianza
N
i
x
.2. StErrorestimaconfidenzaInterv
Lecco, 15 dic 2005Francesco Ronzon28
Deviazione Standard suoi effetti
= 2
=3 =4
Lecco, 15 dic 2005Francesco Ronzon29
Varianza (popolazione)
In Excel: VAR.POP(dati)
N
iiNx
1
22 1
È il quadrato della deviazione standard È la “media” dei quadrati delle deviazioni dalla
media
Lecco, 15 dic 2005Francesco Ronzon30
Coefficiente di Variazione (popolazione)
CV
Misura la dispersione percentuale in rapporto alla media
Lecco, 15 dic 2005Francesco Ronzon31
Coefficiente di Variazione (popolazione)
E’ un numero senza unità di misura, quindi consente di confrontare la variabilità di fenomeni con unità di misura diverse.
Uso tipico con numeri positivi e media non nulla detto anche Scarto tipo relativo (fr. Écart type relatif),
o Incertezza tipo relativa (e coefficient of variation).
CV
Lecco, 15 dic 2005Francesco Ronzon32
Coefficiente di Variazione (popolazione)
Spesso viene espresso in percentuale: si moltiplica per cento e si aggiunge il segno di “%”
ma attenzione a non fare errori in Excel: si scrive solo DEV.ST.POP(dati)/MEDIA(dati)*100 oppure DEV.ST.POP(dati)/MEDIA(dati) e si fa clic su:
mai entrambe le operazioni!
2/4 è il 50%, …e non 5000%
%100%
CV
Lecco, 15 dic 2005Francesco Ronzon33
Campo di variazione (ingl. Range)
Campo di Variazione = MAX – MIN
Non confondere con il CV=Coefficiente di variazione Non con con Range (ingl) con “rango” (e quindi con la
funzione RANGE(.) in Excel).
In Excel: MAX(dati)-MIN(dati)
Lecco, 15 dic 2005Francesco Ronzon34
Grafici Box-Plot
Utili per una visualizzazione grafica della posizione e dispersione, ma… non c’è definizione univoca, quindi…attenzione alla legenda!
0
20
40
60
80
100
120
140
160
180 Valore max.
III percentile
Mediana
I percentile
Valore min.
Lecco, 15 dic 2005Francesco Ronzon35
Riassumendo
la statistica descrittiva mi “riassume” i dati con pochi indici che mi descrivono la posizione (della curva) e dispersione (“larghezza”)
Lecco, 15 dic 2005 Francesco Ronzon36
Le distribuzioni statistiche
Poisson, Normale, Chi quadrato…
modelli matematici utili a descrivere popolazioni
Lecco, 15 dic 2005Francesco Ronzon37
Distribuzioni statistiche
Alle volte l'uso di modelli matematici mi permette di riassumere tutti i miei dati in pochi parametri (es. regressione, y=a+bx).
Lecco, 15 dic 2005Francesco Ronzon38
Distribuzioni in microbiologia
Poisson Binomiale Normale Chi quadrato t di Student
Lecco, 15 dic 2005Francesco Ronzon39
Distribuzione Poisson
Famiglia di distribuzioni al variare di >0
Lecco, 15 dic 2005Francesco Ronzon40
Distribuzione Poisson
Distribuzione discreta Media=Varianza= “senza memoria” In Microbiologia descrive
bene conta UFC
Lecco, 15 dic 2005Francesco Ronzon41
Distribuzione Binomiale
Famiglia di distribuzioni al variare di n e p
Lecco, 15 dic 2005Francesco Ronzon42
Distribuzione Binomiale
Media=np Media>Varianza=np(1-p) In Microbiologia descrive
bene conta con MPN
tuttavia se n, p0 Bi (.) Poisson(.)
Lecco, 15 dic 2005Francesco Ronzon43
Distribuzione Normale
Famiglia di distribuzioni al variare di e
Lecco, 15 dic 2005Francesco Ronzon44
Distribuzione Normale
2,5%
Lecco, 15 dic 2005Francesco Ronzon45
Distribuzione Normale
Media = Deviazione
Standard= indipendente da È frequente in
“natura” In microbiologia…
Lecco, 15 dic 2005Francesco Ronzon46
Distribuzione Normale
…(anche) in microbiologia si usa per approssimare altre distribuzioni:
Se >15 Poisson() N(, )
Se n>12 Binom(n,p) N(np,np(1-p))
Se n , p0 Binom(n,p) Poisson(=np) N(np,np)
e vale anche:Se k Chi Q. N(k,2k)Se k t di Student N(0,1)
)25.0,()( NXPoissonX
Lecco, 15 dic 2005Francesco Ronzon47
Distribuzione Normalestandardizzata
Lecco, 15 dic 2005Francesco Ronzon48
Distribuzione Chi Quadrato
Famiglia di distribuzioni al variare di k=g.d.l.
Lecco, 15 dic 2005Francesco Ronzon49
Distribuzione Chi Quadrato
Media=k Varianza=2k ed inoltre:
21
2 ~(0,1)~ ZNZ
Lecco, 15 dic 2005Francesco Ronzon50
Distribuzione t di Student
Famiglia di distribuzioni al variare di k=g.d.l.
Lecco, 15 dic 2005Francesco Ronzon51
Distribuzione t di Student
Media=0 Se k allora:
t di Student N(0,1)
Lecco, 15 dic 2005Francesco Ronzon52
Chi mi dà percentili delle distribuzioni?
Tavole Computer Excel InternetEs. http://faculty.vassar.edu/lowry/tabs.html
Programmi specificiEs. DistCal
Lecco, 15 dic 2005Francesco Ronzon53
Percentili Chi Quadrato con Excel
1 2 3 4 5 p= 5% 3.84 5.99 7.81 9.49 11.07 p= 1% 6.63 9.21 11.34 13.28 15.09
Percentili Chi Quadratogradi di libertà (k)
=INV.CHI(0,01;2)=9,21
9,21
=DISTRIB.CHI(9,21;2)=0,01
1%
Lecco, 15 dic 2005Francesco Ronzon54
Percentili della t di Student in Excel
DISTRIB.T(Z;gdl;1)
Es. =DISTRIB.T(1,96;99999;1)=0,25
INV.T(p;gdl)Es. =INV.T(0,05;9999)=1,96
DISTRIB.T(Z;gdl;2)
Es. =DISTRIB.T(1,96;99999;2)=0,5
- Z Z
2 Code
Lecco, 15 dic 2005Francesco Ronzon55
Percentili della Normale in Excel
DISTRIB.NORM(z;;;VERO)
Es. =DISTRIB.NORM(1,96;0;1;VERO)=0,975
INV.NORM(p;;)Es. =INV.NORM(0,95;0;1)=1,96
Lecco, 15 dic 2005Francesco Ronzon56
Probabilità della Poisson in Excel
P(X=c)=POISSON(c;;FALSO)P(Xc)=POISSON(c;;VERO)
P(X>c)=1- P(Xc) P(a < X b)=P(Xb)- P(Xa)
Esercizio: P(6< X21)=POISSON(21;12;VERO)-POISSON(6;12;VERO)=0,948
(verifica intervalli confid. al 95% per conteggio su capsula Petri con n=12)
Attenzione al limite Excel (x max 150)
Lecco, 15 dic 2005Francesco Ronzon57
dove siamo arrivati?
in d ic i d ip os iz ion e
(e s . m e d ia )
in d ic i d id isp ers ion e
(e s . va ria n za )
In d ic i G ra fic i
S ta tis t ica d esc ritt iva
S tim aP u n tu a le
In te rva lli d icon fid en za(e s . 9 5 % )
S tim a interva llare
S tim e
Tes t S p ec ific id i m ic ro b io lo g ia
Tes t d i s ig n ifica tività(e s . 5 % )
S ta tis t ica in fe ren z ia le
S ta tis t ica
Lecco, 15 dic 2005 Francesco Ronzon58
Statistica inferenziale
Ovvero, come descrivere la popolazione partendo da un campione
Lecco, 15 dic 2005Francesco Ronzon59
Statistica inferenziale
Quando: Non possiamo o non vogliamo misurare tutta la
popolazione Vogliamo comunque descriverla Vogliamo avere una stima degli indici visti fino
ad ora, ma entra in gioco l’Incertezza e quindi la probabilità:
Probabilità = 0 ... 1 = 0% …100%
Lecco, 15 dic 2005Francesco Ronzon60
Metodo induttivo/deduttivo
InferenzaStima di C’è sovra-
dispersione?Test Kp Test G2
Lecco, 15 dic 2005Francesco Ronzon61
Campione Microbiologico
inoculi da stessa “popolazione” non danno stesso UFC
Componenti incertezza: Distribuzione casuale (di Poisson) delle cellule microbiche
Lettura delle piastre (ripetibilità conteggio)* Volume totale inoculato (ripetibilità dosaggio) * Fattore di diluizione (ripetibilità dosaggio diluente) *
*tenuta sotto controllo con valutazione sperimentale della ripetibilità (performance operatori e laboratorio)
Lecco, 15 dic 2005Francesco Ronzon62
Stimatori degli “indici descrittivi”
Popolazione
media pop.
2 varianza pop.
Campione
media campionaria
s2 varianza campionaria
xInferenza
Lecco, 15 dic 2005Francesco Ronzon63
Indici campionari
Media campionaria Varianza campionaria Deviazione Standard campionaria CV = Coefficiente di variazione campionario
Lecco, 15 dic 2005Francesco Ronzon64
Simbologia (convenzioni)
Lettere greche per parametri popolazione– con il cappelletto le relative stime
Lettere latine MAIUSCOLE per variabili casuali Lettere latine minuscole per campione (x,u) Media campionaria con trattino sopra
Es.
),(ˆ
),(21
2
nin Nxx
NXSe
2ˆˆ
Lecco, 15 dic 2005Francesco Ronzon65
Media campionaria
In Excel: MEDIA(dati)
n
iixn
x1
1
Lecco, 15 dic 2005Francesco Ronzon66
Deviazione standard campionaria
In Excel: DEV.ST(dati) DEV.ST.POP(dati)
n
i
xxins
1
2
1
1
Lecco, 15 dic 2005Francesco Ronzon67
Varianza campionaria
In Excel: VAR(dati)
n
i
xxins
1
22
1
1
Lecco, 15 dic 2005Francesco Ronzon68
Coefficiente di Variazione
x
sCV
In Excel: DEV.ST(dati)/MEDIA(dati)
%100% x
sCV
Lecco, 15 dic 2005Francesco Ronzon69
Lo statistico trova e dimostra che…
Stimatore della “vera” media è
Stimatore della “vera” varianza è
n
iixn
x1
1
n
i
xxin 1
22
1
1
Lecco, 15 dic 2005Francesco Ronzon70
Come valuto uno stimatore: ?
Mediamente deve…“indovinarci”
Deve avere “variabilità media piccola”
Si dimostra che:22)( sE)(xE
min)( xV min)( 2 sV
)ˆ(E
min)ˆ( V
Lecco, 15 dic 2005Francesco Ronzon71
Lo stimatore mi dà un solo valore!… è sufficiente?
Se un marziano ci chiedesse quanto sono alti mediamente gli esseri umani, e noi gli rispondessimo: - «mediamente 155cm»egli potrebbe immaginare esseri umani alti 5cm ed altri alti 3 metri!.
Ci vuole un “intervallo di confidenza”!
Lecco, 15 dic 2005Francesco Ronzon72
Teorema del limite centrale
La media campionaria di un campione si distribuisce come una normale con
media pari alla media della popolazione varianza pari a varianza popolazione su n=V(X)/n
),(ˆ
),(21
2
nin Nxxallora
DistribXse
Lecco, 15 dic 2005Francesco Ronzon73
Distribuzione uniformedecisamente diversa dallanormale! (grande )!
La distribuzione delle medie campionarie (distribuzione campionaria) da una distribuzione non normale dopo anche pochi campioni diventa normale con piccola dispersione!
TENDENZA VERO IL LIMITE CENTRALE
Intervallo
Teorema del limite centrale
Lecco, 15 dic 2005Francesco Ronzon74
Tlc e Intervalli di confidenza
Posso sempre costruire intervalli di confidenza sfruttando il TLC
StandardErrorex
xn
2ˆ
2ˆ ˆ
Lecco, 15 dic 2005Francesco Ronzon75
Tlc e Poisson (conteggi con c>15)
Nella Poisson media=varianza, quindi sfruttando il TLC
cc
cc
cc
nse
4,1
2
22
2
Es. Conta singola (n=1) con c=25 Risultato = 252*5 = 2510
Es. Conta doppia con c=18,32 Risultato = 251,4*5= 257
n
cc
cxnc
n
2
22 ˆ
ccnse 21
Lecco, 15 dic 2005Francesco Ronzon76
Intervalli di confidenza nella Poisson
si applica il TLC (e le tavole se a disposizione)
si guardano le tavole (ISO 7218) con intervalli di confidenza già calcolati.
ErrStc 215c
15c
Calcolo e verifica intervalli della
Poisson in Excel
Lecco, 15 dic 2005Francesco Ronzon77
Intervalli di confidenza al 95%
Metodo statistico che mi permette di costruire, a partire dai dati sperimentali, un intervallo di valori plausibili.
Se applicato a 100 analisi diverse, 95 intervalli (circa) conterranno il “vero” valore, ma 5 no!
…insomma, ci azzecca il 95% delle volte.
Lecco, 15 dic 2005Francesco Ronzon78
Intervalli di confidenzacorretta interpretazione
L’intervallo di confidenza del n° di batteri di un alimento risultano, nel nostro laboratorio, fuori legge. Prima di provvedere al sequestro un magistrato ci chiede:
“quale è la probabilità che le analisi siano giuste?”.
“Sig. Magistrato: il mio laboratorio stima, diciamo, 10000 intervalli di confidenza all’anno; 9500 sono giusti, ma 500 completamente errati. Ora, non so dirle se questo intervallo che le ho dato è esatto oppure no”.
Lecco, 15 dic 2005Francesco Ronzon79
Poisson?
Ma…sicuri che possiamo applicare ai nostri dati il modello matematico/statistico di Poisson (o la sua approssimazione alla normale?
Sì se: i microrganismi sono distribuiti in modo
casuale (non uniforme, né a gruppi) Se non ho SOVRADISPERSIONE
Lecco, 15 dic 2005Francesco Ronzon80
Poisson?
La Poisson prevede che i micro-organismi siano distribuiti in modo casuale
0
1
2
3
4
5
6
7
8
9
10
0 1 2 3 4 5 6 7 8 9 10
2
Lecco, 15 dic 2005Francesco Ronzon81
Sovradispersione nella Poisson
Accade quando conteggi mostrano una varianza maggiore della media (quindi una varianza troppo grande).Se Varianza>Media SovradispersioneSe Varianza<Media SottodispersioneSe Varianza=Media OK, distribuzione casuale
2 2 2
Lecco, 15 dic 2005Francesco Ronzon82
Come valuto la sovradispersione?
Con un Test statistico:
Test Kp
Test G2
Si distribuiscono entrambi come una Chi-quadratoNon c’è sovradispersione se il test da “valori piccoli (rifiuto per valori grandi).
Lecco, 15 dic 2005Francesco Ronzon83
Test di verifica d’Ipotesi
Un test mi aiuta a prendere una decisione.
…un po' come un giudice in un processo. L'incertezza implica la possibilità di fare due tipi di errore:
assolve condannaè veramente innocente OK Errore Iha veramento ucciso Errore II OK
Decisione giudice
Ogni decisione su una certa ipotesi (es. colpevole o innocente) implica due tipi di errori (che spesso non riteniamo di pari gravità).
Se qualcuno ci desse una procedura per decidere che tuttavia mi consenta di conoscere la probabilità di uno solo dei due errori: quale errore sceglierei di poter tenere sotto controllo?
Definiamo allora “Errore di I tipo” quell'errore (generalmente è il + grave, ma non è detto). L'ipotesi relativa è detta: Ipotesi nulla: H0
Lecco, 15 dic 2005Francesco Ronzon84
Test di livello di significatività =5%
assolve condanna
è veramente innocente OK Errore I
ha veramento ucciso Errore II OK
Decisione giudice
Definiamo con la probabilità dell’errore di I tipo. Questo valore, detto livello di significatività di un test per H0=innocente
=P(rifiutare Ipotesi nulla: H0 quando essa è “vera”)
non si possono diminuire entrambi gli errori…
Prima di fare un test si decide il valore di =0,05 (5%), =0,01 (1%)
varia a seconda dei contesti (vedi es. casa farmaceutica)
accetto Ho rifiuto Ho
in realtà è vera Ho OK Errore I
in realtà non è vera Ho Errore II OK
Decisione giudice
Lecco, 15 dic 2005Francesco Ronzon85
Test di verifica dell’Ipotesisignificato interpretativo
Un Test accetta o rifiuta H0, non dimostra mai che è H0 vera o falsa.
H1 è corroborata (sostenuta) o meno dai dati, mai accettata o rifiutata e tanto “vera” o “falsa”
Si dice “test di significatività al 5%”, ma …ho due tipi di errore… (ma abbiamo deciso di costruire il test per Ho, che vogliamo tenere “sotto controllo”).
= 5% = P(rifiutare H0 quando H0 è vera)=P(err I° tipo)
=P(accettare H0 quando H0 non è vera)=P(err. II° tipo)
Lecco, 15 dic 2005Francesco Ronzon86
Test di verifica dell’Ipotesipraticamente…
Il test è una formula che mi danno gli statistici (+/- complessa e con +/- senza senso logico/intuitivo)
premesso che ai dati si possa applicare certi modelli matematici, gli statistici mi dicono che: se l’ipotesi H0 è vera, il test deve assumere certi
valori (regione di accettazione) con una certa prob. se H0 è falsa deve assumerne altri (regione di rifiuto).
Ergo: calcolo il test con i miei dati e …decido!.
Lecco, 15 dic 2005Francesco Ronzon87
Test G2 (per valutare sovradispersione)
Gli statistici mi dicono di calcolare l’espressione:
e mi dicono che “sotto” H0 allora: se G2 < 3,84 accetto H0
se G2 > 3,84 rifiuto H0
Con H0= ipotesi di assenza di sovradispersione
Lecco, 15 dic 2005Francesco Ronzon88
Test che misurano la bontà di adattamento: G2 Chi2 di Pearson = Kp
Sono test “goodness of fit to a distribution” che valutano quanto i dati concordano con modello
facile ed intuitivo è il
H0= il modello si adatta
Se (foss fatt) allora Chi2 0 accetto H0
Rifiuto per valori grandi
att
attoss
fffPearsondiTest
2)(2
Lecco, 15 dic 2005Francesco Ronzon89
Test che misurano la bontà di adattamento: G2 Chi2 di Pearson = Kp
Chi2 è approssimazione di G2
H0= il modello si adatta ed entrambe
Se (foss fatt) allora G2 0 accetto H0
Rifiuto per valori grandi
Lecco, 15 dic 2005Francesco Ronzon90
Test Kp ?
Il test Kp è sempre un test di bontà di adattamento (la formula che si utilizza in laboratorio di micro- biologia è Kp anziché Kp)2 che va confrontato con la Chi quadrato con 1 grado di libertà.(si rifiuta per valori alti)
2)()(
)(2)(2
22)(2
1
22
222
22
)()()(
2
22
2
22
2
22
2
)()(
,
pbaba
baba
ba
babbaaba
bafff
baatteseosservate
K
abba
fbaf
ba
ba
ba
ba
att
attoss
Lecco, 15 dic 2005Francesco Ronzon91
Test di verifica dell’Ipotesi – Valore p
Quando comunico l’esito di un test ad altri: dico solo significativo/non significativo (accetto/rifiuto) o posso dire di più?
meglio riportare il:valore p= livello di significatività osservato
ovvero: il più alto valore di che mi farebbe rifiutare H0
Se p<0,01 rifiuto H0 Se 0,01<p<0,05 si tende a rifiutare p>0,05 accetto H0
E’ un indicatore della plausibilità dell’ipotesi H0
Lecco, 15 dic 2005 Francesco Ronzon92
Amen