26
Il test del Chi- quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Embed Size (px)

Citation preview

Page 1: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Il test del Chi-quadrato

Prof.ssa Montomoli - Univ. di PaviaProf.ssa Zanolin – Univ. di Verona

Page 2: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Il rischio di contrarre epatite C è associato all’avere un tatuaggio?

Test d’ipotesi

Cosa vuol dire ASSOCIAZIONE tra due variabili?

Page 3: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Due variabili sono associate soltanto quando sono correlate tra loro in modo maggiore o minore di quanto si verifichi per

solo effetto del caso

I tatuaggi devono essere presenti con frequenza maggiore (o minore) nei soggetti con epatite C rispetto ai soggetti senza epatite

quindi è necessario studiare anche soggetti senza epatite (controlli)

poi confrontarli con i soggetti con epatite

… ed infine decidere se la differenza tra gruppi può essere dovuta al caso

CON UN TEST STATISTICO

Page 4: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Se è vero che il caso può influenzare i risultati, come posso dimostrare l'esistenza di associazioni ed essere

ragionevolmente sicuro che le differenze osservate non sono dovute al caso?

La statistica consente di escludere (con un certo grado di probabilità, ma mai con assoluta certezza) che una eventuale

associazione sia dovuta appunto al caso

Page 5: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona
Page 6: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Il rischio di contrarre epatite C è associato all’avere un tatuaggio?

I dati sono riassunti nella tabella di contingenza

Test d’ipotesi

Epatite C

Si No totale

Tatuaggio 25 88 113

No tatuaggio 22 491 513

totale 47 579 626

Page 7: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

0

5

10

15

20

25

No tatuaggio Tatuaggio

Proporzione di soggetti con epatite

Page 8: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

   

Test d’ipotesi

Supponi che, in realtà, NON esistano differenze nella frequenza di epatite tra i tatuati e i non tatuati.

Che probabilità c'è di osservare - in uno studio di dimensioni simili a questo - differenze nella frequenza di epatite diverse da quelle che hai

osservato?

La risposta a questa domanda dipende da quanto i dati ottenuti si discostano dai dati che

«sarebbe lecito attendersi se la frequenza di epatite C fosse influenzata soltanto dalla variazione casuale».

Page 9: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

   

TEST D’INDIPENDENZA

Le due variabili (epatite e tatuaggio) sono indipendenti?

Questa è l’IPOTESI NULLA H0 da verificare

Se H0 è rifiutata: le due variabili

NON SONO INDIPENDENTI

Test d’ipotesi

Page 10: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

1.Si distribuiscono i soggetti nelle celle della tabella

2.Si calcolano le frequenze attese sotto l’H0 che le due variabili siano indipendenti (per ogni cella della tabella)3.Si paragonano le frequenze attese e le frequenze osservate4.Si valuta la discrepanza fra frequenze ATTESE e OSSERVATE Come decidere se la discrepanza è piccola o

grande? tramite il TEST STATISTICO

Test d’ipotesi

Page 11: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

P (epatite) =

P(epatite |tatuaggio) =

P(epatite |no tatoo) =

5.8626

47113

075.0626

47

Test d’ipotesi

5.38626

47513

Epatite C

Si No totale

Tatuaggio 113

No tatuaggio 513

totale 47 579 626

8.5

38.5

104.5

474.5

Page 12: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

PRINCIPIO del PRODOTTOper eventi indipendenti

P(A e B) = P(A B) = P(A)P(B)

Indipendenza: due eventi si diconoindipendenti quando il verificarsidell’uno non influenza il verificarsidell’altro

es. elevati livelli di glicemia e ulcera,probabilità di pescare una pallina di undeterminato colore da un’urna conreimbussolamento

Page 13: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

n11 ni1 nk1

n1j nij nkj

n1t nit nkt

1

.

.

j

.

t

1…………………i……………k

Y

X

k

iijj nn

1

.

Marginali di riga

t

jiji nn

1

.

k

i

t

jijnn

1 1

..Marginali di colonna

Nomenclatura di una tabella di contingenza(dot notation)

pi. viene stimato da ni./n..

p.j viene stimato da n.j/n..

Page 14: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Pij=Pi.·P.j

Sotto l’ipotesi di indipendenza la probabilità di una qualsiasi combinazione delle modalità delle due

variabili è data da:

Probabilità congiunta

Prodotto delle marginali

Eij=Pi.·P.j·N

Gli attesi nella cella ij-ma, sotto l’ipotesi di indipendenza, saranno quindi

Probabilità congiunta

Prodotto delle marginali

N° totale di soggetti

Page 15: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

CALCOLO DEL TEST 2

N

i i

ii

E

EO

1

22 )(

frequenza attesafrequenza osservata

Test d’ipotesi

Page 16: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

FREQUENZE ATTESE

FREQUENZE OSSERVATETest d’ipotesi

Epatite C

Si No totale

Tatuaggio 25 88 113

No tatuaggio 22 491 513

totale 47 579 626

Epatite C

Si No totale

Tatuaggio 8.5 104.5 113

No tatuaggio 38.5 474.5 513

totale 47 579 626

Page 17: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

42.425.474

)5.474491(

5.104

)5.10488(

5.38

)5.3822(.

5.8

)5.825( 2222

2

Si calcola il test sostituendo le frequenze osservate ed attese nella formula del 2:

Test d’ipotesi

È evidente che il chi-quadrato aumenta con l'aumentare della differenza dei dati posti a raffronto.

Se esso supera certi valori prefissati la differenza viene ritenuta significativa; in caso contrario, non si può

affermare l'esistenza di una significativa differenza tra i due eventi considerati.

Page 18: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

0 2 4 6 8 10 12 14chi-quadrato

den

sità

di

pro

bab

ilit

à

1 g.l.

2 g.l.

5 g.l.10 g.l.

15 g.l.

g.l. = gradi di libertà

La distribuzione di probabilità 2 dipende dal numero di gradi di libertà (g.l.)

il numero di gradi di libertà di una tabella e del 2 calcolato su di essa è

uguale a

(numero righe - 1) x (numero colonne -1)

Page 19: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona
Page 20: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

0 1 2 3 4 5 6

chi-quadrato

den

sità

di p

rob

abili

1 grado di libertà

regione di accettazione dell'ipotesi nulla regione di rifiuto

0,118

2 osservato > soglia critica42,42 3,84

Rifiuto H0

N.B. Il test del chi-quadrato è sempre a una coda.

Page 21: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Output di un programma statistico

Test d’ipotesi

| col row | 1 2 | Total-----------+----------------------+---------- 1 | 25 88 | 113 2 | 22 491 | 513 -----------+----------------------+---------- Total | 47 579 | 626

Pearson chi2(1) = 42.4189 Pr = 0.000

Page 22: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

P < 0.00001

Rifiuto l’ipotesi nulla di indipendenza delle due variabili

CONCLUSIONI

i dati della tabella sono improbabili, se è vera l’ipotesi che epatite C e tatuaggi sono indipendenti

esiste una relazione tra epatite C e tatuaggi

Test d’ipotesi

Page 23: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Situazione reale

Conclusioni

Epatite e tatuaggi sono indipendenti

H0 VERA

Epatite e tatuaggi NON sono indipendenti

H0 FALSA

Epatite e tatuaggi sono indipendenti

RIFIUTO H0

aerrore di I tipo OK

Epatite e tatuaggi NON sono indipendenti

NON RIFIUTO H0 OK

berrore di II tipo

Test d’ipotesi

Page 24: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

0 1

Ala Ala/CentroCentro GuardiaGuardia/Ala Play/Guardia

Playmaker

Graphs by straniero

italiani stranieri

Ruolo per nazionalità

Esiste una differente distribuzione del ruolo di gioco tra italiani e stranieri?

Test d’ipotesi

Page 25: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Ruolo per nazionalità | straniero ruolo | 0 1 | Total-------------+----------------------+---------- Ala | 37 29 | 66 Ala/Centro | 14 14 | 28 Centro | 15 16 | 31 Guardia | 21 17 | 38 Guardia/Ala | 4 6 | 10 Play/Guardia | 8 9 | 17 Playmaker | 34 13 | 47 -------------+----------------------+---------- Total | 133 104 | 237

Pearson chi2(6) = 7.8336 Pr = 0.251

Le due variabili (ruolo e nazionalità) sono indipendenti.

La distribuzione del ruolo non è diversa per nazionalità

Test d’ipotesi

Page 26: Il test del Chi-quadrato Prof.ssa Montomoli - Univ. di Pavia Prof.ssa Zanolin – Univ. di Verona

Ipotesi: i giocatori stranieri vengono acquistatiper ricoprire il ruolo di centro

| straniero ruolo | 0 1 | Total-------------+----------------------+---------- Centro | 15 16 | 31 Playmaker | 34 13 | 47 -------------+----------------------+---------- Total | 49 29 | 78

Pearson chi2(1) = 4.5887 Pr = 0.032

Le due variabili (ruolo e nazionalità) non sono indipendenti.

Test d’ipotesi