17
1 Unità 9 Frequenze osservate e frequenze teoriche Test del Tabelle di contingenza 2

Unità 9

Embed Size (px)

DESCRIPTION

Unità 9. Frequenze osservate e frequenze teoriche Test del Tabelle di contingenza. FREQUENZE OSSERVATE E FREQUENZE TEORICHE - PowerPoint PPT Presentation

Citation preview

Page 1: Unità  9

1

Unità 9

Frequenze osservate e frequenze teoriche

Test del

Tabelle di contingenza

2

Page 2: Unità  9

2

FREQUENZE OSSERVATE E FREQUENZE TEORICHE

Spesso in medicina è necessario verificare se vi sia una differenza significativa tra due o più categorie di esiti di trattamenti, ciascuna espressa dal numero (frequenza)(frequenza) degli esiti stessi.

Come abbiamo già detto, i risultati ottenuti nei campioni non sempre concordano esattamente con i risultati teorici attesi secondo le regole di probabilità.

Per esempio, benché considerazioni teoriche ci portino ad attenderci 50 teste e 50 croci da 100 lanci di una moneta non truccata, è raro che questi risultati siano ottenuti esattamente.

Page 3: Unità  9

3

DEFINIZIONE DI (CHI-QUADRATO)

Una misura della discrepanza esistente tra le frequenze osservate e quelle teoriche è fornita dalla statistica . La formula generale per il calcolo del è data da

dove k è il numero di possibile eventi, mentre Oj ed Ej sono le corrispondenti frequenze osservate e teoriche (o attese).

È ovvio che se la frequenza totale è N si ha .

Se le frequenze teoriche possono essere calcolate senza Se le frequenze teoriche possono essere calcolate senza dovere stimare parametri della popolazione per mezzo delle dovere stimare parametri della popolazione per mezzo delle statistiche campionarie, il numero statistiche campionarie, il numero νν dei gradi di libertà è dato dei gradi di libertà è dato da da νν = k–1. = k–1.

2

22

k

j j

jj

E

EO

1

22 )(

NEOk

jj

k

jj

11

Page 4: Unità  9

4

TEST PER L’ANALISI DELLE TABELLE DI CONTINGENZA2

Per illustrare il test può essere utile fare riferimento ad un esempio. Il passaggio al caso generale è banale.

Si pensi di considerare 3 trattamenti (A, B e C) con 3 categorie di esiti ciascuno (I, II e III).

I risultati ottenuti possono essere riassunti in una tabella simile alla Tabella 1 in cui a1 rappresenta il numero (frequenza) di individui che, sottoposti al trattamento A, hanno avuto esito I, b1 il numero di individui che sottoposti a B hanno anche essi avuto esito I, e così via.

Tale rappresentazione sintetica prende il nome di tabella di tabella di contingenzacontingenza.

Page 5: Unità  9

5

hi (i = 1, 2, 3) rappresenta il numero di pazienti che globalmente ha avuto esito i (hi = ai + bi + ci), mentre nj (j = a, b, c) rappresenta il numero di pazienti che globalmente è stato sottoposto al trattamento j (nj = j1 + j2 + j3).

Infine T rappresenta il numero totale degli individui osservati.

Page 6: Unità  9

6

CALCOLO:

Il test su questa tabella può essere descritto nei seguenti punti:

a. si calcola per ogni trattamento (riga) la somma dei quadrati delle frequenze, divise per il proprio totale di colonna:

3

23

2

22

1

21

3

23

2

22

1

21

3

23

2

22

1

21

h

c

h

c

h

cN

h

b

h

b

h

bN

h

a

h

a

h

aN

c

b

a

Page 7: Unità  9

7

b. si dividono i valori ottenuti per il rispettivo totale di riga e si sommano i risultati ottenuti:

c. al valore Z si toglie 1 e quindi si moltiplica per il numero totale di osservazioni:

d. fissato il livello α di significatività, si va nella tabella del chi-quadrato con (t – 1)∙(c – 1) gradi di libertà dove t è il numero di trattamenti e c il numero delle categorie di esiti [(3–1)·(3–1) = 4 nel caso considerato].

e. se il valore ottenuto è superiore a quello tabulare allora la differenza è significativa con p < α.

c

c

b

b

a

a

n

N

n

N

n

NZ

TZ )1(2

Page 8: Unità  9

8

Per comodità di consultazione si riporta di nuovo a lato la

Tabella dei valori critici per la distribuzione del chi-quadrato.

ν indica il numero di

gradi di libertà.

Page 9: Unità  9

9

Esercizio 1

I dati nella tabella sotto derivano da uno studio su individui affetti da tumori cerebrali, classificati per tipo di tumore e sede.

Si stabilisca se il tipo di tumore è indipendente dalla sede con α = 5%.

Risposta

Applicando il test ai dati in tabella si ottiene = 7,844.

I gradi di libertà sono (3 – 1)x(3 – 1) = 4.

Si consulti ora la tabella dei valori critici del in corrispondenza a 4 gradi di libertà.

2

2 2

Page 10: Unità  9

10

Il valore di = 7,844 ottenuto è maggiore di quello corrispondente a p = 0,10.Esso è tuttavia minore di quello corrispondente a p = 0,05.

2

Avendo fissato α = 0,05, non è quindi possibile rifiutare l’ipotesi nulla che “il tipo di tumore è indipendente dalla sede”; ovvero con i dati a disposizione non è possibile concludere che “il tipo di tumore dipende dalla sede”.

Il valore esatto di p calcolato dal test è pari a 0,097.

Page 11: Unità  9

11

TABELLA 2 x 2

Nel caso t = 2 e c = 2 la tabulazione assume la configurazione 2 x 2 con 1 grado di libertà (tabella 2 x 2).

In questo caso particolare la formula per il calcolo del chi-quadrato diventa semplicemente:

Tale espressione tende però a dare risultati viziati, nel senso che porta ad affermare l’efficacia di un trattamento anche quando i dati non lo confermano.

21

212212 )(

hhnn

Tbaba

ba

Page 12: Unità  9

12

Per questo motivo per le tabelle 2 x 2, particolarmente quando i valori delle frequenze in tabella sono piccoli, è stato proposto di utilizzare la correzione di Yatescorrezione di Yates (o correzione per la continuitàcorrezione per la continuità) nel calcolo del valore del chi-quadrato.

La correzione consiste nel modificare la formula come segue:

Bisogna stare attenti al fatto che per campioni poco numerosi il test del chi-quadrato è poco accurato anche se si impiega la correzione di Yates.

21

21221

2)

2

1(

hhnn

TTbaba

ba

Page 13: Unità  9

13

Esercizio 2

In un esperimento sulla efficacia della vaccinazione antipoliomielitica, un gruppo di 244 conviventi di malati di poliomielite è stato sottoposto a vaccinazione, mentre un altro gruppo di 233 conviventi di malati di poliomielite non è stato vaccinato.

Nel gruppo dei non vaccinati si sono avuti 8 casi di poliomielite (3,43%), mentre fra i vaccinati si è avuto un solo caso (0,41%).

La differenza parla a favore del vaccino, ma possiamo considerarla significativa con α = 0,05?

Risposta

Si organizzino i dati in tabella.

Si calcoli ora il valore del ,impiegando le formule precedentemente discusse.

I valori che si ottengono sono 5,886 e 4,366, rispettivamente senza e con la correzione di Yates.

2

Page 14: Unità  9

14

Si consulti ora la tabella dei valori critici del in corrispondenza a 1 grado di libertà.

Il valore critico corrispondente ad α = 0,05 è 3,8415.

2

Sia il valore di corretto sia (a maggior ragione) quello non corretto superano il valore critico.

Avendo fissato α = 0,05, è quindi possibile rifiutare l’ipotesi nulla che “i casi di poliomielite sono indipendenti dalla vaccinazione”, ovvero le differenze osservate fra vaccinati e non vaccinati sono significative.

Il problema può essere ovviamente risolto anche utilizzando un pacchetto di software statistico, quale, ad esempio, GraphPad. I risultati così ottenuti sono mostrati di seguito.

2

Page 15: Unità  9

15

Page 16: Unità  9

16

Page 17: Unità  9

17