Contrast khi-quadrat contrast d ... - 84.89.132.1

Preview:

Citation preview

Estadística Ciència Política, Albert Satorra

Contrast khi-quadrat +

contrast d’independència en una taula de contingència

Estadística Ciència Política, Albert Satorra

Està trucat aquest dau ???

Cara: 1 2 3 4 5 6 Total

freqüència 17 18 24 26 21 14 120

H0 : p1 = p2 = p3 = p4 = p5 = p6 = 1/6

Freqüència esperada = 20

Juguem un dau 120 vegades, i sospitem que està trucat

Estadística Ciència Política, Albert Satorra

n = 120

p1 =….= p6 = 1/6 (H0)

n1 …n6 - freqüències observades

np1= … = np6 = 20 – freqüències esperades

Graus de llibertat = # opcions possibles -1 = 6 -1 = 5

~ χ52

Estadística Ciència Política, Albert Satorra

Estadístic khi-quadrat

T = sumij (Oij - Eij )2 /Eij

Estadística Ciència Política, Albert Satorra

x=c(17,18,24,26,21,14) chisq.test(x) Chi-squared test for given probabilities data: x X-squared = 5.1, df = 5, p-value = 0.4038

Estadística Ciència Política, Albert Satorra

Exercici a Classe: En un sondatge electoral ( CIS, El PAÍS, 18 febrer de 2006) es troben els següents resultats Enquesta Gener 2006:

Partit A (PSOE): p = .396 Partit B (PP ) : p = .380 n = 2484 entrevistes Resultats Oct 2003: PSOE 42.4 % / PP 34.7% Hipòtesis a contrastar: 1) H0: pA = 0.424 a la població diferencia: d= 0.396 - 0.424

Estadística Ciència Política, Albert Satorra

error tipus = sqrt((0.424*(1-0.424)/2484))= 0.009915586

estadístic del contrast z = d/error tipus = -2.823837 p-valor = 0.004745248 > 5 % ---> Un altre procediment Taula Observats 984 1500 Esperats 1053.2 1430.7 T = (984-1053.21)^2/1054 + (1500-1430.7)^2 /1430.7 = 7.901356 (observem que (-2.823837)^2 = 7.974057)

Estadística Ciència Política, Albert Satorra

contrasts addicionals

2) H0 pB = 34.7 3) H0: pA = pB a la població SI NO PSOE 984 1500 PP 944 1540 chisq.test(matrix(c(984, 1500, 944, 1540), 2, 2), correct = F) Pearson's Chi-squared test data: matrix(c(984, 1500, 944, 1540), 2, 2) X-squared = 1.3562, df = 1, p-value = 0.2442 > test=chisq.test(matrix(c(984, 1500, 944, 1540), 2, 2), correct = F) > test$observed [,1] [,2] [1,] 984 944 [2,] 1500 1540 > test$expected [,1] [,2] [1,] 964 964 [2,] 1520 1520 > test$residuals [,1] [,2] [1,] 0.6441566 -0.6441566 [2,] -0.5129892 0.5129892 >

Estadística Ciència Política, Albert Satorra

Exemple,

135 voten SI, 165 voten NO, contrasteu si la probabilitat de votar SI és del 50%

Total

Observat 135 165 300 Esperat sota H0: 150 150 300

Contrast z=(135/300 -0.5)/sqrt(0.5^2/300 )

Contrast khi-quadrat

chi=((135-150)^2 + (165-150)^2 )/150

3 = z^2 = chi2

O amb la funció de R: x=c(135,165); chisq.test(x) Chi-squared test for given probabilities data: x X-squared = 3, df = 1, p-value = 0.08326

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

La media y la desviación típica aumentan con los grados de

libertad observado

Valor P

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

En general, si volem contrastar H0: pi = .40, aleshores: x = c(35,65) pi = c(.4, .6) chisq.test(x,p = pi) Chi-squared test for given probabilities data: x X-squared = 1.0417, df = 1, p-value = 0.3074

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

Contrast de independència

Taules de contingència

Estadística Ciència Política, Albert Satorra

Exemple gènere – identificació de partit

GSS.sav

{ Homes, Dones } {Democrates, Independents, Republicans }

Taula de contingència: 2 X 3

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

Valors observats

Democratas Indep Republicanos Total Hombres 276 73 279 628 Mujeres 415 114 317 846 Total 691 187 596 1474

Valors esperats

Democratas Indep Republicanos Total Hombres 294 80 254 628 Mujeres 397 107 342 846 Total 691 187 596 1474

294= (691*628)/1474

Estadística Ciència Política, Albert Satorra

Democrats Indep Republicans

Homes 1,150 0,559 2,476

Dones 0,854 0,415 1,838

Khi-quadrat gl 2 = 7,291 > 5,99

Valor P = 0,026 < 0,05 Rebutjem H0

χ2 con (#columnes -1)(#file – 1) graus de llibertat

Estadística Ciència Política, Albert Satorra

HI HA RELACIO ENTRE SIGNES DE ZODIAC I FELICITAT ?

(Hipòtesi nul.la H0: Independència (no associació) entre signes zodíac i felicitat)

(el professor d’Estadística defensa H0 !. En aquestes dades hi ha evidència contra H0 ?. Empra α = 5%)

GET

FILE='G:\Albert\Web\Metodes2005\Dades\GSS.SAV'.

CROSSTABS

/TABLES=zodiac BY happy

/FORMAT= AVALUE TABLES

/STATISTIC=CHISQ

/CELLS= COUNT .

Veiem que NO es rebutja la hipòtesi nul.la de independència Entre files i columnes (no associació entre signes

del zodíac i felicitat).

Estadística Ciència Política, Albert Satorra

Font de les dades: Dades d’enquesta del treball de l’assignatura d’Estadística realitzat per 4 alumnes

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

Example in Moore p. 534-537

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

Estadística Ciència Política, Albert Satorra

Exercicis

Moore:

6.43 p. 469 (igualtat de mitjanes)

7.22 p. 518 (igualtat de proporcions)

8.13 p. 557 (khi-quadrat)

Estadística Ciència Política, Albert Satorra

Contrast z: sobre igualtat de proporcions

Estadística Ciència Política, Albert Satorra

Forma del contrast

H0: π1 = π2

H1: π1 ≠ π2

Població 1 – mostra1 –> p1 ~ N(π1, )

Població 2 – mostra2 –> p2 ~ N(π2, )

p1 - p2 aprox. Normal, mitjana π1 - π2

y desviació típica

aprox. normal

Estadística Ciència Política, Albert Satorra

Forma del contrast

Estandarditzem

Com que π1 = π2

= =

Estadística Ciència Política, Albert Satorra

Proves de significació

Un estimador de π és:

L’estadístic z és

~ aprox. N(0,1), sota H0

Estadística Ciència Política, Albert Satorra

Catalunya Galicia Numero votos NO 50 70 Mida de mostra 250 300

Catalunya Galicia

proporción NO 0,200 0,233

Estadística Ciència Política, Albert Satorra

p= (50 +70)/(250+300)=0,218

α = 5% Valor P = 0,3472 > 0,05

Estadística Ciència Política, Albert Satorra

x=matrix(c(50, 70, 250-50, 300 )

També ho podem resoldre amb contrast khi-quadrat de independència:

Taula de Contingència

Observats:

Catalunya Galicia

NO 50 70 120 SI 200 230 430 250 300 550

Esperats (sota independència: π1 = π2 ) 250*120/550=54.54545 300*120/550= 65.45455

250*430/550 = 195.4545 300*430/550 = 234.5455

(Observats – Esperats)2 /Esperats

0.3779171 0.3156559 0.1057104 0.08809195

Suma = chi2 = 0.88 (valor p = 0.3461895) (noteu que z = -.94 al quadrat = 0.88)

Ho