33
Pruebas de Pruebas de significancia para significancia para datos cualitativos datos cualitativos Chi cuadrado Chi cuadrado

Pruebas de significancia para datos cualitativos Chi cuadrado

Embed Size (px)

Citation preview

Page 1: Pruebas de significancia para datos cualitativos Chi cuadrado

Pruebas de significancia Pruebas de significancia para datos cualitativospara datos cualitativos

Chi cuadradoChi cuadrado

Page 2: Pruebas de significancia para datos cualitativos Chi cuadrado

¿ z, t y r son todos calculados de datos ¿ z, t y r son todos calculados de datos cualitativos o cuantitativos?cualitativos o cuantitativos?

Cuantitativos.Cuantitativos. ΧΧ es la letra griega chi que se usa para es la letra griega chi que se usa para

representar las puebas de chi cuadrado representar las puebas de chi cuadrado que se simboliza por que se simboliza por ΧΧ22..

Estas pruebas dependen de f al igual que Estas pruebas dependen de f al igual que en las pruebas de t.en las pruebas de t.

Donde recordemos que f representa el Donde recordemos que f representa el número de grados de libertad.número de grados de libertad.

Page 3: Pruebas de significancia para datos cualitativos Chi cuadrado

Los datos cualitativos son Los datos cualitativos son usualmente contados en grupos usualmente contados en grupos

o categoríaso categorías

Un ejemplo son los grupos Un ejemplo son los grupos sanguíneos.sanguíneos.

La hipótesis de nulidad dice que La hipótesis de nulidad dice que cualquier variación entre el número cualquier variación entre el número observado en el grupo y lo que observado en el grupo y lo que usted espera encontrar se debe usted espera encontrar se debe a________a________

La casualidadLa casualidad

Page 4: Pruebas de significancia para datos cualitativos Chi cuadrado

Si hay una diferencia Si hay una diferencia significativa la variación es más significativa la variación es más de lo esperado por casualidad y de lo esperado por casualidad y esto sugiere que hay algún otro esto sugiere que hay algún otro

factor envuelto.factor envuelto.

Page 5: Pruebas de significancia para datos cualitativos Chi cuadrado

Al igual que con z y t si el valor Al igual que con z y t si el valor calculado de calculado de ΧΧ22 es mayor que el valor es mayor que el valor significativo usted acepta/rechaza la significativo usted acepta/rechaza la hipótesis de nulidad.hipótesis de nulidad.

Si Si ΧΧ22 es mayor, p es menor; la es mayor, p es menor; la hipótesis de nulidad es rechazada.hipótesis de nulidad es rechazada.

Page 6: Pruebas de significancia para datos cualitativos Chi cuadrado

Al igual que con z y t las tablas Al igual que con z y t las tablas de Xde X22 son usadas directamente son usadas directamente

en las pruebas de 2 colasen las pruebas de 2 colas

Page 7: Pruebas de significancia para datos cualitativos Chi cuadrado
Page 8: Pruebas de significancia para datos cualitativos Chi cuadrado
Page 9: Pruebas de significancia para datos cualitativos Chi cuadrado

¿qué significan las columnas?¿qué significan las columnas?Qué significan las filas?Qué significan las filas?¿cuál es la diferencia con las tablas ¿cuál es la diferencia con las tablas

de t?de t?¿qué significan los niveles 0.99 y ¿qué significan los niveles 0.99 y

0.95?0.95?

Page 10: Pruebas de significancia para datos cualitativos Chi cuadrado

Criterios para aplicar XCriterios para aplicar X22

Las muestras son tomadas al azar.Las muestras son tomadas al azar.Los datos son cualitativosLos datos son cualitativos Idealmente la frecuencia esperada Idealmente la frecuencia esperada

más baja en cualquier grupo no es más baja en cualquier grupo no es menor de 5.menor de 5.

Page 11: Pruebas de significancia para datos cualitativos Chi cuadrado

Un genetista estaba interesado por saber si dos plantas tenían el genotipo Aa. El las cruzó para ver qué tan cerca de la razón teórica se encontraban las progenies. Las razones teóricas son:

½ Aa : ¼ AA : ¼ aa

Hubo 100 progenies y estos fueron los resultados (muestra al azar)

genotipogenotipo Número Número observado observado (O)(O)

Número Número esperado (E) esperado (E) por la teoríapor la teoría

AaAa

AAAA

aaaa

5353

2323

2424

5050

2525

2525

totaltotal 100100 100100

Page 12: Pruebas de significancia para datos cualitativos Chi cuadrado

¿se aplican todos los criterios para ¿se aplican todos los criterios para usar Xusar X22??

Establezca la hipótesis de nulidad y Establezca la hipótesis de nulidad y su alternativa.su alternativa.

Page 13: Pruebas de significancia para datos cualitativos Chi cuadrado

(número observado – número esperado)2

X2 = Σ número esperado

Lo vamos a representar de ahora en adelante por

( O – E )2

Σ E

Page 14: Pruebas de significancia para datos cualitativos Chi cuadrado
Page 15: Pruebas de significancia para datos cualitativos Chi cuadrado

Substituyendo los números según el Substituyendo los números según el cuadro tenemos quecuadro tenemos que

XX22 = 0.38 = 0.38Debemos buscar ahora fDebemos buscar ahora f

Page 16: Pruebas de significancia para datos cualitativos Chi cuadrado

Uso de XUso de X22 para probar si lo para probar si lo observado se “ajusta” a una observado se “ajusta” a una

teoríateoríaEn este caso XEn este caso X22 se usa para ver si los se usa para ver si los

resultados obtenidos se ajustan a resultados obtenidos se ajustan a esta teoría genética en particular.esta teoría genética en particular.

En estos casos f=k-1, donde k= En estos casos f=k-1, donde k= número de clases.número de clases.

Las clases en este caso son los Las clases en este caso son los genotipos, o sea, 3.genotipos, o sea, 3.

Por consiguiente f= 2Por consiguiente f= 2

Page 17: Pruebas de significancia para datos cualitativos Chi cuadrado

Los investigadores que usan XLos investigadores que usan X22 casi siempre están casi siempre están interesados en dos colas. Es decir, están interesados en dos colas. Es decir, están

interesados en las diferencias entre lo observado interesados en las diferencias entre lo observado y lo esperado, en cualquier direccióny lo esperado, en cualquier dirección

¿es éste o no el caso en nuestro ¿es éste o no el caso en nuestro problema?problema?

SiSi Recuerde que las tablas de XRecuerde que las tablas de X22 tal cual tal cual

están, registran ambas colas.están, registran ambas colas. Entonces el XEntonces el X22 significativo con f=2 es significativo con f=2 es XX22 = 5.991 al nivel 0.05 y 9.210 al nivel = 5.991 al nivel 0.05 y 9.210 al nivel

0.010.01

Page 18: Pruebas de significancia para datos cualitativos Chi cuadrado

XX22 calculado es 0.38 y es menor que el calculado es 0.38 y es menor que el valor significativo de Xvalor significativo de X22. ¿cuál es su . ¿cuál es su

conclusión?conclusión?

X2 significativa

0 X2

X2 calculada

Ud. Acepta la hipótesis de nulidad. La conclusión es que la variación es insuficiente para sospechar que hay otro factor envuelto y ésta es debida solamente a la casualidad. Es decir, los resultados “se ajustan a la teoría genética”

Page 19: Pruebas de significancia para datos cualitativos Chi cuadrado

En pruebas ordinarias de t En pruebas ordinarias de t donde donde µ no es conocida, f = N-1. µ no es conocida, f = N-1. en Xen X22 cuando probamos si algo cuando probamos si algo se ajusta a la teoría, f = k-1. N se ajusta a la teoría, f = k-1. N

en las pruebas de t es el número en las pruebas de t es el número de resultados, mientras que en de resultados, mientras que en XX22 k representa el número de k representa el número de

clasesclases

Page 20: Pruebas de significancia para datos cualitativos Chi cuadrado

En las pruebas pareadas de t, En las pruebas pareadas de t, también f = N-1. aquí, N es el también f = N-1. aquí, N es el

número de diferenciasnúmero de diferencias

Page 21: Pruebas de significancia para datos cualitativos Chi cuadrado
Page 22: Pruebas de significancia para datos cualitativos Chi cuadrado

El mismo genetista decide hacer otro experimento para comprobar si la combinación de dos factores de segregación genética se ajustan a la teoría genética que establece que estos se combinan de acuerdo a la razón: 9 AB: 3Ab: 3aB: 1ab

Sus resultados fueron los siguientes:

fenotipofenotipo Número Número observado(observado(O)O)

ABAB

AbAb

aBaB

abab

245245

8080

7070

55

totaltotal 400400

¿cuáles son los números esperados?

¿podemos aplicar X2? ¿por qué?

X2=

f=

¿una o dos colas?

¿cuál es X2 significativo?

¿conclusión?

Número Número esperado(Eesperado(E))

225225

7575

7575

2525

400400

Page 23: Pruebas de significancia para datos cualitativos Chi cuadrado

Uso de XUso de X22 para probar asociación para probar asociación en vez de “ajuste a una teoría”en vez de “ajuste a una teoría”

Se afecta f (lo veremos más adelante)Se afecta f (lo veremos más adelante)Los datos para probar “asociación” se Los datos para probar “asociación” se

arreglan en una “tabla de contingencia”arreglan en una “tabla de contingencia”

Page 24: Pruebas de significancia para datos cualitativos Chi cuadrado
Page 25: Pruebas de significancia para datos cualitativos Chi cuadrado

En un estudio, para ayudar a decidir si una inoculación en particular tiene alguna propiedad protectiva, se obtuvieron los siguientes resultados durante una epidemia

InoculadosInoculados No No inoculadosinoculados

Total Total de de filafila

AfectadosAfectados

No afectadosNo afectados55

95955555

1451456060

240240

Total de Total de columnacolumna 100100 200200 300300

Establezca la hipótesis de nulidad y su alternativa

Asumimos la hipótesis de nulidad como cierta y calculamos los resultados esperados usando los totales de las filas y las columnas.

¿es esta una tabla de observados o esperados

Page 26: Pruebas de significancia para datos cualitativos Chi cuadrado

Podemos observar, usando los totales de columnas que 100 de un total de 300, o sea 1/3 fueron inoculados. Como hemos asumido como cierta la hipótesis de nulidad, entonces se deriva que la inoculación no está asociada con la incidencia de la enfermedad. Esperamos entonces que 1/3 de aquellos afectados fueron inoculados.

En el cuadro vemos también que se afectaron 60 personas. Por consiguiente podemos esperar que1/3 de ellos fueron inoculados(pues la vacuna no está asociada con la incidencia de la enfermedad). Así, tenemos que 20 fueron inoculados y tuvieron la enfermedad.

De manera similar, 2/3 del total no fueron inoculados, de modo que se puede esperar que 2/3 de los 60 afectados, o sea 40, no fueron inoculados

Ya que se asume que la inoculación no tiene ningún efecto y 1/3 han sido inoculados se puede esperar también que 1/3 de los 240 no afectados fueron inoculados. Es decir, 80 personas.

Finalmente, ¿cuántos no inoculados, no afectados podría esperar? 2/3 de 240, o sea 160

Page 27: Pruebas de significancia para datos cualitativos Chi cuadrado

Complete entonces su tabla de Complete entonces su tabla de resultados esperadosresultados esperados

Page 28: Pruebas de significancia para datos cualitativos Chi cuadrado

Abajo se observan las tablas de contingencia para los Abajo se observan las tablas de contingencia para los resultados observados y los esperadosresultados observados y los esperados

InoculadoInoculadoss

No No inoculadoinoculadoss

Total Total de de filafila

AfectadosAfectadosNo afectadosNo afectados

559595

5555145145

6060240240

Total de Total de columnacolumna 100100 200200 300300

InoculadoInoculadoss

No No inoculadoinoculadoss

Total Total de de filafila

AfectadosAfectadosNo afectadosNo afectados

20208080

4040160160

6060240240

Total de Total de columnacolumna 100100 200200 300300

Observados (O)

Esperados (E)

Observe que el total de filas es igual al total de columnas en las dos tablas

Observe también que cada resultado esperado es igual a

Su total de fila x total de columna

gran total

¿cuál sería el resultado esperado para el grupo afectado inoculado?

60 x 100

300= 20

Page 29: Pruebas de significancia para datos cualitativos Chi cuadrado

Recuerde que estamos Recuerde que estamos interesados en saber si interesados en saber si la inoculación protege la inoculación protege contra la enfermedad.contra la enfermedad.

Si esto es así, Si esto es así, esperamos observar esperamos observar menos gente menos gente inoculada afectada inoculada afectada que lo esperado. ¿esto que lo esperado. ¿esto es así?es así?

De otra manera De otra manera debíamos rechazar la debíamos rechazar la teoría inmediatamenteteoría inmediatamente

¿esta es una prueba ¿esta es una prueba de una o dos colas?de una o dos colas?

SiSi Se esperaban 20 pero Se esperaban 20 pero

sólo 5 fueron sólo 5 fueron observados en este observados en este grupo.grupo.

Prueba de una sóla Prueba de una sóla cola.cola.

Una vez resuelto todo Una vez resuelto todo lo anterior podemos lo anterior podemos entonces utilizar la entonces utilizar la fórmula ya conocida y fórmula ya conocida y calcular Xcalcular X22..

Page 30: Pruebas de significancia para datos cualitativos Chi cuadrado

Cuando XCuando X22 fué usado para probar el “ajuste a una fué usado para probar el “ajuste a una teoría”, f = k-1teoría”, f = k-1

Ahora que usamos XAhora que usamos X22 para probar asociación para probar asociación usando las tablas de contingencia, f = (r-1) (c-1), usando las tablas de contingencia, f = (r-1) (c-1), donde r es el número de filas y c el número de donde r es el número de filas y c el número de columnas en el cuerpo de la tabla.columnas en el cuerpo de la tabla.

Por consiguiente, en nuestro problema f = (2-1) Por consiguiente, en nuestro problema f = (2-1) (2-1) = 1(2-1) = 1

O sea que hay 1 grado de libertad.O sea que hay 1 grado de libertad. Esto es porque si 1 resultado esperado es Esto es porque si 1 resultado esperado es

calculado en una tabla de contingencia de dos calculado en una tabla de contingencia de dos filas y dos columnas, ya que los totales de las filas filas y dos columnas, ya que los totales de las filas y las columnas son fijos, el resto de los números y las columnas son fijos, el resto de los números en la tabla no se pueden escoger libremente.en la tabla no se pueden escoger libremente.

Page 31: Pruebas de significancia para datos cualitativos Chi cuadrado

¿cuál es el valor de f en una tabla de ¿cuál es el valor de f en una tabla de contingencia con 3 filas y 8 contingencia con 3 filas y 8 columnas?columnas?

(3-1)(8-1) = 14(3-1)(8-1) = 14En este caso el grado de libertad En este caso el grado de libertad

para escoger resultados se amplía para escoger resultados se amplía por haber un número mayor de filas por haber un número mayor de filas y de columnas.y de columnas.

Page 32: Pruebas de significancia para datos cualitativos Chi cuadrado

Con toda la información que tenemos Con toda la información que tenemos podemos ir a la tabla y buscar el valor podemos ir a la tabla y buscar el valor significativo de Xsignificativo de X22..

Los cuales son: 2.706 para 0.05 y 5.412 para Los cuales son: 2.706 para 0.05 y 5.412 para 0.010.01

¿cuál es su conclusión?¿cuál es su conclusión? La hipótesis de nulidad es rechazada. La hipótesis de nulidad es rechazada.

Podemos ver que menos gente que está Podemos ver que menos gente que está inoculada contrae la enfermedad. Ahora inoculada contrae la enfermedad. Ahora podemos decir también que el grado de podemos decir también que el grado de protección es estadísticamente significativo protección es estadísticamente significativo (0.01 > p)(0.01 > p)

Page 33: Pruebas de significancia para datos cualitativos Chi cuadrado

Para probar el nivel de “ajuste a Para probar el nivel de “ajuste a una teoría”, ésta por si misma es una teoría”, ésta por si misma es

usada para calcular los usada para calcular los resultados esperados. Sin resultados esperados. Sin

embargo, cuando usamos Xembargo, cuando usamos X22 para probar una “asociación”, para probar una “asociación”,

usamos los resultados usamos los resultados observados para calcular los observados para calcular los

resultados esperadosresultados esperados