Upload
martaelices
View
130
Download
4
Embed Size (px)
Citation preview
SEMINARIO 8
Test de Chi-Cuadrado de PearsonMARTA SÁNCHEZ ELICES
ESTADÍSTICA Y TICs U.D. Virgen del Rocío
GRUPO PEQUEÑO: 16
Procedimiento a la hora de realizar Chi-Cuadrado
Establecer hipótesis nula
Realizar una tabla con los datos observados o frecuencias observadas
Calcular Grados de Libertad
Calcular frecuencias esperadas
Utilizar el estadístico
Compararlo con las tablas a nivel de significación fijadas.
Aceptar o rechazar la H0
Ejemplo de ejercicio: Un enfermero de la unidad de digestivo observa que
se producen diferencias relacionadas con los meses en los reingresos de pacientes
con úlcera gástrica. Recoge los siguientes datos:
• En primer lugar establecemos cuál será la hipótesis nula:
H0: no hay relación entre el mes del año y los reingresos.
En 2014 ha habido 48 reingresos.
• Si se cumpliera la hipótesis nula: lo esperado sería, si tenemos 12 meses, 4
ingresos al mes.
• Variable independiente: mes, que tiene 12 categorías. (Mientras más
categorías tenga la variable, más probabilidad de que me salga un valor esperado
menor a 5. Para poder hacer el test de Chi cuadrado, lo que puedo hacer es
convertir los meses, en estaciones del año, por lo que solo habría 4 categorías).
Voy a reagrupar la variable independiente, en estaciones: el mes lo voy a convertir en estaciones. Lo esperado sería:
• Invierno (enero, febrero, marzo): 12 reingresos
• Primavera (abril, mayo, junio): 12
• Verano (julio, agosto, septiembre): 12
• Otoño (octubre, nov, diciembre): 12
Lo observado es diferente (según la tabla de la diapositiva):
• Invierno: 7
• Primavera: 15
• Verano: 6
• Otoño: 20
Variable dependiente: reingreso. Tiene 2 categorías (Sí, No).
Se trata de ver si hay diferencia entre lo observado y lo esperado.
¿Cómo calculamos el test Chi-cuadrado?
- Grados de libertad [(nº categorías V.I) – 1)] x [( nº categorías V.D) – 1]
(4-1) x (2-1) = 3
Calculamos el valor de Chi-cuadrado mediante la fórmula:
• fo= frecuencia observada
• fe = frecuencia esperada
Aplicamos la fórmula, en este caso el resultado de Chi-cuadrado es: 11,16Normalmente los investigadores aceptan un máximo de 5 % de error. Eso es lo que se llama nivel de significación p < 0,05.
Correspondencia inversa: mientras más alta sea Chi-cuadrado, más pequeño es el error (p)
2 2 2 2 2
2 7 12 15 12 6 12 20 1211,16
12 12 12 12
fo fe
fe
Miramos en la tabla:
- Grados de libertad: 3
- Nivel de significación: 0,05
En este caso Chi-cuadrado vale: 7,82.
Como nuestro resultado es de 11,16 (mayor que 7,82), el nivel de
significación será menor que 0,05.
- Cuando el nivel de significación es menor: rechazamos la hipótesis
nula.
- Cuando el nivel de significación es mayor: aceptamos la hipótesis
nula.
En este caso, rechazamos la hipótesis nula. Por ello decimos: si existe
relación entre las estaciones y los reingresos.
Se acumulan los reingresos en otoño y en primavera.
Ejercicio 1: Un estudio para saber si la pertenencia a barriadas más pobres influye en la obesidad infantil.Nivel de significación de 0,01
Ho: la pertenencia a barriadas más pobres no influye en la obesidad infantil.
Hemos recogido unos datos:
Calculamos los totales:
20 45
70 26
Barrio pobre Barrio rico
Obesidad infantil si
20 45 65
Obesidad infantil no
70 26 96
90 71 161
65 personas con obesidad infantil
96 personas sin obesidad infantil
90 personas pertenecen a barriadas pobres
71 personas pertenecen a barriadas más ricas
VI: barrio en el que vive, tiene 2 categorías: barrio rico o
barrio pobre COLUMNAS
VD: Obesidad infantil, tiene 2 categorías: si o no FILAS
Voy a calcular los datos esperados en una tabla a parte:
Grados de libertad: (2-1) x (2-1) = 1
Barrio pobre Barrio rico
Obesidad infantil si
=36,3 =28,66 65
Obesidad infantil no
=53,66 =42,3 96
90 71 161
Calculamos Chi-cuadrado:
+ + + = 27,9
- Miramos el valor de Chi-Cuadrado en la Tabla (1 grado de libertad y nivel de significación 0,01)
Miramos la tabla. Para que p sea 0,01, Chi cuadrado tiene que valer: 6,64
27,9 es mucho mayor que este valor, por lo cual p es mucho menor que 0,01, lo
que significa que rechazamos la hipótesis nula.
Esto quiere decir que hay relación entre el barrio al que pertenece y el
padecer o no obesidad infantil.
Si rechazamos la hipótesis nula puede ser que haya mas obesos entre los
niños marginales o los no marginales. Tenemos que ver donde están los
obesos.
- Obesidad barrios marginales : = 0,22
- Obesidad barrios no marginales: = 0.63
Hay mas obesidad infantil en los barrios no marginales.
Ejercicio 2: Tenemos la siguiente tabla de contingencia que refleja los datos de la asignatura de religión en centros escolares. ¿Influye el tipo de colegio en la nota obtenida? Con un margen de error 0,05.
Insuficiente
Suficiente o bien
Notable Sobresaliente
Total
Centro privado
6 14 17 9 46
Instituto 30 32 17 3 82 36 46 34 12 128
H0 = no influye el tipo de colegio en la nota obtenida.
Hacemos una tabla con los datos esperados:
Insuficiente
Suficiente o bien
Notable Sobresaliente
Total
Centro privado
12,94 16,53 12,22 4,31 46
Instituto 23,06 29,47 21,78 7,69 82 30 46 34 12 128
VI: nota obtenida: 4 categorías
VD: tipo de colegio, 2 categorías
Grado de libertad: (4-1) x (2-1) = 3
- Calculamos el valor de Chi – cuadrado:
(6 - 12,94)2/12,94 + (30 – 23,06)2/23, 06 + (14 - 16,53)2/16,53 + (32 – 29,47)2/29,47 + (17 – 12,22)2/12,22 + (17 – 21,78)2/21,78 + (9 - 4,31)2/4,31 + (3 – 7,69)2/7,69 =
17,3
Miramos la tabla:
Para que el nivel de significación fuese 0,05, Chi-
cuadrado debería valer 7,82.
En nuestro caso Chi-cuadrado vale 17,3. Es mucho
mayor, por lo que la p<0,05
Rechazamos la hipótesis nula. Si influye el tipo de
colegio en la nota obtenida. ¿Dónde hay mas porcentaje
de suspensos?.
Privado: 6/46 = 0,13
Publico: 30/82 = 0,36
Se suspende mucho mas en los centros públicos
que en los privados.
Ejercicio 3: En un grupo de enfermos que se quejaban de que no dormían se les dio somníferos y placebos. Con los siguientes resultados. Nivel de significación: 0,05
¿Es lo mismo tomar somníferos que placebos para dormir
bien o mal en este grupo de enfermos?
RESULTADO Chi-cuadrado = 2,5778
H0 = no hay relación entre tomar somníferos o placebos y dormir bien o mal.
V.I = tomar somníferos o placebos. 2 categorías
V.D = dormir bien o mal. 2 categorías
Hacemos una tabla con los datos observados:
Hacemos una tabla con los datos esperados:
Duerme bien Duerme mal
Somníferos 44 10 54
Placebos 81 35 116
125 45 170
Duerme bien Duerme mal
Somníferos 125 x 54/170 = 39,7
45 x 54/170 = 14,29
54
Placebos 125 x 116/170 = 85,29
45 x 116/170 = 30,70
116
125 45 170
- Grados de libertad : (2 – 1) x (2 – 1)= 1
Calculamos Chi-cuadrado:
(44 – 29,7)2/29,7 + (81 – 85,29)2/85,29 + (10 – 14,29)2/14,29 + (35 – 30,70)2/30,70 = 2,57
Buscamos el valor de Chi-cuadrado en la tabla (1 grado de libertad y un nivel de significación de 0,05)
El valor de Chi- cuadrado para que p = 0,05 es 3,84. 2,57 es menor que este valor. Por lo que la p>0,05.
Así que aceptamos la hipótesis nula:
No hay relación entre tomar somníferos o placebos y dormir bien o mal.
Ejercicio 4: En un C de Salud analizamos las historias de enfermería (292 hombres y 192 mujeres). De ellos tienen úlcera 10 hombres y 24 mujeres y no tienen 282 y 168 respectivamente. Nivel significación 0,05
H0 = no influye el sexo en el hecho de tener o no tener úlceras.
Hacemos una tabla con los datos observados:
- V.I = sexo. Tiene 2 categorías (mujer, hombre).
- V.D = presencia de úlceras. Tiene 2 categorías (si tiene, no tiene).
Tienen úlcera No tienen úlcera
Mujer 24 168 192
Hombre 10 282 292
34 450 484
Hacemos una tabla con los datos esperados:
- Grados de libertad: (2-1) x (2-1) = 1
- Nivel de significación = 0,05
Calculamos el valor de Chi-cuadrado:
(24 – 13,5)2/13,5 + (10 – 20,5)2/20,5 + (168 – 178,5)2/178,5 + (292 – 271,5)2/271,5
= 14,6
Tienen úlcera No tienen úlcera
Mujer 34 x 192/484 = 13,5
450 x 192/484 = 178,5
192
Hombre 34 x 292/484 = 20,5
450 x 292/484 = 271,5
292
34 450 484
Miramos en la tabla cuál sería el valor de Chi-cuadrado para que p = 0,05
Para que p = 0,05, Chi-cuadrado tiene que valer 3,84. Nuestro valor es mucho mayor (14,6). Por lo que la p será mucho menor de 0,05. Rechazamos la hipótesis nula.
Sí influye el sexo en el hecho de tener o no tener úlceras.
- Úlceras en hombres: 10/292 = 0,034 x 100 = 3,4%
- Úlceras en mujeres: 24/192 = 0,125 x 100 = 12,5%
LAS ÚLCERAS APARECEN MÁS EN MUJERES QUE EN HOMBRES.