Inferencia No Paramétrica-Problemas Resueltos con pruebas de Chi-cuadrado

Embed Size (px)

DESCRIPTION

Casos resueltos de pruebas de hipótesis de asociación de variables categóricas con las pruebas de Chi-cuadrado, prueba de McNemar, Test G.

Citation preview

Casos y problemas

VI: Inferencia en la media Inferencia no paramtrica IV: Inferencia no paramtrica Contraste de asociacin Pruebas de Chi-cuadrado Prueba de McNemar Test G

resueltos

Estadstica Inferencia Estadstica-2Patricio Alcano Martnez Patricio Alcano Martnez Derechos Reservados

Aplicada a las Ciencias SocialesI: Estadstica Descriptiva Aplicada a las Ciencias Sociales

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

2

Palabras iniciales Estimados usuari@s: Este material que pongo a su disposicin, est creado a partir de casos e investigaciones reales en distintos mbitos de las Ciencias Sociales. Los datos han sido cambiados para ajustarlos a un criterio didctico. Por ello, la informacin y conclusiones a las cuales llegan, no son necesariamente vlidos en la realidad cotidiana, ni sirven de referencia para fundamentar trabajos e investigaciones. Los casos y problemas aqu presentados constituyen una muestra representativa de situaciones frecuentes a enfrentar en investigacin social con variables categricas, en lo referido al test o contraste de asociacin o independencia. A saber: 1. Contraste de hiptesis con Chi-cuadrado de Pearson y la correccin de Yates. 2. Contraste de hiptesis con el test G o de razn de verosimilitudes. 3. Contraste, test o dcima de asociacin con muestras pareadas mediante la prueba de McNemar. La metodologa de contraste se hace a travs del valor-p, que es el criterio ms utilizado en este momento, toda vez que aparece incorporado a muchos softwares de anlisis estadstico hoy en boga. Este volumen est dirigido a tratar operacionalmente el tema de los contrastes de asociacin a partir de datos de frecuencia, abordando tanto el tema del clculo numrico como la interpretacin de los estadsticos que resultan. El lector deber manejar los conceptos y procedimientos elementales de Inferencia Estadstica y contraste de hiptesis y tener competencia en el clculo de probabilidades con el modelo Chi-cuadrado. Para trabajar con este material el usuario deber hacer uso de calculadora y la tabla de probabilidades Chi-cuadrado, tablas que se adjuntan en las pginas finales de este documento. El uso de este material queda restringido solamente al mbito acadmico.

Atentamente;

Patricio Alcano Martnez

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

3

Caso 1: Estado civil y sntomas depresivos

Sobre la base de los resultados de un estudio, se ha afirmado que las madres casadas presentan menos sntomas de depresin que las solteras. En una muestra de mujeres de 18-19 aos con 1 hijo, se recab la siguiente informacin, en nmero de casos, desagregadas por estado civil: ESTADO CIVIL Casadas Solteras Total SNTOMAS DEPRESIVOS S 45 83 128 No 131 127 258 Total 176 210 386

1.1. Contraste, con estos datos y un1% de significacin, la hiptesis de que el sntoma depresivo de las mujeres est asociado a su estado civil. Construya sus conclusiones respecto del caso. 1.2. Qu significa, en este contexto, cometer error de tipo II? Solucin: 1.1. Situacin tpica de resolver a travs del contraste de hiptesis de asociacin con la prueba Chi-cuadrado. La muestra es lo suficientemente grande como para utilizar Chicuadrado de Pearson, esto es, sin correccin por continuidad de Yates. Significacin: = 0,01 Hiptesis: H0: Los sntomas depresivos de la mujer son independientes de su estado civil H1: Los sntomas depresivos de la mujer estn asociados a su estado civil Estadstico de prueba:2 = obs (45 127 131 83)2 386 = 8,4 176 210 128 258

Valor p:* = P( 2;1 > 8,4) = 0,0037 p

Decisin: Como * < 0,01 , se rechaza H0 al 1%. Conclusin: Los sntomas depresivos de la mujer estn asociados a su estado civil (p = 0,0037). 1.2. El error de tipo II consiste en no rechazar la hiptesis nula siendo que es falsa. En este caso significa no rechazar la independencia entre sntomas depresivos y estado civil, dado que en realidad s hay asociacin.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

4

Caso 2: Consumo de cocana y terapiaEn cierta universidad de USA, se realiz un estudio con 187 consumidores compulsivos de cocana, los que fueron aleatoriamente asignados a acupuntura auricular o a terapia de relajacin sin acupuntura. Durante el estudio, los sujetos fueron sometidos a exmenes de orina para detectar la presencia de cocana en el organismo. De 103 sujetos asignados a tratamiento de auriculopuntura, 35 presentaron evidencia de cocana en la orina, mientras que entre los sometidos a relajacin, 51 de un total de 84. 2.1. A un nivel de significacin del 1%, contraste la hiptesis de que el consumo de cocana durante el estudio result asociado al tipo de tratamiento.

Solucin: Se trata de contrastar la posible asociacin entre dos variables categricas, dicotmicas: Evidencia de cocana en la orina: S No Tratamiento: Auriculopuntura Terapia de relajacin Es aplicable una prueba de hiptesis de asociacin con la Chi-cuadrado. Primeramente se llevarn los datos a una tabla de contingencia 2x2. Cocana en la orina S No 35 68 51 33 86 101

TRATAMIENTO Auriculopuntura Relajacin Total Significacin: = 0,01

Total 103 84 187

Hiptesis: H0: La presencia de cocana en la orina es independiente del tratamiento H1: La presencia de cocana en la orina est asociada al tipo de tratamiento Estadstico de prueba:

2 = obs Valor p:

(35 33 68 51)2 187 = 13,3 103 84 86 33

* = P( 2;1 > 13,3) = 0,0003 p

Decisin: Como * < 0,01 , se rechaza H0 al 1%. Conclusin: La presencia de cocana en la orina est asociada al tipo de tratamiento (p = 0,0003).

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

5

Caso 3: Salud y sobrepesoEl grfico de la figura presenta, en N de casos, la evaluacin del estado general de salud de una muestra de personas adulto mayor, segn si presentan peso normal o sobrepeso.N de casos

12 10 08 06 04 02 00 Bueno Malo

Peso normal Sobrepeso

ESTADO DE SALUD

Estado general de salud de adulto mayor, segn peso

3.1. Con los datos del grfico, analice, al 5%, la existencia de una relacin significativa entre peso y estado general de salud en el adulto mayor. 3.2. En qu consiste cometer error de tipo I en este contraste?

Solucin: 3.1. Se cuenta con dos variables dicotmicas, con datos de frecuencia. Por esta razn es aplicable una prueba de hiptesis de asociacin con la Chi-cuadrado. Primero se llevarn los datos a una tabla de contingencia 2x2. ESTADO DE SALUD Bueno Malo Total PESO Normal 12 4 16 Sobrepeso 8 10 18

Total 20 14 34

El tamao de la muestra es menor a 40, lo que hace aconsejable el uso de la Chicuadrado con correccin de Yates. La frecuencia observada en una de las celdas es 4, menor que lo aconsejable en cada celda, que es 5, lo que podra hacer pensar en cierta inestabilidad del clculo. Pero esa 14 16 = 6,6, por lo que todas las celdas celda tiene una frecuencia esperada igual a 34 cumpliran con el mnimo aconsejable de 5 en su valor esperado. Significacin: = 0,5 Hiptesis: H0: El estado general de salud del adulto mayor es independiente de su peso H1: El estado general de salud del adulto mayor est asociado a su peso

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

6

Estadstico de prueba:2 = obs (12 10 8 5 0,5 34)2 34 20 14 16 18

= 2,13

Valor p:* = P( 2;1 > 2,13) = 0,1449 p

Decisin: Como * > 0,05 , NO se rechaza H0 al 5%.

Conclusin: El estado general de salud del adulto mayor no est asociado a su peso (p = 0,1449).

3.2. El error de tipo I es rechazar la hiptesis nula siendo que es veradera. En el marco del caso consiste en rechazar la independencia entre estado de salud y peso en el adulto mayor, dado que en realidad estn asociados.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

7

Caso 4: Desercin estudiantilUna ONG realiza un estudio de desercin estudiantil en la educacin superior en una muestra aleatoria de estudiantes de educacin superior. Los estudiantes fueron segmentados segn gnero y tipo de carrera y se les hizo un seguimiento a lo largo del primer semestre de estudio, instancia en la que se determin si haban abandonado o no sus estudios. Las variables estudiadas fueron las siguientes:

Desercin: Gnero: Tipo de carrera: Tcnica

Deserta del sistema: 1 = S; 0 = No Sexo del encuestado: 1 = Hombre; 2 = Mujer Carrera de estudio del encuestado: 1 = Profesional; 2 =

Los datos obtenidos de la investigacin se analizaron con el test de independencia 2 , llegndose a las siguientes conclusiones:

C1: La desercin se da igual en hombres y mujeres (p = 0,0838) C2: La desercin est asociada al tipo de carrera (p = 0,0184)

De acuerdo a esta informacin: 4.1. Indique cul fue la hiptesis nula en el contraste de la conclusin C1. 4.2. Para la conclusin C2, cul fue la decisin en el contraste? 4.3. Si ambas hiptesis fueron contrastadas al mismo nivel de significacin, de los valores usuales en investigacin social, cul es ese valor? 4.4. Si la correlacin entre Desercin y Tipo de carrera fue de negativa y significativa, qu conclusin puede sacar de ello?

Solucin: Se trata del contraste de asociacin entre variable categricas, definidas con dos valores dicotmicos. El contraste fue realizado con pruebas con la Chi-cuadrado. 4.1. En este tipo de contaste, la hiptesis nula siempre afirma la independencia entre las variables. Por lo tanto, la hiptesis nula para el contraste que llev a la conclusin C1 fue: H0: La desercin es independiente del sexo del estudiante. 4.2. Al afirmar asociacin entre variables, la conclusin C2 est refutando la independencia entre desercin y tipo de carrera que plantea la hiptesis nula. Por lo tanto la decisin fue rechazar la hiptesis nula a un nivel de significacin . 4.3. En la conclusin C1 no se rechaz la hiptesis nula con < 0,0838. Entonces la significacin pudo ser 1% o 5%. En la conclusin C2 se rechaz la hiptesis nula con > 0,0184. Entonces la significacin pudo ser 5% o 10%. Por lo tanto, la significacin utilizada en ambos contrastes fue =5%. 4.4. Correlacin negativa indica que los valores bajos de desercin (1 = S) estn asociados a valores Altos de Tipo de carrera (2 = tcnica). Por lo tanto se concluye que la desercin est asociada a las carreras tcnicas.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

8

Caso 5: Percepcin de la situacin econmicaSe hizo en Chile un estudio hacia fines del ao 2010 con una muestra informantes dirigentes sociales, 17 hombres y 15 mujeres, a fin de conocer su percepcin de la situacin econmica del pas. Los resultados son los siguientes, en nmero de casos:Sexo Hombre Mujer Total Percepcin de la situacin econmica Buena Aceptable Deficiente 8 6 3 9 4 2 17 10 5

Total 17 15 32

5.1. Con un nivel de significacin del 10% realice un contraste de hiptesis para responder a la afirmacin de que la percepcin de la situacin econmica est asociada al gnero del encuestado.

Solucin: 5.1. Primero se calculan los valores esperados bajo la hiptesis de independencia verdadera.

Valores esperados:Sexo Hombre Mujer Total Percepcin de la situacin econmica Buena Aceptable Deficiente 9,03 5,31 2,66 7,97 4,69 2,34 17 10 5 Total 17 15 32

Esta tabla tiene el 50% de las celdas con valores esperados menores que 5, lo que resta validez al anlisis. Por lo tanto, se reorganizan los datos para llevarlos a una tabla de 2x2. Como la variable Percepcin de la situacin econmica est medida a escala ordinal, se juntarn los valores Aceptable y Deficiente en una misma categora. La tabla resultante es la siguiente:Sexo Percepcin de la situacin econmica Buena AceptableDeficiente 8 9 9 6 17 15

Total 17 15 32

Hombre Mujer Total

El tamao de la muestra hace aconsejable aplicar el contraste de asociacin mediante el Chi-cuadrado con correccin de Yates.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

9

Significacin: = 0,10 Hiptesis: H0: La percepcin de la situacin econmica es independiente del sexo del encuestado. H1: La percepcin de la situacin econmica est asociada al sexo del encuestado.

Estadstico de prueba:2 Yates = ( 8 6 9 9 0,5 32)2 32 17 15 17 15

= 0,1422

Valor p:* = P(2;1 > 0,1422) = 0,706 p

Decisin: No se rechaza H0, al 10%. Conclusin: La percepcin de la situacin econmica es independiente del sexo del encuestado (p = 0,706)

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

10

Caso 6: Estado civil y situacin laboral de mujeresSe realiza un estudio para esclarecer la posible asociacin entre el estado civil de las mujeres y su situacin laboral, conjeturando inicialmente que las mujeres que trabajan remuneradamente fuera del hogar son, fundamentalmente, solteras. Para los efectos, el estudio investig a 44 mujeres casadas y 34 solteras, independientes entre s. Los resultados se organizaron en una tabla como la siguiente:Mujeres segn estado civil y situacin laboral Trabaja remuneradamente S No Total Estado civil Casada Soltera Total

44

34

78

El anlisis de la tabla de contingencia dio los siguientes estadsticos:Estadstica Chi2-Pearson Chi2-con correccin de Yates Test-G Chi2-McNemar Correlacin-fi Q de Yule valor 5,4985432 4,4638738 5,5293445 2,88 -0,265507 -0,502551 p 0,0190 0,0346 0,0187 0,0897 0,0188

Con estos datos, y un 5% de significacin, realice el anlisis necesario para validar o refutar las siguientes afirmaciones:6.1. La situacin laboral de la mujer est asociada a su estado civil. 6.2. Las mujeres que trabajan remuneradamente son, fundamentalmente, solteras.

Solucin: 6.1. La situacin laboral de la mujer est asociada a su estado civil Para estudiar la asociacin entre variables categricas en una tabla de 2x2 es utilizable el

test de asociacin con 2 de Pearson, con o sin correccin de Yates, el test G (razn de verosimilitudes), que tambin se basa en 2 . El test de McNemar no sirve en este caso, ya que es aplicable a casos con muestras pareadas. Las hiptesis del caso son las siguientes: H0: La situacin laboral de la mujer es independiente de su estado civil H1: La situacin laboral de la mujer est asociada a su estado civil Los tres estadsticos basados en Chi cuadrado que aparecen en el cuadro, tienen un valor p menor a la significacin del 5%, al igual que el test de Fisher. Estos cuatro resultados

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

11

confirman el rechazo de la hiptesis de independencia. Por lo tanto, se puede afirmar, que: La situacin laboral de la mujer est asociada a su estado civil (p< 0,05).

6.2. Las mujeres que trabajan remuneradamente son, fundamentalmente, solteras. Ya se concluy que la situacin laboral de la mujer est asociada a su estado civil. Falta analizar ahora la direccin de dicha asociacin. Para los efectos sirven los dos estadsticos que aparecen en la tabla de estadsticos: el coeficiente de correlacin y la Q de Yule.

Ambos estadsticos son negativos y existe un valor p menor al 5%. Esto hace concluir que la correlacin entre estado civil y situacin laboral es inversa y significativa al 5%. De acuerdo a la organizacin de la tabla de frecuencias, esta correlacin indica que la situacin laboral de S trabaja remuneradamente, est correlacionada con el estado civil Soltera. Aunque la correlacin es baja en valor absoluto, es significativa, lo que lleva a poder concluir que: En la mujer, la situacin laboral de s, trabajando, est asociada, en forma baja, pero significativa, a las solteras (p 0,2) = 0,6547 p

Decisin: No se rechaza H0, al 10%. Conclusin: La obesidad es independiente de la etapa etaria del encuestado (p = 0,6547). Esto significa que los adolescentes obsesos no necesariamente siguen sindolo cuando adultos.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

13

Caso 8: El debate televisivo, cambi la intencin de voto?Se investiga la intencin de voto en las elecciones presidenciales en 240 sujetos. Despus de un debate de los dos candidatos por televisin, se les volvi a consultar a los mismos sujetos su intencin de voto, llegando a los datos de la tabla siguiente:Intencin de voto DESPUS del debate Votara por candidato A B 51 45 80 64 131 109

TOTAL 96 144 240

Intencin de voto ANTES del debate Votara por candidato

A B TOTAL

8.1. Con estos datos, y un nivel de significacin del 5%, contraste la hiptesis de que el debate televisivo cambi significativamente la intencin de voto.

Solucin: 8.1. De acuerdo a los datos dados y descripcin del caso, se trata de una muestra pareada en una situacin antes-despus. Por lo tanto, es ideal realizar el contraste con el estadstico Chi-cuadrado de McNemar.

Significacin: = 0,10 Hiptesis: H0: La intencin de voto es igual antes y despus del debate. H1: La intencin de voto es distinta antes y despus del debate. Estadstico de prueba:2 McNemar = (80 45)2 = 9,8 80 + 45

Valor p:* = P(2;1 > 9,8) = 0,0017 p

Decisin: Se rechaza H0, al 5%. Conclusin: La intencin de voto cambi significativamente despus del debate televisivo (p = 0,0017).

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

14

Caso 9: Accidentes de trnsito con resultado de muerteSe investiga una muestra aleatoria de accidentes de trnsito, segn sexo del conductor (1 = mujer; 2 = hombre) y su hubo o no resultado de muerte (1 = s; 0 = no). Se desea saber si sexo y accidentes de trnsito con resultados de muerte estn o no asociados y la direccin de la asociacin, si la hubiera. El anlisis de una tabla de 2x2 arroj los siguientes resultados de estadsticos: 2 = 4,2;

Q-Yule= 0,498

9.1. Sobre la base de estos resultados, construya las conclusiones del caso, al 5% de significacin.

Solucin:

El estadstico 2 se usa en el contraste de asociacin. Como la tabla es de 2x2, por ser ambas variables dicotmicas, esta Chi-cuadrado tiene 1 grado de libertad. Por lo tanto, el valor p de la prueba es: 0,0404, rechazndose la hiptesis de independencia, al 5% de significacin. Por otro lado, el estadstico Q de Yule indica una direccin positiva de la correlacin entre sexo (hombre = 2 y Resultado de muerte (1 = s), ya que esos son los valores mayores de ambas variables. Por lo tanto, el anlisis nos permite afirmar la existencia de una asociacin significativa entre sexo del conductor y accidente de trnsito con resultado de muerte (p = 0,0404), verificndose que los resultados de muerte se asocian a los conductores hombres. Conclusin: Al 5%, se puede afirmar que los accidentes con resultado de muerte estn significativamente asociados a los conductores de sexo masculino (p 29,9) = 0

Decisin: El valor p es prcticamente cero, por lo que se rechaza la hiptesis de independencia, al 1%. Conclusin: El estado de estrs pos-terremoto NO es independiente de la condicin socioeconmica (p = 0).

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

17

Caso 11: Universidades y GSESe investiga una muestra aleatoria de estudiantes universitarios, segn grupo socioeconmico y tipo de universidad en la cual estudian (Estatales Privadas).

Universidades Estatales Privadas Alto 13 38

Grupo socioeconmico Medio alto Medio bajo 17 4 19 2

Bajo 3 2

11.1. A un nivel del 5% haga una prueba de hiptesis con el test G para validar la afirmacin que dice que los estudiantes universitarios de las universidades privadas son preferentemente de los estratos socioeconmicos altos.

Solucin: El test G, tambin llamado razn de verosimilitud, es una prueba de Chi-cuadrado, que entrega mejores resultados que el de Pearson. Est dado por:G=2

fo ln fo e

f

11.1. La tabla tiene un 50% de celdas que no cumplen con la cantidad mnima exigida por la prueba de Chi-cuadrado. Para resolver esto, se fusionar la columna medio bajo con bajo, quedando as: Universidades Estatales Privadas Total Alto 13 38 51 Grupo socioeconmico Medio alto Medio bajo-bajo 17 7 19 4 36 11 Total 37 61 98

Ahora se procede a calcular las frecuencias esperadas en cada celda: Para la celda Estatal/Alto:fe = 37 51 =19,3 98

Y as sucesivamente. Se llega a la siguiente tabla:Universidades Estatales Privadas Total Alto 19,3 31,7 51 Grupo socioeconmico Medio alto Medio bajo-bajo 13,6 4,1 22,4 6,9 36 11 Total 37 61 98

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

18

La tabla result con una cela con la frecuencia esperada menor a 5, que es el valor mnimo recomendado para la prueba. Pero, as mismo, se acepta hasta un 20% de las celdas que no cumplan con el requisito. Como en este caso. Por lo tanto, se procede al clculo del estadstico G.fo fe

Se calcula en cada celda el valor de: f o ln

Universidades Estatales Privadas Total Alto -5,11 6,83

Grupo socioeconmico Medio alto Medio bajo-bajo 3,80 3,65 -3,13 -2,15

Total

3,89

El estadstico G es igual a:G=2

fo ln fo e

f

G = 2 (-5,11 + 3,80 + 3,65 + 6,83 3,13 2,15) G = 2 3,89 = 7,78

Grados de libertad: Para una tabla de 2 x 3 los grados de libertad son: = (2 1) (3 1) = 2 gl. Esta G es una Chi-cuadrado con 2 grados de libertad. Valor p:* = P( 2; p2

> 7,8) = 0,0202

Decisin: Con este valor del p-value, se rechaza la hiptesis nula de independencia, al 5%. Conclusin: El tipo de universidad de los estudiantes, est asociado al grupo socioeconmico de estos (p = 0,0202).

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

19

Caso 12: IVE en EspaaSe seleccionan 50 mujeres espaolas y 30 extranjeras residentes en Espaa, que se realizaron una IVE 1 . A estas se les consult si ya se haban realizado una IVE anterior. El resultado es que, de las espaolas, 18 ya lo haban hecho anteriormente, mientras que de las extranjeras, un total de 20. 12.1. Existe una diferencia en la realizacin de IVE anterior respecto de la nacionalidad de las mujeres? Use un 10% de significacin.

Solucin: 12.1. Con los datos se construye la siguiente tabla: IVE anterior S No Total Nacionalidad Espaola Extranjera 18 20 32 10 50 30 Total 38 42 80

Hiptesis: H0: fo = fe H1: fo fe Estadstico de prueba: Usando la forma abreviada del estadstico Chi-cuadrado de Pearson, se tiene:2 obs =

(18 10 20 32)2 80 = 7,07. 38 42 50 30

Valor p: P( 2; 1 > 7,07) = 0,0082 (segn tabla) p Como valor p < 0,10; se rechaza la hiptesis de homogeneidad al 10%. La diferencia es relevante. Haciendo un breve anlisis de % en cada columna, se tiene que el: 18 100 = 36,0% 50 De las mujeres espaolas se han hecho un IVE anterior, mientras que en las extranjeras ese % llega al:20 100 = 66,7%, sendo la diferencia, significativa, de acuerdo a test 30 realizado.

Conclusin: La proporcin de mujeres que se realiza IVE es mayor en las mujeres extranjeras residentes en Espaa que las espaolas (p = 0,0082).1

IVE: Interrupcin Voluntaria del Embarazo.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

20

Caso 13: Compra de cafEn un supermercado se observa a 46 personas que compran caf, de las cuales 27 llevan de la marca A, mientras que las restantes 19 llevan marca B. 13.1. Al 5%, constituye este dato un fundamento para afirmar que las personas compran preferentemente el caf marca A?

Solucin: 13.1. Las hiptesis son: H0: las frecuencias observadas son iguales a las esperadas. H1: las frecuencias observadas son distintas a las esperadas.

En el marco del caso, la hiptesis nula afirma que la compra del caf es independiente de la marca, que las personas compran por igual marca A o B y que las diferencias son debidas al azar. La hiptesis alternativa afirma que hay diferencias en la marca que compran. La situacin se puede resumir como sigue:Frecuencia Observada Marca de caf A 27 B 19 Total 46

Clculo del valor de Chi-cuadrado. Se calculan las frecuencias esperadas, bajo la hiptesis de que no hay diferencia por marca de caf. Como se ve, si no hay diferencia, se espera que de las 46 personas, 23 compren caf A y 23 compren B.Marca de caf A 27 23 B 19 23 Total 46 46

Frecuencia Observada Esperada

Para la primera celda, el clculo es:(27 23)2 = 0,70 23

Para la segunda celda, el clculo es:(19 23)2 = 0,70 232 Por lo tanto, obs = 0,7 + 0,7 = 1,4

El valor p: Grados de libertad: 2 celdas 1 = 1 gl.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

21

* = 0,2367. Este resultado lleva a no rechazar la hiptesis nula.Conclusin: Con estos datos, no se puede afirmar que los compradores tienen preferencia por una marca de caf.

Solucin con el test G: Marca de caf A 27 23 B 19 23 Total 46 46

Frecuencia Observada Esperada

Para la primera celda el valor es:27 ln 27 = 4,33 23

Para la segunda celda el valor es: 19 ln 19 = 3,63 23

Estadstico de prueba G: G = 2 = 2 (4,33 3,63) = 1,4 obs* = 0,2367

El resultado y conclusiones son equivalentes al de la prueba anterior.

Estadstica Aplicada a las Ciencias Sociales-Casos y problemas resueltos Inferencia No paramtrica: Contrastes de asociacin de variables categricas Patricio Alcano Martnez Derechos Reservados

22

Caso 14: Salud, ejercicio y sexoSe investiga en una muestra aleatoria de personas algunas variables de sus hbitos de vida, para lo cual se han recogido datos de las siguientes variables:X1 = Estado general de salud (4 = muy bueno; 3 = bueno; 2 = regular; 1 = malo) X 2 = Sexo (1 = femenino; 2 = masculino). X 3 = Nivel de ejercicio diario (0 = Ninguno; 1 = Moderado y 2 = Intenso).

Con las tablas de contingencia correspondientes, fueron calculados los siguientes estadsticos Chi-cuadrado para contrastes de asociacin:14.1. 2 ( X1 , X 2 ) = 8,2 14.2. 2 ( X 2 , X 3 ) = 4,6 14.3. 2 ( X1 , X 3 ) = 6,2

Con esta informacin, analice y construya una conclusin al 5% para cada una de las parejas de variables.

Solucin: Calculando los valores p de cada estadstico, se tiene: 14.1. 2 ( X1 , X 2 ) = 8,22 Esta tabla tiene 3 grados de libertad. Entonces, * = P( p; 3 > 8,2) = 0,0421

Se rechaza H0, al 5%. Conclusin: El estado general de salud est asociado al sexo (p = 0,0421).

14.2. 2 ( X 2 , X 3 ) = 4,62 Esta tabla tiene 2 grados de libertad. Entonces, * = P( p; 2 > 4,6) = 0,1003

No se rechaza H0, al 5%. Conclusin: El nivel de ejercicio diario es independiente del sexo (p = 1003).

14.3. 2 ( X1 , X 3 ) = 6,22 Esta tabla tiene 6 grados de libertad. Entonces, * = P( p; 3 > 8,2) = 0,4012

No se rechaza H0, al 5%. Conclusin: El estado general de salud es independiente del nivel de ejercicio diario (p = 0,4012).

PROBABILIDAD p DE LA DISTRIBUCIN CHI CUADRADA A LA DERECHA DE i20

p

i23 40,1847 0,1712 0,1586 0,1468 0,1359 0,1257 0,1162 0,1074 0,0992 0,0916 0,0845 0,0780 0,0719 0,0663 0,0611 0,0563 0,0518 0,0477 0,0439 0,0404 0,0372 0,0342 0,0314 0,0289 0,0266 0,0244 0,0224 0,0206 0,0189 0,0174

2

2; p0,2 0,4 0,6 0,8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 3,6 3,8 4,0 4,2 4,4 4,6 4,8 5,0 5,2 5,4 5,6 5,8 6,0

GRADOS DE LIBERTAD 10,6547 0,5271 0,4386 0,3711 0,3173 0,2733 0,2367 0,2059 0,1797 0,1573 0,1380 0,1213 0,1069 0,0943 0,0833 0,0736 0,0652 0,0578 0,0513 0,0455 0,0404 0,0359 0,0320 0,0285 0,0253 0,0226 0,0201 0,0180 0,0160 0,0143

20,9048 0,8187 0,7408 0,6703 0,6065 0,5488 0,4966 0,4493 0,4066 0,3679 0,3329 0,3012 0,2725 0,2466 0,2231 0,2019 0,1827 0,1653 0,1496 0,1353 0,1225 0,1108 0,1003 0,0907 0,0821 0,0743 0,0672 0,0608 0,0550 0,0498

30,9776 0,9402 0,8964 0,8495 0,8013 0,7530 0,7055 0,6594 0,6149 0,5724 0,5319 0,4936 0,4575 0,4235 0,3916 0,3618 0,3340 0,3080 0,2839 0,2615 0,2407 0,2214 0,2035 0,1870 0,1718 0,1577 0,1447 0,1328 0,1218 0,1116

40,9953 0,9825 0,9631 0,9384 0,9098 0,8781 0,8442 0,8088 0,7725 0,7358 0,6990 0,6626 0,6268 0,5918 0,5578 0,5249 0,4932 0,4628 0,4337 0,4060 0,3796 0,3546 0,3309 0,3084 0,2873 0,2674 0,2487 0,2311 0,2146 0,1991

50,9991 0,9953 0,9880 0,9770 0,9626 0,9449 0,9243 0,9012 0,8761 0,8491 0,8208 0,7915 0,7614 0,7308 0,7000 0,6692 0,6386 0,6083 0,5786 0,5494 0,5210 0,4934 0,4666 0,4408 0,4159 0,3920 0,3690 0,3471 0,3262 0,3062

60,9998 0,9989 0,9964 0,9921 0,9856 0,9769 0,9659 0,9526 0,9371 0,9197 0,9004 0,8795 0,8571 0,8335 0,8088 0,7834 0,7572 0,7306 0,7037 0,6767 0,6496 0,6227 0,5960 0,5697 0,5438 0,5184 0,4936 0,4695 0,4460 0,4232

2; p6,2 6,4 6,6 6,8 7,0 7,2 7,4 7,6 7,8 8,0 8,2 8,4 8,6 8,8 9,0 9,2 9,4 9,6 9,8 10,0 10,2 10,4 10,6 10,8 11,0 11,2 11,4 11,6 11,8 12,0

GRADOS DE LIBERTAD 10,0128 0,0114 0,0102 0,0091 0,0082 0,0073 0,0065 0,0058 0,0052 0,0047 0,0042 0,0038 0,0034 0,0030 0,0027 0,0024 0,0022 0,0019 0,0017 0,0016 0,0014 0,0013 0,0011 0,0010 0,0009 0,0008 0,0007 0,0007 0,0006 0,0005

20,0450 0,0408 0,0369 0,0334 0,0302 0,0273 0,0247 0,0224 0,0202 0,0183 0,0166 0,0150 0,0136 0,0123 0,0111 0,0101 0,0091 0,0082 0,0074 0,0067 0,0061 0,0055 0,0050 0,0045 0,0041 0,0037 0,0033 0,0030 0,0027 0,0025

50,2872 0,2692 0,2521 0,2359 0,2206 0,2062 0,1926 0,1797 0,1676 0,1562 0,1456 0,1355 0,1261 0,1173 0,1091 0,1013 0,0941 0,0874 0,0811 0,0752 0,0698 0,0647 0,0599 0,0555 0,0514 0,0476 0,0440 0,0407 0,0376 0,0348

60,4012 0,3799 0,3594 0,3397 0,3208 0,3027 0,2854 0,2689 0,2531 0,2381 0,2238 0,2102 0,1974 0,1851 0,1736 0,1626 0,1523 0,1425 0,1333 0,1247 0,1165 0,1088 0,1016 0,0948 0,0884 0,0824 0,0768 0,0715 0,0666 0,0620

0,1023 0,0937 0,0858 0,0786 0,0719 0,0658 0,0602 0,0550 0,0503 0,0460 0,0421 0,0384 0,0351 0,0321 0,0293 0,0267 0,0244 0,0223 0,0203 0,0186 0,0169 0,0155 0,0141 0,0129 0,0117 0,0107 0,0097 0,0089 0,0081 0,0074

Elaborada con funcin DISTR.CHI(x;grados_de_libertad) de Excel. Gentileza ALKAYNO S. A. 2011. Derechos Reservados.

Tabla Chi-cuadradoPROBABILIDAD p DE LA DISTRIBUCIN CHI CUADRADA A LA DERECHA DE i20

p

i23 0,1068 0,1023 0,0979 0,0937 0,0897 0,0858 0,0821 0,0786 0,0752 0,0719 0,0688 0,0658 0,0629 0,0602 0,0576 0,0550 0,0526 0,0503 0,0481 0,0460 0,0440 0,0421 0,0402 0,0384 0,0367 0,0351 0,0336 0,0321 0,0307 0,0293

22 p;

2 p;

GRADOS DE LIBERTAD 1 0,7518 0,6547 0,5839 0,5271 0,4795 0,4386 0,4028 0,3711 0,3428 0,3173 0,2943 0,2733 0,2542 0,2367 0,2207 0,2059 0,1923 0,1797 0,1681 0,1573 0,1473 0,1380 0,1294 0,1213 0,1138 0,1069 0,1003 0,0943 0,0886 0,0833 2 0,9512 0,9048 0,8607 0,8187 0,7788 0,7408 0,7047 0,6703 0,6376 0,6065 0,5769 0,5488 0,5220 0,4966 0,4724 0,4493 0,4274 0,4066 0,3867 0,3679 0,3499 0,3329 0,3166 0,3012 0,2865 0,2725 0,2592 0,2466 0,2346 0,2231 3 0,9918 0,9776 0,9600 0,9402 0,9189 0,8964 0,8732 0,8495 0,8254 0,8013 0,7771 0,7530 0,7291 0,7055 0,6823 0,6594 0,6369 0,6149 0,5934 0,5724 0,5519 0,5319 0,5125 0,4936 0,4753 0,4575 0,4402 0,4235 0,4073 0,3916

2 p;

GRADOS DE LIBERTAD 1 0,0783 0,0736 0,0693 0,0652 0,0614 0,0578 0,0544 0,0513 0,0483 0,0455 0,0429 0,0404 0,0381 0,0359 0,0339 0,0320 0,0302 0,0285 0,0269 0,0253 0,0239 0,0226 0,0213 0,0201 0,0190 0,0180 0,0170 0,0160 0,0151 0,0143 2 0,2122 0,2019 0,1920 0,1827 0,1738 0,1653 0,1572 0,1496 0,1423 0,1353 0,1287 0,1225 0,1165 0,1108 0,1054 0,1003 0,0954 0,0907 0,0863 0,0821 0,0781 0,0743 0,0707 0,0672 0,0639 0,0608 0,0578 0,0550 0,0523 0,0498 3 0,3765 0,3618 0,3476 0,3340 0,3208 0,3080 0,2957 0,2839 0,2725 0,2615 0,2509 0,2407 0,2308 0,2214 0,2123 0,2035 0,1951 0,1870 0,1793 0,1718 0,1646 0,1577 0,1511 0,1447 0,1386 0,1328 0,1272 0,1218 0,1166 0,1116

2; p6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8,0 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9 9,0

GRADOS DE LIBERTAD 1 0,0135 0,0128 0,0121 0,0114 0,0108 0,0102 0,0096 0,0091 0,0086 0,0082 0,0077 0,0073 0,0069 0,0065 0,0062 0,0058 0,0055 0,0052 0,0049 0,0047 0,0044 0,0042 0,0040 0,0038 0,0036 0,0034 0,0032 0,0030 0,0029 0,0027 2 0,0474 0,0450 0,0429 0,0408 0,0388 0,0369 0,0351 0,0334 0,0317 0,0302 0,0287 0,0273 0,0260 0,0247 0,0235 0,0224 0,0213 0,0202 0,0193 0,0183 0,0174 0,0166 0,0158 0,0150 0,0143 0,0136 0,0129 0,0123 0,0117 0,0111

GRADOS DE LIBERTAD 1 0,0026 0,0024 0,0023 0,0022 0,0021 0,0019 0,0018 0,0017 0,0017 0,0016 0,0015 0,0014 0,0013 0,0013 0,0012 0,0011 0,0011 0,0010 0,0010 0,0009 0,0009 0,0008 0,0008 0,0007 0,0007 0,0007 0,0006 0,0006 0,0006 0,0005 2 0,0106 0,0101 0,0096 0,0091 0,0087 0,0082 0,0078 0,0074 0,0071 0,0067 0,0064 0,0061 0,0058 0,0055 0,0052 0,0050 0,0047 0,0045 0,0043 0,0041 0,0039 0,0037 0,0035 0,0033 0,0032 0,0030 0,0029 0,0027 0,0026 0,0025 3 0,0280 0,0267 0,0256 0,0244 0,0233 0,0223 0,0213 0,0203 0,0194 0,0186 0,0177 0,0169 0,0162 0,0155 0,0148 0,0141 0,0135 0,0129 0,0123 0,0117 0,0112 0,0107 0,0102 0,0097 0,0093 0,0089 0,0085 0,0081 0,0077 0,0074

0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0

3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0

9,1 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9 10,0 10,1 10,2 10,3 10,4 10,5 10,6 10,7 10,8 10,9 11,0 11,1 11,2 11,3 11,4 11,5 11,6 11,7 11,8 11,9 12,0

Elaborada con funcin DISTR.CHI(x;grados_de_libertad) de Excel. Gentileza ALKAYNO S. A. 2011. Derechos Reservados.

Distribucin Chi Cuadrado - PercentilesValores de

2

tales que la probabilidad sea menor o igual a la especificada (*).

0

i20,85 2,07 3,79 5,32 6,74 8,12 9,45 10,75 12,03 13,29 14,53 15,77 16,99 18,20 19,41 20,60 21,79 22,98 24,16 25,33 26,50 27,66 28,82 29,98 31,13 32,28 37,99 43,64 49,24 54,81 60,35 71,34 82,26 93,11 103,90 114,66 0,90 2,71 4,61 6,25 7,78 9,24 10,64 12,02 13,36 14,68 15,99 17,28 18,55 19,81 21,06 22,31 23,54 24,77 25,99 27,20 28,41 29,62 30,81 32,01 33,20 34,38 40,26 46,06 51,81 57,51 63,17 74,40 85,53 96,58 107,6 118,50

20,925 3,17 5,18 6,90 8,50 10,01 11,47 12,88 14,27 15,63 16,97 18,29 19,60 20,90 22,18 23,45 24,72 25,97 27,22 28,46 29,69 30,92 32,14 33,36 34,57 35,78 41,76 47,66 53,50 59,29 65,03 76,41 87,68 98,86 109,97 121,02 0,95 3,84 5,99 7,81 9,49 11,07 12,59 14,07 15,51 16,92 18,31 19,68 21,03 22,36 23,68 25,00 26,30 27,59 28,87 30,14 31,41 32,67 33,92 35,17 36,42 37,65 43,77 49,80 55,76 61,66 67,50 79,08 90,53 101,9 113,2 124,34 0,975 5,02 7,38 9,35 11,14 12,83 14,45 16,01 17,53 19,02 20,48 21,92 23,34 24,74 26,12 27,49 28,85 30,19 31,53 32,85 34,17 35,48 36,78 38,08 39,36 40,65 46,98 53,20 59,34 65,41 71,42 83,30 95,02 106,6 118,1 129,56 0,99 6,63 9,21 11,34 13,28 15,09 16,81 18,48 20,09 21,67 23,21 24,73 26,22 27,69 29,14 30,58 32,00 33,41 34,81 36,19 37,57 38,93 40,29 41,64 42,98 44,31 50,89 57,34 63,69 69,96 76,15 88,38 100,4 112,3 124,1 135,81 0,995 7,88 10,60 12,84 14,86 16,75 18,55 20,28 21,95 23,59 25,19 26,76 28,30 29,82 31,32 32,80 34,27 35,72 37,16 38,58 40,00 41,40 42,80 44,18 45,56 46,93 53,67 60,27 66,77 73,17 79,49 91,95 104,2 116,3 128,3 140,17

Grados de libertad

0,005 0,00 0,01 0,07 0,21 0,41 0,68 0,99 1,34 1,73 2,16 2,60 3,07 3,57 4,07 4,60 5,14 5,70 6,26 6,84 7,43 8,03 8,64 9,26 9,89 10,52 13,79 17,19 20,71 24,31 27,99 35,53 43,28 51,17 59,20 67,33

0,01 0,00 0,02 0,11 0,30 0,55 0,87 1,24 1,65 2,09 2,56 3,05 3,57 4,11 4,66 5,23 5,81 6,41 7,01 7,63 8,26 8,90 9,54 10,20 10,86 11,52 14,95 18,51 22,16 25,90 29,71 37,48 45,44 53,54 61,75 70,06

0,025 0,00 0,05 0,22 0,48 0,83 1,24 1,69 2,18 2,70 3,25 3,82 4,40 5,01 5,63 6,26 6,91 7,56 8,23 8,91 9,59 10,28 10,98 11,69 12,40 13,12 16,79 20,57 24,43 28,37 32,36 40,48 48,76 57,15 65,65 74,22

0,05 0,00 0,10 0,35 0,71 1,15 1,64 2,17 2,73 3,33 3,94 4,57 5,23 5,89 6,57 7,26 7,96 8,67 9,39 10,12 10,85 11,59 12,34 13,09 13,85 14,61 18,49 22,47 26,51 30,61 34,76 43,19 51,74 60,39 69,13 77,93

0,10 0,02 0,21 0,58 1,06 1,61 2,20 2,83 3,49 4,17 4,87 5,58 6,30 7,04 7,79 8,55 9,31 10,09 10,86 11,65 12,44 13,24 14,04 14,85 15,66 16,47 20,60 24,80 29,05 33,35 37,69 46,46 55,33 64,28 73,29 82,36

0,15 0,04 0,33 0,80 1,37 1,99 2,66 3,36 4,08 4,82 5,57 6,34 7,11 7,90 8,70 9,50 10,31 11,12 11,95 12,77 13,60 14,44 15,28 16,12 16,97 17,82 22,11 26,46 30,86 35,29 39,75 48,76 57,84 66,99 76,20 85,44

0,20 0,06 0,45 1,01 1,65 2,34 3,07 3,82 4,59 5,38 6,18 6,99 7,81 8,63 9,47 10,31 11,15 12,00 12,86 13,72 14,58 15,44 16,31 17,19 18,06 18,94 23,36 27,84 32,34 36,88 41,45 50,64 59,90 69,21 78,56 87,95

0,30 0,15 0,71 1,42 2,19 3,00 3,83 4,67 5,53 6,39 7,27 8,15 9,03 9,93 10,82 11,72 12,62 13,53 14,44 15,35 16,27 17,18 18,10 19,02 19,94 20,87 25,51 30,18 34,87 39,58 44,31 53,81 63,35 72,92 82,51 92,13

0,40 0,27 1,02 1,87 2,75 3,66 4,57 5,49 6,42 7,36 8,30 9,24 10,18 11,13 12,08 13,03 13,98 14,94 15,89 16,85 17,81 18,77 19,73 20,69 21,65 22,62 27,44 32,28 37,13 42,00 46,86 56,62 66,40 76,19 85,99 95,81

0,50 0,45 1,39 2,37 3,36 4,35 5,35 6,35 7,34 8,34 9,34 10,34 11,34 12,34 13,34 14,34 15,34 16,34 17,34 18,34 19,34 20,34 21,34 22,34 23,34 24,34 29,34 34,34 39,34 44,34 49,33 59,33 69,33 79,33 89,33 99,33

0,60 0,71 1,83 2,95 4,04 5,13 6,21 7,28 8,35 9,41 10,47 11,53 12,58 13,64 14,69 15,73 16,78 17,82 18,87 19,91 20,95 21,99 23,03 24,07 25,11 26,14 31,32 36,47 41,62 46,76 51,89 62,13 72,36 82,57 92,76 102,95

0,70 1,07 2,41 3,66 4,88 6,06 7,23 8,38 9,52 10,66 11,78 12,90 14,01 15,12 16,22 17,32 18,42 19,51 20,60 21,69 22,77 23,86 24,94 26,02 27,10 28,17 33,53 38,86 44,16 49,45 54,72 65,23 75,69 86,12 96,52 106,91

0,80 1,64 3,22 4,64 5,99 7,29 8,56 9,80 11,03 12,24 13,44 14,63 15,81 16,98 18,15 19,31 20,47 21,61 22,76 23,90 25,04 26,17 27,30 28,43 29,55 30,68 36,25 41,78 47,27 52,73 58,16 68,97 79,71 90,41 101,1 111,67

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 30 35 40 45 50 60 70 80 90 100

Valores calculados usando la funcin PRUEBA.CHI.INV() de Excel. Gentileza ALKAYNO S. A. 2011. Derechos Reservados.