Ejercicios_Inferencia_resueltos

  • Upload
    cacatu

  • View
    10

  • Download
    0

Embed Size (px)

Citation preview

  • 1

    Examen de junio de 2011

    15. Indica cul de las siguientes afirmaciones es correcta:

    a. Para los estimadores insesgados el error cuadrtico medio es menor que la varianza. b. Todo estimador insesgado es mximo verosmil, aunque no todo estimador mximo verosmil es insesgado. c. Entre dos estimadores sesgados, el que tenga menor varianza tendr menor error cuadrtico medio. d. Entre dos estimadores sesgados, el que tenga menor sesgo tendr menor error cuadrtico medio. e. Entre dos estimadores insesgados, el que tenga menor varianza tendr menor error cuadrtico medio. a es falsa, ya que ECM=Varianza + Sesgo2, por lo que ser mayor o igual, no menor. b es falsa, para una variable normal S2 es un estimador insesgado de 2,pero no es mximo verosimil. c es falsa, ya que depende de lo grande que sea el sesgo de cada uno de los estimadores (no dice que sea iguales). d es falsa, ya que falta saber lo que vale la varianza de cada uno de los estimadores. e es cierta, ya que para los estimadores insesgados el ECM coincide con la varianza

    Enunciado comn para las preguntas 19 y 20: El tiempo de reaccin ante un estmulo visual (TR) es, para los individuos sanos, una variable normal con media = 0,4 y desviacin tpica = 0,05. Hemos tomado una muestra formada por 16 individuos diagnosticados de adiccin a los juegos electrnicos (JE), para los que la media muestral de TR ha resultado igual a 0,5, con una desviacin tpica muestral igual a 0,15.

    19. Con una significacin del 5%, concluimos:

    a. No hay diferencia significativa en la media de TR para los individuos sanos y las adictos a los JE. b. La adiccin a los JE incrementa de manera significativa el valor medio de TR. c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que el valor medio de TR es igual

    para los individuos sanos y los adictos a los JE. d. El TR medio para los adictos a los JE est entre 0,42 y 0,58 segundos. e. b y d son ciertas.

    IC5% ( ) = 0,5 z0,0250,1516

    = 0,51,96!0,0375= 0,50,0735= 0,43; 0,57"# $%

    Como 0,4 queda por debajo del intervalo de confianza podemos decir que la media de TR para los adictos a los JE es significativamente menor que para los individuos sanos. d es falsa por ser demasiado categrica, no podemos afirmar que el TR medio de los adictos a los JE est dentro del intervalo, slo podemos decir que tenemos una confianza del 95% de que lo est.

    20. Si estamos interesados en contrastar la hiptesis de que la media de TR para los adictos a JE sigue siendo 0,4 frente a que dicha media es diferente de 0,4, indica cul de los siguientes valores te parece ms adecuado para el p-value:

    a. 0,0176 Hemos visto que para una significacin del 5% el intervalo de confianza es [0,42; 0,58]. Para alcanzar en el extremo del intervalo el valor 0,4 deberamos ensanchar un poco el intervalo, es decir, debera disminuir un poco, es decir, el p-value es un poco menor que 0,05.

    b. 0,0505 c. 0,1623 d. 0,0005 e. 0,9410

    21. Estamos interesados en comparar el tiempo de reaccin ante cierto estmulo (TR) entre hombres y mujeres, para lo que hemos tomado una muestra formada por 20 hombres y 20 mujeres, obteniendo una media muestral igual a 0,40 para los hombres y 0,38 para las mujeres, siendo las varianzas muestrales 0,00009 y 0,00011, respectivamente. Asumimos que ambas variables son normales, con la misma varianza, aunque esta es desconocida. Si = 0,05, podemos concluir:

    a. No hay diferencia significativa en la media de TR para los hombres y las mujeres. b. La adiccin a los JE incrementa de manera significativa el valor medio de TR. c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que el valor medio de TR es igual

    para los hombres y las mujeres. d. El TR medio para los hombres es significativamente mayor que para las mujeres. e. a y c son ciertas. Comparacin de dos medias con varianzas desconocidas, pero iguales, con dos muestras normales independientes.

    01,00001,00001,038

    00011,01900009,0192 ===+= pp SS

    ( ) [ ]0336,0;0136,00064,002,000316,00244,202,0201

    20101,038,040,0 025,0;38%5 ===+= tIC MH

    El intervalo no contiene al cero y ambos extremos son positivos, por lo que la diferencia es significativamente positiva, es decir la media de TR es significativamente mayor para los hombres que para las mujeres.

  • 2

    22. Queremos estudiar si cierta intervencin afecta al tiempo de reaccin ante cierto estmulo (TR), para lo que hemos tomado una muestra formada por 16 individuos para los que se ha medido el TR antes y despus de la intervencin. El intervalo de confianza para la diferencia de medias ha resultado: ( ) [ ]02,0;01,0%5 = ADIC . Si = 0,05, podemos concluir:

    a. La intervencin no afecta de manera significativa a la media de TR. b. El TR es significativamente mayor despus de la intervencin que antes de la misma. c. Hemos encontrado una evidencia lo suficientemente fuerte para rechazar la igualdad en el valor medio de TR

    antes y despus de la intervencin, en favor de una disminucin del mismo despus de la intervencin. d. La intervencin reduce el TR. e. La intervencin aumenta el TR. Comparacin de dos medias con datos pareados. El intervalo no contiene al cero y ambos extremos son positivos, por lo que la diferencia es significativamente positiva, es decir la media de TR despus de la intervencin es significativamente mayor que antes de la misma. e es falsa por ser demasiado categrica. Tenemos una evidencia fuerte de que la intervencin incrementa el valor medio de TR, pero no podemos afirmarlo. Adems, en e no se menciona el valor medio de TR, sino de TR.

    Enunciado comn para las preguntas 23, 24, 25 y 26: En una clnica tienen 3 especialidades diferentes: {A, B, C} y estn interesados en saber si la proporcin de pacientes que acuden a consulta es la misma para las tres especialidades. Para ello toma una muestra aleatoria de 120 pacientes, de los que 30 eran de la especialidad A, 35 de la especialidad B y 55 de la especialidad C.

    23. Indica cul de las siguientes afirmaciones resume las conclusiones que se pueden alcanzar con los resultados obtenidos para los 120 coches:

    a. Para = 0,05 aceptamos la igualdad de proporciones, pero para = 0,01 la rechazamos. b. Para = 0,05 rechazamos la igualdad de proporciones, pero para = 0,01 la aceptamos. c. Aceptamos la igualdad de proporciones tanto para = 0,05 como para = 0,01. d. Rechazamos la igualdad de proporciones tanto para = 0,05 como para = 0,01. e. No podemos contestar a la pregunta por no conocer el p-value del contraste.

    H0: pA=pB=pC=1/3; Si H0 d~22; 99,52 05,0;2 = ; 21,9201,0;2 =

    A B C ( ) ( ) ( ) 75,8

    404055

    404035

    404030 222

    =

    +

    +

    =d O 30 35 55 T 40 40 40

    d est entre ambos lmites, por lo que con = 0,05 rechazamos H0 y con = 0,01 la aceptamos.

    24. De entre los siguientes valores, Cul te parece ms creble para ser el p-value del contraste del ejercicio 23?:

    a. 0,045 d est entre 5,99 y 9,21, pero est ms cerca de 9,21, por lo que el p-value estar entre 0,05 y 0,01, pero ms cerca de 0,01. b. 0,472

    c. 0,875 d. 0,013 e. 0,002

    25. Entre los 30 de la especialidad A 20 eran hombres y 10 eran mujeres; Entre los 35 de la especialidad B 25 eran hombres y 10 eran mujeres; Entre los 55 de la especialidad C 27 eran hombres y 28 eran mujeres. Con estos datos y para una significacin = 0,05, podemos decir:

    a. Hemos encontrado una evidencia fuerte que nos permite rechazar la independencia entre el sexo del paciente y la especialidad a la que acude.

    b. Hemos encontrado una relacin significativa entre el sexo del paciente y la especialidad a la que acude c. Aceptamos que la especialidad a la que acude el paciente no depende de su sexo. d. Las respuestas a y b son correctas. e. Ninguna de las respuestas anteriores es correcta.

    H0: La especialidad es independiente del sexo; Si H0 d~22; 99,52 05,0;2 =

    Obs A B C Teo A B C ( ) ( ) 19,5222228

    181820 22

    =

    ++

    = d

    d es menor que el valor crtico, por lo que aceptamos la hiptesis nula.

    H 20 25 27 72 H 18 21 33 M 10 10 28 48 M 12 14 22 30 35 55 120

  • 3

    26. De entre los siguientes valores, Cul te parece ms creble para ser el p-value del contraste del ejercicio 25?:

    a. 0,075 d est un poco por debajo de 5,99, por lo que el p-value ser un poco mayor que 0,05. b. 0,175 c. 0,045 d. 0,015 e. 0,475

    27. Queremos estimar la proporcin de empresas en las cuales la Direccin General es ocupada por una mujer, asegurando que la probabilidad de cometer un error de estimacin mayor que 0,05 sea menor que 0,10 y asumiendo que dicha proporcin nunca sobrepasar el 30%

    De los siguientes valores, cul se aproxima ms al tamao muestral mnimo necesario para asegurar nuestro objetivo?

    a. 81 Tamao muestral para estimar una proporcin con =0,1 y d=0,05. Como sabemos que p no supera el 30%, el peor de los casos es p=0,3.

    ( ) ( ) 2283,22721,005,06449,13,013,0

    05,01

    2205,0

    22 =

    =

    =

    =

    zpp

    dz

    n

    b. 664 c. 228 d. 558 e. 271

    28. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, resulta: ( ) [ ]32,1;21,4%5 = YXIC , la conclusin para dicho resultado es:

    a. Aceptamos que ambas medias son iguales. b. No podemos contestar a la pregunta si no conocemos el p-value. c. La media de X es significativamente mayor que la de Y. d. La media de X es significativamente menor que la de Y. e. Ninguna de las anteriores afirmaciones es correcta.

    Hemos encontrado una evidencia muy fuerte de que 0

  • 4

    Enunciado comn para las preguntas 20 y 21: La concentracin de estrona en plasma libre es, para los varones sanos, una variable normal con media = 45. Hemos tomado una muestra formada por 25 varones sanos afectados de stress postvacacional, para los que la media muestral de la concentracin de estrona en plasma libre ha resultado igual a 40, con una desviacin tpica muestral igual a 14.

    20. Con una significacin del 5%, concluimos:

    a. No hay diferencia significativa en la media de la concentracin de estrona en plasma libre para los varones sanos y los afectados por el sndrome postvacacional.

    b. El sndrome postvacacional reduce de manera significativa la concentracin media de estrona en plasma libre.

    c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que la media de la concentracin de estrona en plasma libre es igual para los varones sanos y los afectados de sndrome postvacacional.

    d. La concentracin media de estrona en plasma libre para los varones sanos afectados por el sndrome postvacacional est entre 34,2 y 45,8 unidades.

    e. a y c son ciertas. Construimos el intervalo de confianza para la media de la concentracin para los afectados del sndrome:

    ( ) [ ]8,45;2,3478,5408,20639,24051440 025,0;242; ===== tn

    StXIC n

    Al estar 45 dentro del intervalo, la diferencia de medias no es significativa, es decir, a es cierta. Otra forma de decirlo es indicar que no hemos encontrado una evidencia lo suficientemente fuerte para rechazar la igualdad de medias, es decir, c tambin es cierta, con lo que la opcin correcta es la e.

    d no es correcta por ser demasiado categrica, slo podemos decir que tenemos una confianza del 95% en que la concentracin media de estrona en plasma libre para los varones sanos afectados por el sndrome postvacacional est entre 34,2 y 45,8 unidades.

    21. Si estamos interesados en contrastar la hiptesis de que la media de la concentracin de estrona en plasma libre para los varones sanos afectados de sndrome postvacacional sigue siendo 45 frente a que dicha media es diferente de 45, indica cul de los siguientes valores es ms adecuado para el p-value:

    a. 0,087 El intervalo de confianza del ejercicio 20 nos muestra que el extremo superior excede en poco de 45, por lo que el p-value pedido ser un poco mayor que 0,05, con lo que la opcin correcta es la a.

    b. 0,045 c. 0,450 d. 0,001 e. 0,941

    Enunciado comn para las preguntas 22, 23, 24: Entre los asistentes a un tipo de cursos hay Peones, Especialistas y Tcnicos. Se ha tomado una muestra al azar formada por 67 alumnos, de los cuales 22 son Peones, 31 son Especialistas y 14 son Tcnicos y estamos interesados en saber si las proporciones poblacionales de alumnos en las tres categoras son las iguales.

    Pen Especialista Tcnico O 22 31 14 T 22.333 22.333 22.333 d 0.005 3.363 3.109 d = 6.478

    22. Indica cul de las siguientes afirmaciones resume las conclusiones que se pueden alcanzar con los resultados obtenidos para la muestra de 67 alumnos:

    a. Para = 0,05 rechazamos la igualdad de proporciones, pero para = 0,01 la aceptamos. b. Para = 0,05 aceptamos la igualdad de proporciones, pero para = 0,01 la rechazamos. c. Aceptamos la igualdad de proporciones tanto para = 0,05 como para = 0,01. d. Rechazamos la igualdad de proporciones tanto para = 0,05 como para = 0,01. e. No podemos contestar a la pregunta por no conocer el p-value del contraste.

    Como 99,52 05,0;2 = y 21,9201,0;2 = y d est entre ambos valores, la opcin a es correcta.

  • 5

    23. De entre los siguientes valores, Cul es ms creble para ser el p-value del contraste del ejercicio 22?: a. 0,055

    Al estar 6,48 entre 7,38 y 5,99, el p-value estar entre 0,025 y 0,05, con lo que slo puede ser la opcin d.

    b. 0,012 c. 0,648 d. 0,039 e. 0,002

    24. Entre los 22 peones 16 son hombres y 6 son mujeres; Entre los 31 especialistas 20 son hombres y 11 son mujeres; Entre los 14 tcnicos 6 son hombres y 8 son mujeres. Con estos datos y para una significacin = 0,05, podemos decir:

    a. Hemos encontrado una evidencia fuerte que nos permite rechazar que el sexo se distribuya igual entre los alumnos de las tres categoras.

    b. Hemos encontrado una relacin significativa entre el sexo de los alumnos y su categora. c. Aceptamos que la categora del alumno no depende de su sexo. d. Las respuestas a y b son correctas. e. Ninguna de las respuestas anteriores es correcta.

    O Pen Especialista Tcnico H 16 20 6 42

    M 6 11 8 25

    22 31 14 67

    T Pen Especialista Tcnico H 13.79 19.43 8.78 42

    M 8.21 11.57 5.22 25

    22 31 14 67

    d = 0,35+0,02+0,88+0,59+0,03+1,48 = 3,35

    Al ser 99,52 05,0;2 = , aceptamos la hiptesis nula, que es la independencia, que es lo que se indica en la opcin c.

    25. Queremos estimar la concentracin media de estrona en plasma libre para los varones sanos de cierta poblacin, para lo cual tomaremos una muestra aleatoria. Asumimos que la variable a estudiar es normal, aunque desconocemos tanto su media como su desviacin tpica. A partir de una muestra preliminar obtenemos una estimacin de 14 unidades para la desviacin tpica de la variable de inters.

    Si queremos asegurar que la probabilidad de cometer un error de estimacin para la media mayor que 3 unidades sea menor que 0,01, de los siguientes valores, cul se aproxima ms al tamao muestral mnimo necesario para asegurar nuestro objetivo?

    a. 145 145n ==

    =

    = 49,144

    3145758,2

    314 22201,0

    22 zdz

    n b. 59

    c. 84 d. 531 e. 1301

    Otros ejercicios

    3. Para cierta especie animal se asume que el peso al nacer es, en condiciones normales, una variable normal con media 3 Kg. Se toma una muestra formada por 100 hembras embarazadas, a las que se les ha administrado una alimentacin especial durante todo el embarazo, se pesa a sus cachorros al nacer, y se construye el intervalo de confianza para el peso medio de los mismos, en Kg, obteniendo el siguiente resultado: ( ) [ ]0,4;8,2%5 =IC (se entiende que trabajamos con una significacin del 5%).

    3.a El peso medio de los cachorros de la muestra es: =X (2,8+4)/2 = 3,4 Kg. 3.b Indica cual o cuales de las siguientes afirmaciones son ciertas:

    F La alimentacin especial tiene un efecto significativo sobre el peso medio al nacer de los cachorros. F El peso medio al nacer de los cachorros cuyas madres se han sometido a la alimentacin especial es

    significativamente mayor que el de las que no se han sometido a dicha alimentacin especial. V No hemos encontrado una evidencia lo suficientemente fuerte como para rechazar que el peso medio al

    nacer de los cachorros cuyas madres se someten a una alimentacin especial durante el embarazo es igual a 3 Kg.

    F Podemos asegurar que el someter a las madres a la alimentacin especial no afecta al peso medio al nacer de los cachorros.

  • 6

    F Si hacemos el contraste de hiptesis bilateral cuya hiptesis nula es que el peso medio al nacer de los cachorros cuya madre ha sido sometida a la alimentacin especial es igual a 3 Kg, el p-value correspondiente a dicho contraste ser menor que 0,05.

    V Si hacemos el contraste de hiptesis bilateral cuya hiptesis nula es que el peso medio al nacer de los cachorros cuya madre ha sido sometida a la alimentacin especial es igual a 3 Kg, el p-value correspondiente a dicho contraste ser mayor que 0,05.

    Como el peso al nacer en condiciones normales, 3 Kg, est incluido en el intervalo, no podemos rechazar que este sea tambin el peso medio al nacer para los cachorros a cuya madre se le ha administrado una alimentacin especial durante el embarazo. El efecto de la alimentacin especial, si lo hay, no es significativo. La afirmacin 4 tiene trampa. El truco est en que es una frase demasiado categrica. A partir del intervalo podemos aceptar que someter a las madres a una alimentacin especial no afecta al peso medio de los cachorros al nacer, pero que aceptemos esto no significa que podamos asegurarlo, ya que hay un margen de error. Las dos ltimas afirmaciones son inmediatas si tenemos en cuenta que aceptamos la hiptesis nula slo cuando el valor implicado (en este caso 3 Kg) est incluido en el intervalo de confianza, en cuyo caso el p-value es mayor que 0,05.

    4. Tenemos dos estimadores *1 y *2 para un mismo parmetro, y sabemos que la varianza del primero es

    mayor que la del segundo, aunque ambos tienen el mismo error cuadrtico medio.

    El ECM es igual a la suma de la varianza y el cuadrado del sesgo. Como ambos tienen el mismo ECM, si la varianza de *1 es mayor que la de *2 , el sesgo al cuadrado de

    *2 ser menor que el de

    *1 , para compensar la diferencia.

    Indica cual o cuales de las siguientes afirmaciones son ciertas:

    F Podemos asegurar que *1 es insesgado. Ser ( ) ( )*2*1 SesgoSesgo < , pero no podemos asegurar que ( ) 0*1 =Sesgo .

    F Podemos asegurar que *2 es insesgado. Ser ( ) ( )*2*1 SesgoSesgo < , con lo que ( ) 0*2 >Sesgo .

    F Podemos asegurar que *1 es sesgado. Ser ( ) ( )*2*1 SesgoSesgo < , pero no podemos asegurar que ( ) 0*1 =Sesgo .

    V Podemos asegurar que *2 es sesgado. Al ser ( ) ( ) 0*1*2 > SesgoSesgo , ser ( ) 0*2 >Sesgo . F Podemos asegurar que ninguno de los dos estimadores es insesgado. No, ya que hemos visto que *2 es sesgado.

    F Podemos asegurar que el sesgo de *1 es mayor que el de *2 . Justo al revs.

    5. Para cierta especie animal, estamos interesados en estudiar el peso de los ejemplares de 6 meses de edad, en relacin con la dieta que han seguido, de entre dos alternativas, las dietas A y B. Para ello hemos tomado una muestra de 20 ejemplares a los que se ha alimentado con la dieta A y otra muestra de 25 ejemplares a los que se ha alimentado con la dieta B, obteniendo el intervalo de confianza para la diferencia de medias: ( ) [ ]3,4;8,1%5 = BAIC (se entiende que trabajamos con una significacin del 5%) Notamos que el intervalo de confianza no incluye al 0 y que ambos extremos son positivos, con lo que tenemos una evidencia fuerte de que la diferencia de medias es positiva o, lo que es lo mismo, el peso medio de los ejemplares de 6 meses alimentados con la dieta A es significativamente mayor que el peso medio de los ejemplares alimentados con la dieta B.

    5.a La diferencia entre las medias muestrales es: = BA XX (1,8+4,3)/2 = 3,05 Kg.

    5.b Indica cual o cuales de las siguientes afirmaciones son ciertas:

    F Aceptamos que el peso medio de los ejemplares de 6 meses alimentados con la dieta A es igual que el correspondiente a los alimentados con la dieta B. Falso, ya que slo aceptaramos la igualdad de medias si el 0 est dentro del intervalo de confianza.

    V El peso medio de los ejemplares alimentados con la dieta A es significativamente mayor que el correspondiente a los alimentados con la dieta B. Verdadero, ya que la diferencia de medias es positiva en todo el intervalo (ambos extremos positivos).

  • 7

    F El peso medio de los ejemplares alimentados con la dieta A es significativamente menor que el correspondiente a los alimentados con la dieta B. Falso, sera cierto si la diferencia de medias fuera negativa en todo el intervalo (ambos extremos negativos).

    V Si hacemos el contraste de hiptesis bilateral cuya hiptesis nula es que el peso medio de los ejemplares de 6 meses alimentados con la dieta A es el mismo que el correspondiente a los alimentados con la dieta B, el p-value correspondiente a dicho contraste ser menor que 0,05. Verdadero, ya que el intervalo de confianza no incluye al 0, con lo que rechazamos la igualdad de medias.

    F Si hacemos el contraste de hiptesis bilateral cuya hiptesis nula es que el peso medio de los ejemplares de 6 meses alimentados con la dieta A es el mismo que el correspondiente a los alimentados con la dieta B, el p-value correspondiente a dicho contraste ser mayor que 0,05. Falso, ya que el intervalo de confianza no incluye al 0, con lo que rechazamos la igualdad de medias.

    Ejercicios de clase

    4. Al contrastar la independencia entre el grado con que se presenta una enfermedad y ser hombre o mujer, mediante un test chi-2, hemos obtenido un p-value igual a 0,0344. Interpreta con claridad dicho resultado. Si trabajamos con una significatividad del 5%, rechazamos la independencia, es decir, existe una relacin significativa entre el sexo y el grado con que se presenta la enfermedad o, lo que es lo mismo, el grado con que se presenta la enfermedad se distribuye de una manera significativamente diferente entre los hombres y entre las mujeres.

    Si trabajamos con una significatividad del 1%, aceptamos la independencia, es decir, no hemos encontrado una evidencia lo suficientemente fuerte para rechazar la independencia o, lo que es lo mismo, no hay una relacin significativa entre el sexo del paciente y el grado con que se presenta la enfermedad (el grado con que se presenta la enfermedad se distribuye igual entre los hombres y entre las mujeres).

    5. Se sabe que de los individuos operados de cierta dolencia con la tcnica habitual el 40% recae y tiene que ser intervenido de nuevo. Se ha probado una tcnica alternativa sobre 115 individuos, de los cuales han recado 35.

    Con una significacin del 5%, podemos aceptar que la nueva tcnica es mejor que la tcnica habitual?, y con una significacin del 1%?.

    IC! p( ) = p z! 2p 1! p( )n

    IC5% p( ) =35115

    1,9635 115 1!35 115( )

    115= 0,3040,084 = 0,220; 0,388"# $%

    Con una significacin del 5%, cmo 0,40 no est dentro del intervalo, y este est por debajo de dicho valor, podemos decir que la proporcin de pacientes que recaen con la nueva tcnica es significativamente menor que el 40% que recae con la tcnica habitual.

    IC1% p( ) =35115

    2,5835 115 1!35 115( )

    115= 0,3040,111= 0,193; 0,415"# $%

    Con una significacin del 1%, cmo 0,40 est dentro del intervalo, no tenemos una evidencia lo suficientemente fuerte para rechazar que la proporcin de pacientes que recaen con la nueva tcnica es la misma que la correspondiente a la tcnica habitual, con lo que aceptamos la igualdad de proporciones.

  • 8

    7. En una zona subdesarrollada se toman muestras de heces en busca de un determinado parsito intestinal en 200 nios de los pueblos vecinos A y B (100 de cada pueblo). En A tienen una fuente en la plaza Mayor; en B tienen que ir a buscar el agua a una fuente que dista 3 km. El parsito se encuentra en 30 nios de A y en 58 de B. Estudia qu se puede decir del grado de infestacin en ambos pueblos.

    IC! pB ! pA( ) = pB ! pA z! 2pB 1! pB( )nB

    +pA 1! pA( )nA

    IC5% pB ! pA( ) =0,281,960,58!0,42100

    +0,3!0,7100

    = 0,280,132 = 0,148; 0,412"# $%

    Como el cero no est incluido dentro del intervalo y ambos extremos son positivos, diremos que el grado de infestacin en B es significativamente mayor que en A.

    8. Queremos comparar las dietas A y B, en relacin a su utilidad para reducir el peso de los individuos de determinada poblacin homognea. Para efectuar la comparacin tomamos una muestra de nA = 20 individuos que siguen la dieta A y nB = 30 individuos que siguen la dieta B, y medimos, para cada uno de los 50 individuos, la cantidad de peso perdido.

    Al realizar el estudio obtenemos X! = 3,2 y X! = 2,9, siendo el p-value = 0,04. Si trabajamos con una significacin = 0,05, indica cul o cules de las siguientes conclusiones son vlidas: No hemos encontrado una evidencia lo suficientemente fuerte para rechazar la igualdad de medias,

    por lo que tenemos que aceptar que ambas dietas son igual de efectivas. X El intervalo de confianza !"!,!" !! !! no incluye al cero en su interior. El intervalo de confianza !"!,!" !! !! si incluye al cero en su interior. X Hemos encontrado una evidencia fuerte de que la efectividad media de la dieta A es superior a la

    de la dieta B.

    9. Se pregunt a 200 personas su opinin sobre el sistema sanitario pblico (B=bueno; R=regular; M=malo). 30 tenan un nivel de rentas alto y su opinin fue: 10 B, 11 R, 9 M. De los 70 con niveles de renta medios hubo 27 B, 29 R y 14 M. La opinin de los 100 con rentas bajas fue: 57 B, 31 R y 12 M. Deseamos estudiar si existe relacin entre el nivel de renta y la opinin sobre el sistema sanitario.

    Nivel Renta Nivel Renta Nivel Renta

    O Alto Medio Bajo T Alto Medio Bajo Discrep. Alto Medio Bajo

    Opi

    nin

    Bueno 10 27 57 94

    Opi

    nin

    Bueno 14.1 32.9 47

    Opi

    nin

    Bueno 1.19 1.06 2.13 Regular 11 29 31 71 Regular 10.65 24.85 35.5 Regular 0.01 0.69 0.57 Malo 9 14 12 35 Malo 5.25 12.25 17.5 Malo 2.68 0.25 1.73

    30 70 100 200 d = 10.31

    Tenemos 4 grados de libertad, por lo que el valor crtico, para una significacin del 5%, es 9,5. Como la discrepancia es 10,31, ligeramente por encima del valor crtico, diremos que hemos encontrado una relacin significativa entre el nivel de renta del usuario y la opinin acerca del sistema sanitario.

    10. Un equipo de profesionales del Hospital General de Boston estudiaron si la presencia de los padres influye o no en el xito de la puncin lumbar. Hubo 44 fracasos en las 281 ocasiones en que los padres no estaban presentes, mientras que fueron 1030 los xitos en los 1178 casos con presencia de los padres. Para comprobar la posible relacin construyeron un test chi-2 de independencia para las variables: Resultado de la puncin, con dos niveles {xito, fracaso} y Presencia de los padres, con dos niveles {Si, No}.

    10.1. Construye la tabla de doble entrada que se emplea para cruzar ambas variables.

    O xito Fracaso

    T xito Fracaso

    Presentes 237 44 281

    Presentes 244,02 36,98 Ausentes 1030 148 1178

    Ausentes 1022,98 155,02

    1267 192 1459

  • 9

    d = 1,9

    10.2. Explica claramente que se concluye, si trabajamos con una significatividad = 5%.

    Como tenemos un nico grado de libertad, el valor crtico es 3,84. Al ser la discrepancia (1,9) menor que el valor crtico, aceptamos la hiptesis nula, es decir: aceptamos que el resultado de la operacin es independiente de la presencia o ausencia de los padres.

    10.3. El p-value correspondiente, estar por debajo o por encima de 0,05?

    El p-value estar por encima de 0,05.

    11. En un hospital se encuentra que la proporcin de mujeres ingresadas con un historial de asma es del 18,14% (39 de 215). Estamos interesados en saber si esta proporcin es significativamente superior a la prevalencia de asma entre las mujeres a nivel nacional, que es de un 15%.

    IC5% p( ) =39215

    1,9639 215 1!39 215( )

    215= 0,18140,0515= 0,1299; 0,2329"# $%

    Como 0,15 est dentro del intervalo, la proporcin encontrada en el hospital no es significativamente diferente de la prevalencia nacional.

    Ejercicios tipo test de clase

    1. En general, para un intervalo de confianza, al aumentar el valor de (la significacin), a. la amplitud del intervalo aumenta. X b. la amplitud del intervalo se reduce c. la amplitud del intervalo no vara. d. no podemos saber qu pasar con la amplitud del intervalo, ya que depende del parmetro. e. no podemos cambiar el valor de , ya que viene determinado por la muestra. Al aumentar la significacin se reduce la confianza, es decir, se reduce la amplitud del intervalo (al ser ms estrecho estamos menos seguros de haber capturado el valor poblacional del parmetro).

    2. Al realizar un contraste de independencia (Chi-2) entre las variables Grupo de Edad, con cuatro niveles: {Nio, Joven, Adulto, Anciano} y Grado de Satisfaccin tras recibir un servicio, con cinco niveles: {Muy Bajo, Bajo, Medio, Alto, Muy Alto}, se ha obtenido un p-value igual a 0,02, siendo que trabajamos con una significacin del 5%. Con los datos disponibles, La conclusin es: a. Se ha encontrado una evidencia fuerte de la independencia entre ambas variables. b. Se ha encontrado una evidencia fuerte de que al aumentar la edad aumenta el grado de satisfaccin. c. Podemos asegurar que la edad y el grado de satisfaccin no estn relacionados entre si. X d. Rechazamos la independencia entre la edad y el grado de satisfaccin. e. Ninguna de las anteriores. Cmo el p-value es menor que la significacin, rechazamos la independencia, es decir, diremos que hemos encontrado una relacin significativa entre ambas variables. a no tiene sentido, ya que la evidencia, fuerte o dbil, siempre es en contra de la hiptesis nula, nunca a favor. b no es cierta, ya que con la informacin del enunciado slo podemos saber que hay una evidencia fuerte de la relacin entre ambas variables, pero no sabemos en qu consiste dicha relacin. c no es cierta porque el p-value por debajo de la significacin implican una relacin significativa entre ambas variables, pero, aunque el p-value fuera mayor que la significacin, no podramos asegurar la existyencia de una relacin entre ambas variables (es demasiado categrica), slo que tenemos una evidencia fuerte de la misma.

    3. Al realizar un contraste de independencia (Chi-2) entre las variables Sexo, con dos niveles: {Hombre, Mujer} y Grado de Satisfaccin tras recibir un servicio, con cuatro niveles: {Muy Bajo, Bajo, Alto, Muy Alto}, se ha obtenido un valor para el estadstico d del contraste (discrepancia) igual a 6,5. Cul de los siguientes valores parece ms creble para el p-value? a. 0,007 Si la hiptesis nula fuera cierta (independencia), la discrepancia sera una chi-2 con 3 grados

    de libertad. De la tabla chi-2 se deduce que el p-value estar entre 0,075 y 0,100.

    X b. 0,090 c. 0,050 d. 0,011 e. 0,924

  • 10

    4. Resulta de inters saber si la probabilidad de padecer cierto efecto secundario tras un tratamiento est relacionada con el sexo del paciente. Para una muestra de 100 hombres y 200 mujeres, a los que se les ha sometido a dicho tratamiento, verificamos el efecto secundario en 16 hombres y en 45 mujeres. Para una significacin del 5%: a. La incidencia del efecto secundario es significativamente mayor entre las mujeres que entre los

    hombres. X b. Aceptamos que la incidencia del efecto secundario es igual entre hombres y mujeres. c. El p-value del anlisis ser menor que 0,05. d. Las respuestas a y c son correctas. e. Ninguna de las respuestas anteriores es cierta.

    O Efecto Sec No Efecto Sec

    T Efecto Sec No Efecto Sec

    Hombre 16 84 100

    Hombre 20,33 79,67 100 Mujer 45 155 200

    Mujer 40,67 159,33 200

    61 239 300

    61 239 300

    d = 1,74 Como slo tenemos un grado de libertad, el valor crtico (de las tabas) es 3,84. Al ser la discrepancia menor que

    el valor crtico, aceptamos la hiptesis nula (la independencia), es decir, aceptamos la igualdad de incidencias entre hombres y mujeres. Adems, al aceptar la hiptesis nula, el p-value ser mayor que 0,05.

    5. Al comparar la eficacia de 2 tratamientos, medida como la proporcin de pacientes que se recuperan, se ha obtenido una diferencia de proporciones estimada del 5% y el intervalo de confianza, al 95%, es [ ]%89,7;%11,2 . a. La verdadera diferencia entre la eficacia de ambos tratamientos est entre el 2,11% y el 7,89%. b. La diferencia observada es estadsticamente significativa. X c. La diferencia observada no es estadsticamente significativa. d. Se ha estudiado un nmero insuficiente de sujetos. e. Para saber si el resultado tiene relevancia clnica debe conocerse el grado de significacin estadstica. a es falsa, por ser demasiado categrica, slo podemos decir que tenemos una confianza alta (del 95%) en que la verdadera diferencia est entre ambos valores. b sera cierta si el cero estuviera fuera del intervalo. c es cierta, ya que el cero est dentro del intervalo.

    6. Al realizar un contraste de independencia (Chi-2) entre las variables Grupo de Edad, con tres niveles: {Joven, Adulto, Anciano} y Grado de Satisfaccin tras recibir un servicio, con tres niveles: {Bajo, Medio, Alto}, se ha obtenido un p-value igual a 0,02, siendo que trabajamos con una significacin del 5%. Con los datos disponibles, cul de las siguientes conclusiones es la ms adecuada? a. Se ha encontrado una evidencia fuerte de la independencia entre ambas variables. b. Se ha encontrado una evidencia fuerte de que al aumentar la edad aumenta el grado de satisfaccin. c. Podemos asegurar que la edad y el grado de satisfaccin no estn relacionados entre si. X d. Rechazamos la independencia entre la edad y el grado de satisfaccin. e. Ninguna de las anteriores. El p-value por debajo de 0,05 nos lleva a rechazar la hiptesis nula, que es la independencia. a es falsa, ya que la evidencia siempre es en contra de la hiptesis nula. b es falsa, ya que slo podemos decir que tenemos una evidencia fuerte de la existencia de la relacin, pero no tenemos informacin relacionada con la direccin de dicha relacin.

    7. Al realizar un contraste de independencia (Chi-2) entre las variables Sexo, con dos niveles: {Hombre, Mujer} y Grado de Satisfaccin tras recibir un servicio, con tres niveles: {Bajo, Medio, Alto}, se ha obtenido un valor para el estadstico d del contraste (discrepancia) igual a 6,5. Cul de los siguientes valores parece ms creble para el p-value? a. 0,326 Si la hiptesis nula fuera cierta (independencia), la discrepancia sera una chi-2 con 2 grados

    de libertad. De la tabla chi-2 se deduce que el p-value estar entre 0,025 y 0,050.

    X b. 0,039 c. 0,065 d. 0,011 e. 0,924

  • 11

    8. En general, para un intervalo de confianza, al aumentar el tamao de la muestra, a. la amplitud del intervalo aumenta. X b. la amplitud del intervalo se reduce c. la amplitud del intervalo no vara. d. no podemos saber que pasar con la amplitud del intervalo, ya que depende del parmetro. e. para pequeos incrementos del tamao de la muestra la amplitud del intervalo se reduce y, para

    grandes incrementos, la amplitud se incrementa.

    Al aumentar el tamao de la muestra se reduce la incertidumbre y, con ello, se reduce la amplitud del intervalo de confianza.

    9. Un p-value alrededor de 0,008 indica que a. los datos son muy compatibles con la hiptesis nula. X b. los datos son muy poco compatibles con la hiptesis nula. c. de ser cierta la hiptesis alternativa, la probabilidad de observar algo tanto o ms extremo que lo

    observado sera muy pequea. d. tenemos la certeza de que la hiptesis nula es cierta. e. El p-value no nos sirve para relacionar los datos con las hiptesis.

    El p-value es la probabilidad de obtener un valor del estadstico de contraste tanto o ms extremo que el que hemos obtenido, en el caso de ser cierta la hiptesis nula, por lo que un valor pequeo contradice la hiptesis nula.

    c sera cierta si se sustituye la hiptesis alternativa por la hiptesis nula.

    d es demasiado categrica.

    10. Un p-value alrededor de 0,80 indica que

    X a. los datos son muy compatibles con la hiptesis nula. b. los datos son muy poco compatibles con la hiptesis nula. c. de ser cierta la hiptesis nula, la probabilidad de observar algo tanto o ms extremo que lo

    observado sera muy pequea. d. tenemos la certeza de que la hiptesis nula es cierta. e. El p-value no nos sirve para relacionar los datos con las hiptesis.

    El p-value es la probabilidad de obtener un valor del estadstico de contraste tanto o ms extremo que el que hemos obtenido, en el caso de ser cierta la hiptesis nula, por lo que un valor elevado es coherente con que la hiptesis nula sea cierta.

    c sera cierta si dijera que la probabilidad es alta (del 80%).

    d es demasiado categrica.

    11. Para cierta enfermedad se asume que el 50% de los afectados son jvenes, el 30% son adultos y el 20% restante son ancianos. En cierto hospital se ha hecho un recuento de los casos registrados en 2009, obteniendo 132 jvenes, 96 adultos y 72 ancianos. A partir de dichos resultados, y con una significacin del 5%, podemos decir que:

    X a. No hemos encontrado una evidencia lo suficientemente fuerte que nos haga pensar que la distribucin de las edades entre nuestros afectados difiera de la asumida.

    b. Hemos encontrado una evidencia suficientemente fuerte que nos hace pensar que la distribucin de las edades entre nuestros afectados difiere de la asumida.

    c. Podemos asegurar que la distribucin de edades de los afectados en nuestro hospital es la misma que la asumida.

    d. Aseguramos que la distribucin de edades de los afectados en nuestro hospital difiere de la asumida. e. Ninguna de las respuestas anteriores es correcta.

    Jvenes Adultos Ancianos Como tenemos 2 grados de libertad, el valor crtico es 5,99, de manera que no lo superamos, lo que nos lleva a aceptar la hiptesis nula. c es falsa por ser demasiado categrica.

    Observado 132 96 72 Terico 150 90 60 Discrepancia 2.16 0.4 2.4 d=4.96

  • 12

    12. Se compara la tensin arterial diastlica de una muestra de individuos antes y despus de un tratamiento. Se observa un descenso medio de 20 mm Hg, con una desviacin estndar de 5 mm Hg. El p-value obtenido es igual a 0,1, cul de las siguientes afirmaciones es correcta? a. Slo el 10% de los individuos presenta un descenso de la TAD de 20 mm Hg o ms extremo. b. Slo el 10% de los individuos presenta un descenso de la TAD de 25 mm Hg o ms extremo. c. El tratamiento provoca un descenso de la TAD. X d. Si el tratamiento no afectara a la TAD, slo existira una probabilidad del 10% de observar este

    resultado, u otro ms extremo. e. El descenso observado es debido al azar. c y e son demasiado categricas.

    d es la definicin de p-value, ya que la hiptesis nula es que el tratamiento no afecta la valor medio de la TAD.

    13. En un test de independencia entre dos variables calculamos el estadstico d (discrepancia). Cul de las siguientes afirmaciones es correcta? a. Cuanto mayor sea d, ms difcil ser encontrar significacin estadstica. b. Cuanto mayor sea d, mayor ser el p-value. X c. Cuanto mayor sea d, ms fcil ser encontrar significacin estadstica. d. Las respuestas a y b son ciertas. e. Ninguna respuesta es cierta. La discrepancia mide lo diferente que es lo que hemos observado de lo que esperbamos observar en caso de ser cierta la hiptesis nula. Cuanto mayor sea la discrepancia mayor ser la evidencia en contra de la hiptesis nula, es decir, mayor ser la significacin estadstica y menor ser el p-value.

    14. En un test de independencia entre dos variables cualitativas calculamos el estadstico d (discrepancia). Cul de las siguientes afirmaciones es correcta?

    a. Cuanto menor sea d, ms fcil ser encontrar significacin estadstica. b. Cuanto menor sea d, menor ser el p-value. X c. Cuanto menor sea d, mayor ser el p-value. d. Las respuestas a y b son ciertas. e. No hay ninguna relacin entre el estadstico d y el p-value. La discrepancia mide lo diferente que es lo que hemos observado de lo que esperbamos observar en caso de ser cierta la hiptesis nula. Cuanto menor sea la discrepancia menor ser la evidencia en contra de la hiptesis nula, es decir, menor ser la significacin estadstica y mayor ser el p-value.

    15. Resulta de inters saber si la probabilidad de padecer cierto efecto secundario tras un tratamiento est relacionada con el sexo del paciente. Para una muestra de 100 hombres y 200 mujeres a los que se les ha sometido a dicho tratamiento verificamos el efecto secundario en 10 hombres y en 40 mujeres. Con una confianza del 95 %:

    X a. La incidencia del efecto secundario es significativamente mayor entre las mujeres. b. La incidencia del efecto secundario no es significativamente mayor entre las mujeres que entre los

    hombres. c. El p-value del anlisis ser mayor que 0,05. d. Las respuestas a y c son correctas. e. Ninguna de las respuestas anteriores es cierta.

    O Efecto Secundario No Efecto

    Secundario

    T Efecto Secundario No Efecto

    Secundario

    Hombre 10 90 100

    Hombre 16,67 83,33 100 Mujer 40 160 200

    Mujer 33,33 166,67 200

    50 250 300 50 250 300

    d = 4,8 Como slo tenemos un grado de libertad, el valor crtico (de las tabas) es 3,84. Al ser la discrepancia mayor que

    el valor crtico, rechazamos la hiptesis nula (la independencia), es decir, rechazamos la igualdad de incidencias entre hombres y mujeres. La incidencia del efecto es significativamente diferente entre hombres y mujeres. Adems, como la incidencia muestral es del 10% para los hombre y del 20% para las mujeres, diremos que la incidencia para las mujeres es significativamente mayor que para los hombres.

  • 13

    16. Al comparar la eficacia de 2 tratamientos, se ha obtenido una diferencia estimada del 5% y el intervalo de confianza, al 95%, es [ ]%89,7;%11,2 . Concluimos: a. La verdadera diferencia entre la eficacia de ambos tratamientos est entre el 2,11 y el 7,89%. X b. La diferencia observada es estadsticamente significativa. c. Se ha estudiado un nmero insuficiente de sujetos. d. Para saber si el resultado tiene relevancia clnica debe conocerse el grado de significacin estadstica. e. El resultado est mal calculado. a es falsa, por ser demasiado categrica, slo podemos decir que tenemos una confianza alta (del 95%) en que la verdadera diferencia est entre ambos valores.

    b es cierta, ya que el cero est fuera del intervalo.

    17. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, resulta: ( ) [ ]21,4;32,1%5 = YXIC , la conclusin para dicho resultado es: a. Aceptamos que YX = . b. Las dos medias son diferentes: YX . c. Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la igualdad de las

    medias, aceptando que YX < . X d. Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la igualdad

    de las medias, aceptando que YX > . e. No podemos contestar a la pregunta si no conocemos el p-value. a sera cierta si el cero estuviera dentro del intervalo.

    b es falsa por ser demasiado categrica.

    c es cierta, ya que tenemos una confianza elevada en que la diferencia es positiva.

    d sera cierta si ambos extremos del intervalo fueran negativos.

    18. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, hemos obtenido:

    ( ) [ ]21,4;32,1%5 = YXIC , el p-value resultante para la comparacin de las medias es:

    X a. Menor que 0,05. b. Mayor que 0,05. c. Depender slo del valor de la varianza comn, estimada a partir de 2pS . d. Depender slo del tamao de las muestras. e. Depender del valor de la varianza comn, estimada a partir de 2pS y del tamao de las muestras.

    Como el intervalo nos lleva a rechazar la igualdad de medias (el cero no est dentro del intervalo), el p-value ser menor que 0,05.

    19. Se compara la tensin arterial diastlica de una muestra de individuos antes y despus de un tratamiento. Se observa un descenso medio de 20 mm Hg, con una desviacin estndar de 5 mm Hg. El p-value obtenido es igual a 0,1, cul de las siguientes afirmaciones es correcta? a. Slo el 10% de los individuos presenta un descenso de la TAD de 20 mm Hg o ms extremo. b. Slo el 10% de los individuos presenta un descenso de la TAD de 25 mm Hg o ms extremo. c. El tratamiento provoca un descenso de la TAD. X d. Si el tratamiento no afectara a la TAD, slo existira una probabilidad del 10% de observar este

    resultado, u otro ms extremo. e. El descenso observado es debido al azar. d es la definicin de p-value.

    e sera cierta si pusiera: Aceptamos que el descenso observado es debido al azar.

  • 14

    20. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, hemos obtenido:

    ( ) [ ]21,4;32,1%5 = YXIC , el p-value resultante para la comparacin de las medias es: a. Menor que 0,05. X b. Mayor que 0,05. c. Depender slo del valor de la varianza comn, estimada a partir de 2pS . d. Depender slo del tamao de las muestras. e. Depender del valor de la varianza comn, estimada a partir de 2pS y del tamao de las muestras.

    Como el intervalo nos lleva a aceptar la igualdad de medias (el cero est dentro del intervalo), el p-value ser mayor que 0,05.

    21. Se compara la tensin arterial diastlica de una muestra de individuos antes y despus de un tratamiento. Se observa un descenso medio de 20 mm Hg, con una desviacin estndar de 5 mm Hg. El p-value obtenido es igual a 0,72, cul de las siguientes afirmaciones es correcta?

    a. El 72% de los individuos presenta un descenso de la TAD de 20 mm Hg o ms extremo. b. Hemos encontrado una evidencia fuerte a favor de que el tratamiento afecta a la TAD. c. El tratamiento provoca un descenso de la TAD. X d. Rechazamos que el tratamiento afecte a la TAD. e. El descenso observado es debido al azar. El elevado valor del p-value nos lleva a aceptar la hiptesis nula, que es la igualdad de medias, es decir, la ausencia de efecto del tratamiento.

    e no es cierta por ser demasiado categrica. Sera cierta si fuera: Aceptamos que el descenso observado es debido al azar.

    22. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, resulta: IC5% X !Y( ) = !1,32; 4,21"# $% , la conclusin para dicho resultado es:

    X a. Aceptamos que YX = .

    b. Las dos medias son diferentes: YX .

    c. Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la igualdad de las medias, aceptando que

    YX < . d. Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la igualdad de las

    medias, aceptando que YX > .

    e. No podemos contestar a la pregunta si no conocemos el p-value. Aceptamos la igualdad de medias por estar el cero dentro del intervalo.