Examen Final BioestadiÌstica Medicina 06-06-2011 Resuelto

  • Upload
    cacatu

  • View
    227

  • Download
    0

Embed Size (px)

DESCRIPTION

estadistica

Citation preview

  • Bioestadstica Inferencia Ejercicios

    1

    13,9 19,1 25,2

    0,5 39,7

    ALG

    42,9ALG

    42,9

    1. Dado el siguiente grafico de tallo y hojas indica el valor correcto para P75:

    a. 46,0

    b. 46,5

    c. 47,0

    d. 48,0

    e. 49,0

    1 : 2 2 2 6 92 : 1 2 2 3 3 3 4 4 5 5 5 7 7 7 7 8 8 8 83 : 0 0 1 1 2 2 6 6 8 84 : 0 0 2 3 3 3 4 5 6 7 9 9 95 : 0 1 1 76 : 3 5 8 97 : 4 9

    Hay 57 datos. Para calcular P75 necesitamos

    hallar la posicin, que es 5775/100=42,75

    que, al ser decimal, se redondea por exceso,

    es decir, P75 es el dato que ocupa la posicin

    43. Contando: P75=46.

    2. Dada la siguiente tabla de distribucin de frecuencias calcule los estadsticos bsicos de tendencia central,

    dispersin y posicin y diga qu serie de valores es la correcta:

    Media Varianza Desv. P25 Q3

    a. 450,00 94,15 9,70 3,5 13,82

    b. 11,25 31,19 5,58 8,5 13,82

    c. 11,25 29,15 5,40 7,5 13,82

    d. 11,25 27,19 5,21 7,5 13,82

    e. 15,35 27,19 6,42 9,6 13,82

    Intervalo MC ni Ni fi Fi ci hi xini xi2ni

    [0] - [5[ 2,5 3 3 7,5% 7,5% 5 0,60 7,5 18,8[5] - [10[ 7,5 14 17 35,0% 42,5% 5 2,80 105,0 787,5

    [10] - [15[ 12,5 17 34 42,5% 85,0% 5 3,40 212,5 2656,3[15] - [20[ 17,5 3 37 7,5% 92,5% 5 0,60 52,5 918,8[20] - [25[ 22,5 2 39 5,0% 97,5% 5 0,40 45,0 1012,5[25] - [30] 27,5 1 40 2,5% 100,0% 5 0,20 27,5 756,3

    40 100% 450 6.150

    =450/40=11,25; 2=6150/40-11,252=27,19; =5,21; P25=5+5(10-3)/14=7,5; Q3=10+5(30-17)/17=13,82 3. Cul es el principal hndicap que desde el punto de vista de la interpretacin del valor presenta la covarianza?

    a. Depende del tamao de la muestra.

    b. Sus valores suelen ser muy elevados.

    c. Depende de la escala de las variables. (mismas unidades que los datos, elevadas al cuadrado)

    d. Es difcil de obtener.

    e. Ninguna de las anteriores es cierta.

    4. Dada el siguiente grafico de caja y bigotes, que muestra las

    demoras en consultas externas de 21 servicios de un Hospital

    comarcal, diga cul de las siguientes afirmaciones no es

    correcta:

    a. El 50% de los servicios tiene una demora entre 13,9 y 25,2 das.

    b. 5 Servicios tiene una demora entre 0,5 y 13,9 das.

    c. La mediana de demora en el hospital es de 20 das (algo mayor que la media).

    d. El 75% de los servicios tiene una demora entre 0,5 y 25,2 das.

    e. El servicio de Alergologa (ALG) se considera un valor anmalo en el estudio.

    c es falsa, ya que la mediana es 19,1, ligeramente menor que la media.

    5. Construimos un modelo de regresin lineal simple para explicar la variabilidad en el tiempo de reaccin (TR) ante

    cierto estmulo, medido en segundos, a partir de la edad del paciente, empleando una muestra formada por 20

    individuos afectados por cierta dolencia, obteniendo: Y = 0,35 + 0,01X. Indica cul de las siguientes conclusiones

    se puede alcanzar a partir del enunciado:

    a. El coeficiente de correlacin lineal entre la edad y el TR es negativo.

    b. El modelo explica el 35% de la variabilidad en el TR para los 20 individuos incluidos en la muestra.

    c. El tiempo medio de reaccin se incrementa 0,01 segundos por cada ao adicional del paciente.

    d. Si un individuo tiene una edad de 30 aos, su TR es igual a 0,65.

    e. El modelo explica el 10% de la variabilidad en el TR para los 20 individuos incluidos en la muestra.

    a es falsa, ya que el coeficiente de correlacin lineal tiene el mismo signo que la pendiente, que es b=0,01>0.

    b es falsa, ya que no conocemos el valor del coeficiente de determinacin lineal R2 y en b afirma que es 0,35.

    d es falsa, ya que lo que sabemos es que para los individuos de 30 aos TR vale, en promedio 0,65.

    e es falsa por el mismo motivo que lo era b.

  • Bioestadstica Inferencia Ejercicios

    2

    Enunciado comn para los ejercicios 6 y 7: Tenemos un test diagnstico cuya sensibilidad es del 90% y cuya

    especificidad es del 80% y lo aplicamos a una poblacin en la que la prevalencia de la enfermedad es del 25%.

    E S

    + 225 150 375

    25 600 625

    250 750 1000

    6. Para un individuo que da positivo en el test, la

    probabilidad de que padezca la enfermedad es:

    a. 10,0%

    b. 96,0%

    c. 6,5%

    d. 60,0%

    e. Ninguna de las anteriores.

    7. Para un individuo que da negativo en el test, la

    probabilidad de que padezca la enfermedad es:

    a. 10,0%

    b. 96,0%

    c. 6,5%

    d. 60,0%

    e. Ninguna de las anteriores. ( ) 6,0375225| ==+EP ( ) 04,062525| ==EP Enunciado comn para los ejercicios 8 y 9: Se estima que el 5% de los nios padecen TDAH (Trastorno por Dficit

    de la Atencin e Hiperactividad). Entre los nios con TDAH, el 40% de ellos padece desrdenes del sueo, que slo se

    registran en el 10% de los nios sin TDAH.

    D No D

    TDAH 20 30 50

    No TDAH 95 855 950

    115 885 1000

    8. Para un nio elegido al azar, la probabilidad de que

    tenga uno y slo uno de ambos problemas es:

    a. 1%

    b. 2%

    c. 3%

    d. 4%

    e. Ninguna de las anteriores.

    9. Para un nio que no padece desrdenes del sueo, la

    probabilidad de que padezca TDAH es, aprox.:

    a. 60,0%

    b. 84,3%

    c. 90,5%

    d. 96,9%

    e. Ninguna de las anteriores.

    ( ) 125,01000

    9530uno slo =

    +=P ( ) 0339,0

    885

    30==DTDAH|P

    10. Cierto test diagnstico acierta sobre el 100% de los individuos sanos y el 50% de los enfermos. Cierta persona pasa

    el test con resultado positivo. Entonces:

    a. Est sana.

    b. Est enferma.

    c. Existe una probabilidad del 50% de que est sana.

    d. Existe una probabilidad del 75% de que est sana.

    e. Existe una probabilidad del 95% de que est enferma.

    Si estuviera sano le habra dado negativo, ya que

    acierta sobre el 100% de los sanos, como le ha dado

    positivo no puede estar sano, luego estar enfermo.

    Enunciado comn para los ejercicios 11 y 12: En las urgencias de un hospital se registran, en promedio, 8 pacientes

    cada hora, segn un proceso de Poisson.

    11. La probabilidad de que en un periodo de 15 minutos

    se registren 4 ms pacientes es, aproximadamente:

    a. 14,3%

    b. 48,2%

    c. 5,3%

    d. 26,4%

    e. Ninguna de las anteriores.

    X = pacientes registrados en 15 X~Po(=2) ( ) ( ) ( )

    1429,08571,01

    31414

    ==

    ==

    >=>>

    N

    NN

    XP

    XPXPXP(

  • Bioestadstica Inferencia Ejercicios

    3

    Enunciado comn para los ejercicios 13 y 14: En cierta poblacin el tiempo de reaccin a un estmulo (TR) tiene una

    distribucin normal con media igual a 0,4 segundos y desviacin tpica igual a 0,05 segundos. ( )05,0;4,0~ == NX

    13. La probabilidad de que un individuo elegido al azar

    tenga un TR entre 0,36 y 0,46 segundos es, aprox.:

    a. 33,7%

    b. 22,6%

    c. 87,4%

    d. 60,0%

    e. 67,3%.

    14. Un tiempo de reaccin que slo es superado por el

    10% de los individuos de la poblacin es, aprox.:

    a. 0,464 segundos

    b. 0,336 segundos

    c. 0,501 segundos

    d. 0,299 segundos

    e. 0,523 segundos

    ( )( )( ) ( )( ) ( )( )

    6730,07881,018849,0

    8,012,1

    8,02,1

    2,18,0

    05,0

    4,046,0

    05,0

    4,036,046,036,0

    =+=

    ==

    =

    =

    ZPZP

    ZPZP

    ZP

    ZPXP(

    Si lo supera el 10%, el 90% queda por debajo P90

    ( ) 9,005,0

    4,09,0 9090 =

    = PZPPXP

    Al ser ( ) 464,028,105,0

    4,09,028,1 90

    90==

    = PP

    ZP

    15. Indica cul de las siguientes afirmaciones es correcta:

    a. Para los estimadores insesgados el error cuadrtico medio es menor que la varianza.

    b. Todo estimador insesgado es mximo verosmil, aunque no todo estimador mximo verosmil es insesgado.

    c. Entre dos estimadores sesgados, el que tenga menor varianza tendr menor error cuadrtico medio.

    d. Entre dos estimadores sesgados, el que tenga menor sesgo tendr menor error cuadrtico medio.

    e. Entre dos estimadores insesgados, el que tenga menor varianza tendr menor error cuadrtico medio.

    a es falsa, ya que ECM=Varianza + Sesgo2, por lo que ser mayor o igual, no menor.

    b es falsa, para una variable normal S2 es un estimador insesgado de 2,pero no es mximo verosimil. c es falsa, ya que depende de lo grande que sea el sesgo de cada uno de los estimadores (no dice que sea iguales).

    d es falsa, ya que falta saber lo que vale la varianza de cada uno de los estimadores.

    e es cierta, ya que para los estimadores insesgados el ECM coincide con la varianza.

    16. En determinadas circunstancias interesa calcular un ndice combinado de dos variables: X = tiempo de reaccin a

    un estmulo auditivo e Y = tiempo de reaccin a un estmulo visual. Ambas variables se miden en segundos y, en

    las circunstancias consideradas, se asume que ambas variables son independientes, con distribucin:

    ( )05,0;4,0~ == NX ( )08,0;8,0~ == NY El ndice se construye mediante la expresin: YXI 6,04,0 += . Indica cul de las siguientes afirmaciones en relacin

    a la distribucin del ndice es la correcta:

    a. ( )0027,0;64,0~ == NI b. ( )052,0;64,0~ == NI c. ( )068,0;64,0~ == NI d. ( )06957,0;64,0~ == NI e. ( )06,0;64,0~ == NI

    La media de I ser 64,08,06,04,04,06,04,0 =+=+= YXI La varianza de I ser:

    0027,008,036,005,016,06,04,0 2222222 =+=+= YXI

    Enunciado comn para las preguntas 17 y 18: Se estima que la incidencia de TDAH en nios es del 5%.

    17. La probabilidad de que en un aula con 40 nios

    encontremos 2 ms con TDAH es, aprox.:

    a. 40,6%

    b. 48,2%

    c. 50,0%

    d. 59,4%

    e. 9,7%

    18. La probabilidad de tener que examinar a ms de 5

    nios para encontrar al primero con TDAH es, aprox:

    a. 4,1%

    b. 81,5%

    c. 12,9%

    d. 77,4%

    e. 16,8%

    X = nios con TDAH en el aula X~Bi(n=40;p=0,05)

    Xp~Po(=400,05=2) ( ) ( ) ( ) ( )

    5940,04060,01

    112122

    ==

    =

  • Bioestadstica Inferencia Ejercicios

    4

    Enunciado comn para las preguntas 19 y 20: El tiempo de reaccin ante un estmulo visual (TR) es, para los

    individuos sanos, una variable normal con media = 0,4 y desviacin tpica = 0,05. Hemos tomado una muestra formada por 16 individuos diagnosticados de adiccin a los juegos electrnicos (JE), para los que la media muestral de

    TR ha resultado igual a 0,5, con una desviacin tpica muestral igual a 0,15.

    19. Con una significacin del 5%, concluimos:

    a. No hay diferencia significativa en la media de TR para los individuos sanos y las adictos a los JE.

    b. La adiccin a los JE incrementa de manera significativa el valor medio de TR.

    c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que el valor medio de TR es igual

    para los individuos sanos y los adictos a los JE.

    d. El TR medio para los adictos a los JE est entre 0,42 y 0,58 segundos.

    e. b y d son ciertas.

    ( ) [ ]58,0;42,008,05,00375,01314,25,016

    15,05,0 025,0;15%5 ==== tIC

    Como 0,4 queda por debajo del intervalo de confianza podemos decir que la media de TR para los adictos a los JE

    es significativamente menor que para los individuos sanos.

    d es falsa por ser demasiado categrica, no podemos afirmar que el TR medio de los adictos a los JE est dentro

    del intervalo, slo podemos decir que tenemos una confianza del 95% de que lo est.

    20. Si estamos interesados en contrastar la hiptesis de que la media de TR para los adictos a JE sigue siendo 0,4 frente

    a que dicha media es diferente de 0,4, indica cul de los siguientes valores te parece ms adecuado para el p-value:

    a. 0,0176

    b. 0,0505

    c. 0,1623

    d. 0,0005

    e. 0,9410

    Hemos visto que para una significacin del 5% el intervalo de confianza es [0,42; 0,58]. Para

    alcanzar en el extremo del intervalo el valor 0,4 deberamos ensanchar un poco el intervalo, es decir,

    debera disminuir un poco, es decir, el p-value es un poco menor que 0,05.

    21. Estamos interesados en comparar el tiempo de reaccin ante cierto estmulo (TR) entre hombres y mujeres, para lo

    que hemos tomado una muestra formada por 20 hombres y 20 mujeres, obteniendo una media muestral igual a 0,40

    para los hombres y 0,38 para las mujeres, siendo las varianzas muestrales 0,00009 y 0,00011, respectivamente.

    Asumimos que ambas variables son normales, con la misma varianza, aunque esta es desconocida. Si = 0,05, podemos concluir:

    a. No hay diferencia significativa en la media de TR para los hombres y las mujeres.

    b. La adiccin a los JE incrementa de manera significativa el valor medio de TR.

    c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que el valor medio de TR es igual

    para los hombres y las mujeres.

    d. El TR medio para los hombres es significativamente mayor que para las mujeres.

    e. a y c son ciertas.

    Comparacin de dos medias con varianzas desconocidas, pero iguales, con dos muestras normales independientes.

    01,00001,00001,038

    00011,01900009,0192===

    += pp SS

    ( ) [ ]0336,0;0136,00064,002,000316,00244,202,020

    1

    20

    101,038,040,0 025,0;38%5 ===+= tIC MH

    El intervalo no contiene al cero y ambos extremos son positivos, por lo que la diferencia es significativamente

    positiva, es decir la media de TR es significativamente mayor para los hombres que para las mujeres.

    22. Queremos estudiar si cierta intervencin afecta al tiempo de reaccin ante cierto estmulo (TR), para lo que hemos

    tomado una muestra formada por 16 individuos para los que se ha medido el TR antes y despus de la intervencin.

    El intervalo de confianza para la diferencia de medias ha resultado: ( ) [ ]02,0;01,0%5 = ADIC . Si = 0,05, podemos concluir:

    a. La intervencin no afecta de manera significativa a la media de TR.

    b. El TR es significativamente mayor despus de la intervencin que antes de la misma.

    c. Hemos encontrado una evidencia lo suficientemente fuerte para rechazar la igualdad en el valor medio de TR

    antes y despus de la intervencin, en favor de una disminucin del mismo despus de la intervencin.

    d. La intervencin reduce el TR.

    e. La intervencin aumenta el TR.

    Comparacin de dos medias con datos pareados.

    El intervalo no contiene al cero y ambos extremos son positivos, por lo que la diferencia es significativamente

    positiva, es decir la media de TR despus de la intervencin es significativamente mayor que antes de la misma.

    e es falsa por ser demasiado categrica. Tenemos una evidencia fuerte de que la intervencin incrementa el valor

    medio de TR, pero no podemos afirmarlo. Adems, en e no se menciona el valor medio de TR, sino de TR.

  • Bioestadstica Inferencia Ejercicios

    5

    Enunciado comn para las preguntas 23, 24, 25 y 26: En una clnica tienen 3 especialidades diferentes: {A, B, C} y

    estn interesados en saber si la proporcin de pacientes que acuden a consulta es la misma para las tres especialidades.

    Para ello toma una muestra aleatoria de 120 pacientes, de los que 30 eran de la especialidad A, 35 de la especialidad B y

    55 de la especialidad C.

    23. Indica cul de las siguientes afirmaciones resume las conclusiones que se pueden alcanzar con los resultados

    obtenidos para los 120 coches:

    a. Para = 0,05 aceptamos la igualdad de proporciones, pero para = 0,01 la rechazamos.

    b. Para = 0,05 rechazamos la igualdad de proporciones, pero para = 0,01 la aceptamos.

    c. Aceptamos la igualdad de proporciones tanto para = 0,05 como para = 0,01.

    d. Rechazamos la igualdad de proporciones tanto para = 0,05 como para = 0,01.

    e. No podemos contestar a la pregunta por no conocer el p-value del contraste.

    H0: pA=pB=pC=1/3; Si H0 d~22; 99,52 05,0;2 = ; 21,92 01,0;2 =

    A B C

    O 30 35 55

    T 40 40 40

    ( ) ( ) ( ) 75,840

    4055

    40

    4035

    40

    4030222

    =

    +

    +

    =d

    d est entre ambos lmites, por lo que con = 0,05 rechazamos H0 y con = 0,01 la aceptamos.

    24. De entre los siguientes valores, Cul te parece ms creble para ser el p-value del contraste del ejercicio 23?:

    a. 0,045

    b. 0,472

    c. 0,875

    d. 0,013

    e. 0,002

    d est entre 5,99 y 9,21, pero est ms cerca de 9,21, por lo que el p-value estar entre 0,05 y 0,01,

    pero ms cerca de 0,01.

    25. Entre los 30 de la especialidad A 20 eran hombres y 10 eran mujeres; Entre los 35 de la especialidad B 25 eran

    hombres y 10 eran mujeres; Entre los 55 de la especialidad C 27 eran hombres y 28 eran mujeres. Con estos datos y

    para una significacin = 0,05, podemos decir:

    a. Hemos encontrado una evidencia fuerte que nos permite rechazar la independencia entre el sexo del paciente y

    la especialidad a la que acude.

    b. Hemos encontrado una relacin significativa entre el sexo del paciente y la especialidad a la que acude

    c. Aceptamos que la especialidad a la que acude el paciente no depende de su sexo.

    d. Las respuestas a y b son correctas.

    e. Ninguna de las respuestas anteriores es correcta.

    H0: La especialidad es independiente del sexo; Si H0 d~22; 99,52 05,0;2 =

    Obs A B C Teo A B C

    H 20 25 27 72 H 18 21 33

    M 10 10 28 48 M 12 14 22

    30 35 55 120

    ( ) ( )19,5

    22

    2228

    18

    182022

    =

    ++

    = Ld

    d es menor que el valor crtico, por lo que aceptamos la hiptesis nula.

    26. De entre los siguientes valores, Cul te parece ms creble para ser el p-value del contraste del ejercicio 25?:

    a. 0,075

    b. 0,175

    c. 0,045

    d. 0,015

    e. 0,475

    d est un poco por debajo de 5,99, por lo que el p-value ser un poco mayor que 0,05.

    27. Queremos estimar la proporcin de empresas en las cuales la Direccin General es ocupada por una mujer,

    asegurando que la probabilidad de cometer un error de estimacin mayor que 0,05 sea menor que 0,10 y asumiendo

    que dicha proporcin nunca sobrepasar el 30%

    De los siguientes valores, cul se aproxima ms al tamao muestral mnimo necesario para asegurar nuestro

    objetivo?

    a. 81

    b. 664

    c. 228

    d. 558

    e. 271

    Tamao muestral para estimar una proporcin con =0,1 y d=0,05. Como sabemos que p no supera el 30%, el peor de los casos es p=0,3.

    ( ) ( ) 2283,22721,005,0

    6449,13,013,0

    05,01

    22

    05,0

    2

    2=

    =

    =

    =

    zpp

    d

    zn

  • Bioestadstica Inferencia Ejercicios

    6

    28. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas

    iguales, aunque desconocidas, con una significacin del 5%, resulta: ( ) [ ]32,1;21,4%5 = YXIC , la conclusin para dicho resultado es:

    a. Aceptamos que ambas medias son iguales.

    b. No podemos contestar a la pregunta si no conocemos el p-value.

    c. La media de X es significativamente mayor que la de Y.

    d. La media de X es significativamente menor que la de Y.

    e. Ninguna de las anteriores afirmaciones es correcta.

    Hemos encontrado una evidencia muy fuerte de que 0

  • Bioestadstica Inferencia Ejercicios

    7

    Hoja de Respuestas

    Grupo:

    Nombre y Apellidos:

    a b c d e

    1 2 3 4 5 6 7 8 9

    10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28