10
  C B 1 1 3 2010 1. En el análisis de regresión simple, ¿cuál de los siguientes estadísticos cuantifica el ajuste de los datos a la recta de regresión?  a. El cuadrado del coeficiente de correlación de Pearson  b. La varianza de la variable independiente.  c. La pendiente de la recta de regresión.  d. Ninguno de los anteriores es cierto.  e. Todos los anteriores son ciertos. 2. ¿Qué porcentaje de variabilidad de Y  es explicado por la variable  X  con un coeficiente de correlación lineal, r  = 0,7?  a. 7 %  b. 30 %  c. 49 %  d. 3 %  e. 70 % 3. Está Vd. realizando un estudio p ara evaluar una nueva prueba de diagnóstico rápido de infección urinaria. Su patrón de referencia es el urocultivo y cuando comienza a analizar los datos se encuentra con los siguientes: la prueba es positiva en 100 pacientes (75 con urocultivo positivo y 25 con urocultivo negativo) y negativa en 375 pacientes (125 con urocultivo positivo y 250 con urocultivo negativo, ¿podría calcular el valor predictivo negativo (VPN) de su nueva prueba?  a. 75,0 %  b. 33,3 %  c. 50,0%  d. 37,5 %  e. 66,6 % 4. En un estudio sobre una m uestra de 200 sujetos hipertensos, se informa que la tensión arterial d iastólica (TAD) mediana observada es de 100 mmHg. ¿Cuál es el significado correcto de esta afirmación?:  a. La media aritmética de las cifras de TAD de los 200 sujetos es de 100 mmHg.  b. La mitad de los sujetos de la muestra tienen cifras iguales o inferiores a 100 mmHg.  c. Todos los sujetos de la muestra tienen cifras de TAD iguales o superiores a 100 mmHg.  d. La cifra de TAD que se ha observado en un mayor número de sujetos es de 100 mmHg.  e. El 95% de los sujetos de la muestra tienen cifras de TAD superior es a 100 mmHg. 5. Si le comentan que de 100 personas con un resultado positivo a una pru eba diagnóstica, 40 tienen realmente la enfermedad, pensará que:  a. La sensibilidad de la prueba es del 40%.   b. La especificidad de la prueba es del 40%.  c. El valor predictivo positivo de la prueba es del 40%.  d. El valor predictivo negativo de la prueba es del 60%.  e. Ninguna de las anteriores es cierta. 6. Si no tenemos en cuenta las limitaciones del instrumento de medición, ¿de qué tipo es la siguiente variable?: Valor de Hemo globina en sang re de la población:  a. Cualitativa o categórica.  b. Cuasi-cuantitativa u Ordinal.  c. Cuantitativa discreta.  d. Cuantitativa continua.  e. Ninguna de las anteriores. 7. Se observan los siguientes datos par a el número de faltas a clase de un grupo de alumn os: (2,2,3,4,5,5,6,6,6,8,12,13,14,15,18,25,30,40,40). ¿Cuál de los siguientes conjuntos de estadísticos descriptivos es el correcto?  a. Media = 25,40 Mediana = 12,00 Moda = 6 Varianza = 317,79  b. Media = 13,37 Mediana = 8,00 Moda = 6 Varianza = 139,07  c. Media = 13,37 Mediana = 12,00 Moda = 4 Varianza = 120,11  d. Media = 25,40 Mediana = 6,00 Moda = 8 Varianza = 178,71  e. Ninguno de los anteriores es cierto.

Examen bioestadiÌstica 3-septiembre 2010 2010 Resuelto

  • Upload
    cacatu

  • View
    218

  • Download
    0

Embed Size (px)

DESCRIPTION

estadistica

Citation preview

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 1 3 de septiembre de 2010

    1. En el anlisis de regresin simple, cul de los siguientes estadsticos cuantifica el ajuste de los datos a la recta de regresin? a. El cuadrado del coeficiente de correlacin de Pearson b. La varianza de la variable independiente. c. La pendiente de la recta de regresin. d. Ninguno de los anteriores es cierto. e. Todos los anteriores son ciertos.

    2. Qu porcentaje de variabilidad de Y es explicado por la variable X con un coeficiente de correlacin lineal, r = 0,7? a. 7 % b. 30 % c. 49 % d. 3 % e. 70 %

    3. Est Vd. realizando un estudio para evaluar una nueva prueba de diagnstico rpido de infeccin urinaria. Su patrn de referencia es el urocultivo y cuando comienza a analizar los datos se encuentra con los siguientes: la prueba es positiva en 100 pacientes (75 con urocultivo positivo y 25 con urocultivo negativo) y negativa en 375 pacientes (125 con urocultivo positivo y 250 con urocultivo negativo, podra calcular el valor predictivo negativo (VPN) de su nueva prueba? a. 75,0 % b. 33,3 % c. 50,0% d. 37,5 % e. 66,6 %

    4. En un estudio sobre una muestra de 200 sujetos hipertensos, se informa que la tensin arterial diastlica (TAD) mediana observada es de 100 mmHg. Cul es el significado correcto de esta afirmacin?: a. La media aritmtica de las cifras de TAD de los 200 sujetos es de 100 mmHg. b. La mitad de los sujetos de la muestra tienen cifras iguales o inferiores a 100 mmHg. c. Todos los sujetos de la muestra tienen cifras de TAD iguales o superiores a 100 mmHg. d. La cifra de TAD que se ha observado en un mayor nmero de sujetos es de 100 mmHg. e. El 95% de los sujetos de la muestra tienen cifras de TAD superiores a 100 mmHg.

    5. Si le comentan que de 100 personas con un resultado positivo a una prueba diagnstica, 40 tienen realmente la enfermedad, pensar que: a. La sensibilidad de la prueba es del 40%. b. La especificidad de la prueba es del 40%. c. El valor predictivo positivo de la prueba es del 40%. d. El valor predictivo negativo de la prueba es del 60%. e. Ninguna de las anteriores es cierta.

    6. Si no tenemos en cuenta las limitaciones del instrumento de medicin, de qu tipo es la siguiente variable?: Valor de Hemoglobina en sangre de la poblacin: a. Cualitativa o categrica. b. Cuasi-cuantitativa u Ordinal. c. Cuantitativa discreta. d. Cuantitativa continua. e. Ninguna de las anteriores.

    7. Se observan los siguientes datos para el nmero de faltas a clase de un grupo de alumnos: (2,2,3,4,5,5,6,6,6,8,12,13,14,15,18,25,30,40,40). Cul de los siguientes conjuntos de estadsticos descriptivos es el correcto? a. Media = 25,40 Mediana = 12,00 Moda = 6 Varianza = 317,79 b. Media = 13,37 Mediana = 8,00 Moda = 6 Varianza = 139,07 c. Media = 13,37 Mediana = 12,00 Moda = 4 Varianza = 120,11 d. Media = 25,40 Mediana = 6,00 Moda = 8 Varianza = 178,71 e. Ninguno de los anteriores es cierto.

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 2 3 de septiembre de 2010

    8. Leemos un estudio en el que se seleccionan dos grupos de sujetos, uno formado por enfermos y el otro por personas libres de la enfermedad que se estudia, en el, se compara la exposicin a posibles factores de riesgo en el pasado. El tipo de estudio es. a. Estudio retrospectivo de doble cohorte. b. Ensayo de campo. c. Estudio retrospectivo de una serie de casos. d. Estudio transversal. e. Estudio de casos y controles.

    9. Al seleccionar sujetos para un estudio, cmo definira el fenmeno que puede producir el hecho de que las caractersticas basales de los distintos grupos sean distintas en cuanto a la distribucin de factores de riesgo para la patologa cuya aparicin se quiere investigar?: a. Sesgo de seleccin. b. Sesgo de informacin. c. Sesgo de observacin. d. Un error aleatorio. e. Sesgo por presencia de factor de confusin.

    10. Se ha medido la hemoglobina en sangre de 10 sujetos, observando que uno de ellos presenta un valor mucho mayor que el resto. En esta situacin, la medida estadstica de posicin o tendencia central que mejor sintetiza los valores observados es: a. Media aritmtica. b. Media geomtrica. c. Moda. d. Mediana. e. Ninguna de las anteriores.

    Enunciado comn preguntas 11, 12, 13 y 14. En una poblacin el 45% de los individuos son Hombres y el 55% restante Mujeres. Se sabe que, para dicha poblacin, el 40% de los Hombres posee cierta Caracterstica Gentica, mientras que esta Caracterstica Gentica slo se encuentra en el 20% de las mujeres. 11. Para una persona al azar, de la que sabemos que

    posee la Caracterstica Gentica, la probabilidad de que sea un Hombre es, aproximadamente a. 62% b. 38% c. 18% d. 82% e. 24%

    12. Si elegimos una persona al azar, la probabilidad de que sea un Hombre con la Caracterstica Gentica es, aproximadamente a. 62% b. 38% c. 18% d. 82% e. 24%

    13. La probabilidad de tener que examinar a ms de 4 Mujeres hasta encontrar a una con la Caracterstica Gentica es, aproximadamente a. 33 % b. 41 % c. Por debajo del 10 % d. Por encima del 90 % e. 67 %

    14. Si elegimos una persona al azar, la probabilidad de que sea un Hombre o de que tenga la Caracterstica Gentica es, aproximadamente a. 21 % b. 56 % c. 44 % d. 24 % e. 76 %

    15. Si los sucesos A y B son incompatibles y sabemos que la probabilidad de A es de 1/3 y la de B es 1/2, la probabilidad de A B es igual a: a. 1/6 b. 1/2 c. 1/3 d. 5/6 e. 0

    16. Para una cierta enfermedad, con una prevalencia del 10%, el 90% de los afectados presentan el sntoma A, que slo est presente en el 5% de los individuos sanos. Si un individuo presenta el sntoma, la probabilidad de que tenga la enfermedad es, aproximadamente : a. 82 % b. 18 % c. 33 % d. 67 % e. 94 %

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 3 3 de septiembre de 2010

    17. En cierta poblacin la estatura se distribuye aproximadamente como una variable normal, con media igual a 170 cm y varianza igual a 100 cm2. La media aritmtica de la estatura de 25 individuos tomados al azar en dicha poblacin es aproximadamente normal, con a. Media 170 y Desviacin tpica 4. b. Media 170 y Desviacin tpica 20. c. Media 170 y Desviacin tpica 0,4. d. Media 6,8 y Desviacin tpica 4. e. Media 170 y Desviacin tpica 2.

    18. Una caracterstica interesante de la distribucin de Poisson es: a. Se emplea para fenmenos que ocurren con gran frecuencia. b. Su media y su desviacin tpica coinciden. c. Su clculo se puede realizar mentalmente. d. La media no depende de la desviacin tpica. e. Ninguna de las anteriores es cierta.

    19. De una enfermedad no contagiosa, y de muy baja incidencia, se esperan 6 nuevos casos anuales en Espaa. Cunto vale la probabilidad de registrar ms de 6 casos en un ao? a. 0,6063 b. 0,3937 c. 0,1606 d. 0,8394 e. 0,2331

    Enunciado comn preguntas 20, 21, 22 y 23. Se sabe que el 5% de los individuos de cierta poblacin son diabticos. 20. El nmero medio de individuos que tendremos

    que explorar hasta encontrar un diabtico es: a. 20 b. 5 c. 95 d. 80 e. Ninguna de las anteriores

    21. Si elegimos dos individuos al azar, la probabilidad de que al menos uno de ellos sea diabtico es: a. 10 % b. 5 % c. 9,75 % d. 0,25 % e. Ninguna de las anteriores

    22. La probabilidad de no encontrar ningn diabtico en una muestra de 10 individuos es, aproximadamente a. 50 % b. 60 % c. 40 % d. 30 % e. 70 %

    23. La probabilidad de encontrar menos de 5 diabticos en una muestra de 80 individuos es, aproximadamente a. 37 % b. 63 % c. 79 % d. 24 % e. 46 %

    24. Si para un estudio en una poblacin en la que la edad se distribuye de manera normal, con media 40 y varianza 25, queremos eliminar a los individuos con menos de 30 aos y los individuos con ms de 50 aos, eliminaremos aproximadamente al a. 5 % b. 95 % c. 32 % d. 68 % e. 1 %

    25. Indica cual de las siguientes frases es correcta: a. El Error Cuadrtico Medio de un estimador insesgado es mayor que su Varianza. b. El Error Cuadrtico Medio de un estimador sesgado es mayor que su Varianza. c. El Error Cuadrtico Medio de un estimador es siempre mayor que su Varianza. d. El Error Cuadrtico Medio de un estimador no puede ser mayor que su Varianza. e. El Error Cuadrtico Medio de un estimador no est relacionado con su Varianza.

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 4 3 de septiembre de 2010

    26. Un p-value alrededor de 0,008 indica que a. los datos son muy compatibles con la hiptesis nula. b. los datos son muy poco compatibles con la hiptesis nula.

    c. de ser cierta la hiptesis alternativa, la probabilidad de observar algo tanto o ms extremo que lo

    observado sera muy pequea. d. tenemos la certeza de que la hiptesis nula es cierta. e. El p-value no nos sirve para relacionar los datos con las hiptesis.

    27. Al realizar un contraste de independencia (Chi-2) entre las variables Grupo de Edad, con cuatro niveles: {Nio, Joven, Adulto, Anciano} y Grado de Satisfaccin tras recibir un servicio, con cinco niveles: {Muy Bajo, Bajo, Medio, Alto, Muy Alto}, se ha obtenido un p-value igual a 0,02, siendo que trabajamos con una significacin del 5%. Con los datos disponibles, La conclusin es: a. Se ha encontrado una evidencia fuerte de la independencia entre ambas variables. b. Se ha encontrado una evidencia fuerte de que al aumentar la edad aumenta el grado de satisfaccin. c. Podemos asegurar que la edad y el grado de satisfaccin no estn relacionados entre si. d. Rechazamos la independencia entre la edad y el grado de satisfaccin. e. Ninguna de las anteriores.

    28. Al realizar un contraste de independencia (Chi-2) entre las variables Sexo, con dos niveles: {Hombre, Mujer} y Grado de Satisfaccin tras recibir un servicio, con cuatro niveles: {Muy Bajo, Bajo, Alto, Muy Alto}, se ha obtenido un valor para el estadstico d del contraste (discrepancia) igual a 6,5. Cul de los siguientes valores parece ms creble para el p-value? a. 0,007 b. 0,090 c. 0,050 d. 0,011 e. 0,924

    29. En general, para un intervalo de confianza, al aumentar el valor de (la significacin), a. la amplitud del intervalo aumenta. b. la amplitud del intervalo se reduce c. la amplitud del intervalo no vara. d. no podemos saber que pasar con la amplitud del intervalo, ya que depende del parmetro. e. no podemos cambiar el valor de , ya que viene determinado por la muestra.

    30. Si d es una variable aleatoria cuya distribucin es una Chi-2 con 10 grados de libertad, Cunto vale la probabilidad: ( )2 05,0;10dP ? a. 95,0% b. 97,5% c. 2,5% d. 5,0% e. Faltan datos para calcular la probabilidad pedida.

    31. En cierta poblacin la estatura se distribuye aproximadamente como una variable normal, con media igual a 170 cm y varianza igual a 100 cm. Si queremos seleccionar al 80%, eliminando a los ms altos, deberemos eliminar a todos aquellos cuya estatura supere los a. 181,2 cm b. 172,3 cm c. 178,4 cm d. 185,2 cm e. 161,6 cm

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 5 3 de septiembre de 2010

    32. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, hemos obtenido:

    ( ) [ ]21,4;32,1%5 = YXIC , el p-value resultante para la comparacin de las medias es: a. Menor que 0,05. b. Mayor que 0,05. c. Depender slo del valor de la varianza comn, estimada a partir de 2pS . d. Depender slo del tamao de las muestras. e. Depender del valor de la varianza comn, estimada a partir de 2pS y del tamao de las muestras.

    33. Se compara la tensin arterial diastlica de una muestra de individuos antes y despus de un tratamiento. Se observa un descenso medio de 20 mm Hg, con una desviacin estndar de 5 mm Hg. El p-value obtenido es igual a 0,72, cul de las siguientes afirmaciones es correcta? a. El 72% de los individuos presenta un descenso de la TAD de 20 mm Hg o ms extremo. b. Hemos encontrado una evidencia fuerte a favor de que el tratamiento afecta a la TAD. c. El tratamiento provoca un descenso de la TAD. d. Rechazamos que el tratamiento afecte a la TAD. e. El descenso observado es debido al azar.

    34. Para cierta enfermedad se asume que el 50% de los afectados son jvenes, el 30% son adultos y el 20% restante son ancianos. En cierto hospital se ha hecho un recuento de los casos registrados en 2009, obteniendo 130 jvenes, 95 adultos y 75 ancianos. A partir de dichos resultados, y con una significacin del 5%, podemos decir que:

    a. No hemos encontrado una evidencia lo suficientemente fuerte que nos haga pensar que la distribucin de las edades entre nuestros afectados difiera de la asumida.

    b. Hemos encontrado una evidencia suficientemente fuerte que nos hace pensar que la distribucin de las edades entre nuestros afectados difiere de la asumida.

    c. Podemos asegurar que la distribucin de edades de los afectados en nuestro hospital es la misma que la asumida.

    d. Podemos asegurar que la distribucin de edades de los afectados en nuestro hospital es diferente de la asumida.

    e. Ninguna de las respuestas anteriores es correcta.

    35. En un test de independencia entre dos variables cualitativas calculamos el estadstico d (discrepancia). Cul de las siguientes afirmaciones es correcta? a. Cuanto menor sea d, ms fcil ser encontrar significacin estadstica. b. Cuanto menor sea d, menor ser el p-value. c. Cuanto menor sea d, mayor ser el p-value. d. Las respuestas a y b son ciertas. e. No hay ninguna relacin entre el estadstico d y el p-value.

    36. Se desea estimar la proporcin p de personas que beben alcohol antes de conducir entre quienes hace menos de un ao que obtuvieron el carn de conducir. Cul de los siguientes valores se parece ms al tamao muestral mnimo que deberamos exigir si queremos que la probabilidad de cometer un error mayor al 5% sea menor que el 1%?, teniendo en cuenta que no tenemos ninguna informacin previa acerca del posible valor de p. a. 9.604 b. 7.203 c. 2.406 d. 664 e. 498

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 6 3 de septiembre de 2010

    37. A una muestra de 25 personas sometidas a cierto tratamiento se les ha tomado la Presin Sistlica de la Arteria Heptica (PSAH), obteniendo una media muestral igual a 35 y una desviacin tpica muestral igual a 11, mientras que se asume que para la poblacin en general dicha presin es en promedio igual a 40. Indica cul de las siguientes conclusiones es adecuada, para una significacin del 5%. a. Se acepta que el tratamiento tiene un efecto significativo sobre la PSAH, reducindola. b. Se acepta que el tratamiento tiene un efecto significativo sobre la PSAH, incrementndola. c. Se acepta que el tratamiento no tiene un efecto significativo sobre la PSAH. d. La PSAH aumenta de manera significativa tras el tratamiento.

    e. No existe una diferencia significativa en la PSAH entre la poblacin en general y quienes se han sometido al tratamiento.

    38. Resulta de inters saber si la probabilidad de padecer cierto efecto secundario tras un tratamiento est relacionada con el sexo del paciente. Para una muestra de 100 hombres y 200 mujeres a los que se les ha sometido a dicho tratamiento verificamos el efecto secundario en 16 hombres y en 45 mujeres. Para una significacin del 5%:

    a. La incidencia del efecto secundario es significativamente mayor entre las mujeres que entre los hombres.

    b. Aceptamos que la incidencia del efecto secundario es igual entre hombres y mujeres. c. El p-value del anlisis ser menor que 0,05. d. Las respuestas a y c son correctas. e. Ninguna de las respuestas anteriores es cierta.

    39. Al comparar la eficacia de 2 tratamientos, medida como la proporcin de pacientes que se recuperan, se ha obtenido una diferencia de proporciones estimada del 5% y el intervalo de confianza, al 95%, es [ ]%89,7;%11,2 . Concluimos: a. La verdadera diferencia entre la eficacia de ambos tratamientos est entre el 2,11% y el 7,89%. b. La diferencia observada es estadsticamente significativa. c. La diferencia observada no es estadsticamente significativa. d. Se ha estudiado un nmero insuficiente de sujetos. e. Para saber si el resultado tiene relevancia clnica debe conocerse el grado de significacin estadstica.

    40. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas iguales, aunque desconocidas, con una significacin del 5%, resulta:

    ( ) [ ]21,4;32,1%5 = YXIC , la conclusin para dicho resultado es: a. Aceptamos que YX = . b. Las dos medias son diferentes: YX .

    c. Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la igualdad de las medias, aceptando que YX < .

    d. Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la igualdad de las medias, aceptando que YX > .

    e. No podemos contestar a la pregunta si no conocemos el p-value.

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 7 3 de septiembre de 2010

    Ejercicio 1 Cierta enfermedad tiene 3 modalidades {A, B, C}. En un grupo de 75 pacientes se ha encontrado 30 con la modalidad A, 25 con la modalidad B y 20 con la modalidad C. 1.1 Es aceptable, para una significacin = 5%, que las 3 modalidades de la enfermedad son igual de

    frecuentes? Se trata de un test chi-2 de comparacin de proporciones, con H0: pA = pB = pC = 1/3.

    A B C Observados: 30 25 20

    Tericos: 25 25 25

    Clculo de d: ( ) 125

    2530 2=

    ( ) 025

    2525 2=

    ( ) 125

    2520 2=

    2101 =++=d

    Si H0 es cierta, 22~ d , con 99,52 05,0;2 =

    Al ser d = 2 < 5,99 aceptamos la hiptesis nula: Aceptamos que las tres modalidades de la enfermedad son igual de frecuentes.

    1.2 Si entre los 30 pacientes con la modalidad A hay 22 hombres y 8 mujeres, entre los 25 con la modalidad B hay 12 hombres y 13 mujeres y entre los 20 con la modalidad C hay 8 hombres y 12 mujeres, explica claramente qu podemos decir acerca de la posible relacin existente entre la modalidad de la enfermedad y el sexo del paciente, para una significacin = 5%? Se trata de un test de independencia con H0: La modalidad de la enfermedad es independiente del sexo.

    O A B C Total H 22 12 8 42 M 8 13 12 33

    Total 30 25 20 75

    T A B C H 8,16753042 = 0,14752542 = 2,11752042 = M 2,13753033 = 0,11752533 = 8,8752033 =

    38,616,136,005,291,029,061,1 =+++++=d

    Si H0 es cierta, 22~ d , con 99,52 05,0;2 =

    Al ser d = 6,38 > 5,99 rechazamos la hiptesis nula: Hemos encontrado una evidencia lo suficientemente fuerte que nos permite rechazar la independencia entre la modalidad de la enfermedad y el sexo, (aceptamos que hay relacin).

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 8 3 de septiembre de 2010

    Ejercicio 2 En la siguiente tabla se muestran las alturas, X, (redondeando a los 2 cm. ms cercanos) y los pesos, Y, (redondeados al Kg. ms cercano) de 10 hombres y 10 mujeres. En la tabla se han aadido las columnas X2, Y2 y XY, as como la suma de cada columna, para facilitar los clculos.

    X Y X2 Y2 XY X Y X2 Y2 XY162 65 26.244 4.225 10.530 152 52 23.104 2.704 7.904168 65 28.224 4.225 10.920 156 50 24.336 2.500 7.800174 84 30.276 7.056 14.616 158 47 24.964 2.209 7.426176 63 30.976 3.969 11.088 160 48 25.600 2.304 7.680180 75 32.400 5.625 13.500 162 52 26.244 2.704 8.424180 76 32.400 5.776 13.680 162 55 26.244 3.025 8.910182 82 33.124 6.724 14.924 164 55 26.896 3.025 9.020184 65 33.856 4.225 11.960 164 56 26.896 3.136 9.184186 80 34.596 6.400 14.880 166 60 27.556 3.600 9.960186 81 34.596 6.561 15.066 166 60 27.556 3.600 9.960

    1.778 736 316.692 54.786 131.164 1.610 535 259.396 28.807 86.268

    Hombres Mujeres

    2.1. Construye un diagrama de dispersin, para hombre y mujeres por separado, pero en un mismo grfico, para comentar la relacin existente entre ambas variables, en cada caso.

    42465054586266707478828690

    150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 182 184 186 188

    Hombres Mujeres

    En el caso de las mujeres se observa una mayor relacin entre peso y talla, agrupndose los puntos mucho ms en torno a una recta imaginaria, los casos estn ms agrupados y parece existir una relacin directa entre el peso y la talla. En los hombre tambin se observa esta relacin entre peso y talla aunque en menor medida y los casos estn ms dispersos, no agrupndose tanto en torno a valores centrales.

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 9 3 de septiembre de 2010

    2.2. Calcula la Covarianza y el Coeficiente de Correlacin Lineal de Pearson (r) para hombres y para mujeres y comntalos.

    Hombres

    Peso (X) Media (X) 177,80 ----- Varianza (S2) 56,36 ---- Desv. Tpica (S) 7,51

    Talla (Y) Media (X) 73,60 ----- Varianza (S2) 61,64 ---- Desv. Tpica (S) 7,85

    Mujeres

    Peso (X) Media (X) 161,00 ----- Varianza (S2) 18,60 ---- Desv. Tpica (S) 4,31

    Talla (Y) Media (X) 53,50 ----- Varianza (S2) 18,45 ---- Desv. Tpica (S) 4,30

    En segundo lugar calculamos la Covarianza para ambas variables y dado que esta depende de la escala

    de medida, para eliminar este inconveniente calculamos el

    coeficiente de correlacin lineal de Pearson (r) usando las

    formulas correspondientes:

    Hombres: Mujeres:

    Sxy 30,32 Sxy 13,30

    r 0,51 r 0,72

    Sabemos que el coeficiente de correlacin lineal de pearson toma valores entre -1 y +1, la relacin

    entre las variables es ms dbil cuanto mas cerca del 0, la relacin ser inversa si es negativo y directa

    si es positivo. Ser dbil entre -0,3 y + 0,3, moderada hasta 0,7 y fuerte has 1.

    Por lo tanto tenemos un r de 0,51 en los hombres que nos dice que hay una relacin positiva

    moderada entre el peso y la talla. Con las mujeres pasa algo similar, pero la relacin es ms fuerte con

    un r de 0,72

    2.3 Construye un modelo de regresin lineal para los hombres y otro para las mujeres, calculando e interpretando el coeficiente de determinacin lineal (R2).

    Para construir un modelo de regresin lineal, debemos buscar a recta que ms se ajuste a los puntos

    del diagrama de dispersin que hemos dibujado, es decir aquella recta que pasa ms cerca de todos los

    puntos. Recordemos que la ecuacin de una recta es y = a + bx. Y debemos calcular los valores de a y

    b para la recta buscada segn las formulas:

    Hombres: Y = -22,05 + 0,54X

    Sxy 30,32

    S2x 56,36= 0,53802

    x

    xy

    SS

    b =

    73,60 95,6511 -22,05== -xbya =

    Mujeres: Y = -61,62 + 0,72X

    yxxySxy =yx

    xy

    SSS

    r

    =

    2x

    xy

    SS

    b =xbya =

  • Universidad Catlica de Valencia San Vicente Mrtir Examen Final de Bioestadstica

    1 de Medicina 10 3 de septiembre de 2010

    Sxy 13,30

    S2y 18,60= 0,71512

    x

    xy

    SS

    b =

    53,50 115,1237 -61,62= - =xbya =

    Recordamos que definimos el coeficiente de determinacin lineal R2 como el cuadrado del coeficiente

    de correlacin y lo interpretaremos como la proporcin de la variabilidad de la variable y explicada

    por el modelo de regresin y = a + bx.

    Hombres r = 0,51 R2

    = 0,26 El modelo explica el 26% de la variabilidad de y en funcin de la

    variabilidad de x

    Mujeres r = 0,72 R2

    = 0,52 El modelo explica el 52% de la variabilidad de y en funcin de la

    variabilidad de x

    2.4 Segn los modelos de regresin construidos, qu peso se espera para un hombre que mide 178 cm?, y para una mujer que mide 162 cm? Para ello no tenemos mas que aplicar la recta obtenida en el apartado anterior, para un valor de x

    (altura) determinado.

    Hombres: Y = -22,05 + 0,54X = -22,05 + 0,54 * 178 = 74,07 Kg.

    Mujeres: Y = -61,62 + 0,72X = -61,62 + 0,72 * 162 = 55,02 Kg.