Upload
cacatu
View
227
Download
0
Embed Size (px)
DESCRIPTION
estadistica
Citation preview
Bioestadstica Inferencia Ejercicios
1
13,9 19,1 25,2
0,5 39,7
ALG
42,9ALG
42,9
1. Dado el siguiente grafico de tallo y hojas indica el valor correcto para P75:
a. 46,0
b. 46,5
c. 47,0
d. 48,0
e. 49,0
1 : 2 2 2 6 92 : 1 2 2 3 3 3 4 4 5 5 5 7 7 7 7 8 8 8 83 : 0 0 1 1 2 2 6 6 8 84 : 0 0 2 3 3 3 4 5 6 7 9 9 95 : 0 1 1 76 : 3 5 8 97 : 4 9
Hay 57 datos. Para calcular P75 necesitamos
hallar la posicin, que es 5775/100=42,75
que, al ser decimal, se redondea por exceso,
es decir, P75 es el dato que ocupa la posicin
43. Contando: P75=46.
2. Dada la siguiente tabla de distribucin de frecuencias calcule los estadsticos bsicos de tendencia central,
dispersin y posicin y diga qu serie de valores es la correcta:
Media Varianza Desv. P25 Q3
a. 450,00 94,15 9,70 3,5 13,82
b. 11,25 31,19 5,58 8,5 13,82
c. 11,25 29,15 5,40 7,5 13,82
d. 11,25 27,19 5,21 7,5 13,82
e. 15,35 27,19 6,42 9,6 13,82
Intervalo MC ni Ni fi Fi ci hi xini xi2ni
[0] - [5[ 2,5 3 3 7,5% 7,5% 5 0,60 7,5 18,8[5] - [10[ 7,5 14 17 35,0% 42,5% 5 2,80 105,0 787,5
[10] - [15[ 12,5 17 34 42,5% 85,0% 5 3,40 212,5 2656,3[15] - [20[ 17,5 3 37 7,5% 92,5% 5 0,60 52,5 918,8[20] - [25[ 22,5 2 39 5,0% 97,5% 5 0,40 45,0 1012,5[25] - [30] 27,5 1 40 2,5% 100,0% 5 0,20 27,5 756,3
40 100% 450 6.150
=450/40=11,25; 2=6150/40-11,252=27,19; =5,21; P25=5+5(10-3)/14=7,5; Q3=10+5(30-17)/17=13,82 3. Cul es el principal hndicap que desde el punto de vista de la interpretacin del valor presenta la covarianza?
a. Depende del tamao de la muestra.
b. Sus valores suelen ser muy elevados.
c. Depende de la escala de las variables. (mismas unidades que los datos, elevadas al cuadrado)
d. Es difcil de obtener.
e. Ninguna de las anteriores es cierta.
4. Dada el siguiente grafico de caja y bigotes, que muestra las
demoras en consultas externas de 21 servicios de un Hospital
comarcal, diga cul de las siguientes afirmaciones no es
correcta:
a. El 50% de los servicios tiene una demora entre 13,9 y 25,2 das.
b. 5 Servicios tiene una demora entre 0,5 y 13,9 das.
c. La mediana de demora en el hospital es de 20 das (algo mayor que la media).
d. El 75% de los servicios tiene una demora entre 0,5 y 25,2 das.
e. El servicio de Alergologa (ALG) se considera un valor anmalo en el estudio.
c es falsa, ya que la mediana es 19,1, ligeramente menor que la media.
5. Construimos un modelo de regresin lineal simple para explicar la variabilidad en el tiempo de reaccin (TR) ante
cierto estmulo, medido en segundos, a partir de la edad del paciente, empleando una muestra formada por 20
individuos afectados por cierta dolencia, obteniendo: Y = 0,35 + 0,01X. Indica cul de las siguientes conclusiones
se puede alcanzar a partir del enunciado:
a. El coeficiente de correlacin lineal entre la edad y el TR es negativo.
b. El modelo explica el 35% de la variabilidad en el TR para los 20 individuos incluidos en la muestra.
c. El tiempo medio de reaccin se incrementa 0,01 segundos por cada ao adicional del paciente.
d. Si un individuo tiene una edad de 30 aos, su TR es igual a 0,65.
e. El modelo explica el 10% de la variabilidad en el TR para los 20 individuos incluidos en la muestra.
a es falsa, ya que el coeficiente de correlacin lineal tiene el mismo signo que la pendiente, que es b=0,01>0.
b es falsa, ya que no conocemos el valor del coeficiente de determinacin lineal R2 y en b afirma que es 0,35.
d es falsa, ya que lo que sabemos es que para los individuos de 30 aos TR vale, en promedio 0,65.
e es falsa por el mismo motivo que lo era b.
Bioestadstica Inferencia Ejercicios
2
Enunciado comn para los ejercicios 6 y 7: Tenemos un test diagnstico cuya sensibilidad es del 90% y cuya
especificidad es del 80% y lo aplicamos a una poblacin en la que la prevalencia de la enfermedad es del 25%.
E S
+ 225 150 375
25 600 625
250 750 1000
6. Para un individuo que da positivo en el test, la
probabilidad de que padezca la enfermedad es:
a. 10,0%
b. 96,0%
c. 6,5%
d. 60,0%
e. Ninguna de las anteriores.
7. Para un individuo que da negativo en el test, la
probabilidad de que padezca la enfermedad es:
a. 10,0%
b. 96,0%
c. 6,5%
d. 60,0%
e. Ninguna de las anteriores. ( ) 6,0375225| ==+EP ( ) 04,062525| ==EP Enunciado comn para los ejercicios 8 y 9: Se estima que el 5% de los nios padecen TDAH (Trastorno por Dficit
de la Atencin e Hiperactividad). Entre los nios con TDAH, el 40% de ellos padece desrdenes del sueo, que slo se
registran en el 10% de los nios sin TDAH.
D No D
TDAH 20 30 50
No TDAH 95 855 950
115 885 1000
8. Para un nio elegido al azar, la probabilidad de que
tenga uno y slo uno de ambos problemas es:
a. 1%
b. 2%
c. 3%
d. 4%
e. Ninguna de las anteriores.
9. Para un nio que no padece desrdenes del sueo, la
probabilidad de que padezca TDAH es, aprox.:
a. 60,0%
b. 84,3%
c. 90,5%
d. 96,9%
e. Ninguna de las anteriores.
( ) 125,01000
9530uno slo =
+=P ( ) 0339,0
885
30==DTDAH|P
10. Cierto test diagnstico acierta sobre el 100% de los individuos sanos y el 50% de los enfermos. Cierta persona pasa
el test con resultado positivo. Entonces:
a. Est sana.
b. Est enferma.
c. Existe una probabilidad del 50% de que est sana.
d. Existe una probabilidad del 75% de que est sana.
e. Existe una probabilidad del 95% de que est enferma.
Si estuviera sano le habra dado negativo, ya que
acierta sobre el 100% de los sanos, como le ha dado
positivo no puede estar sano, luego estar enfermo.
Enunciado comn para los ejercicios 11 y 12: En las urgencias de un hospital se registran, en promedio, 8 pacientes
cada hora, segn un proceso de Poisson.
11. La probabilidad de que en un periodo de 15 minutos
se registren 4 ms pacientes es, aproximadamente:
a. 14,3%
b. 48,2%
c. 5,3%
d. 26,4%
e. Ninguna de las anteriores.
X = pacientes registrados en 15 X~Po(=2) ( ) ( ) ( )
1429,08571,01
31414
==
==
>=>>
N
NN
XP
XPXPXP(
Bioestadstica Inferencia Ejercicios
3
Enunciado comn para los ejercicios 13 y 14: En cierta poblacin el tiempo de reaccin a un estmulo (TR) tiene una
distribucin normal con media igual a 0,4 segundos y desviacin tpica igual a 0,05 segundos. ( )05,0;4,0~ == NX
13. La probabilidad de que un individuo elegido al azar
tenga un TR entre 0,36 y 0,46 segundos es, aprox.:
a. 33,7%
b. 22,6%
c. 87,4%
d. 60,0%
e. 67,3%.
14. Un tiempo de reaccin que slo es superado por el
10% de los individuos de la poblacin es, aprox.:
a. 0,464 segundos
b. 0,336 segundos
c. 0,501 segundos
d. 0,299 segundos
e. 0,523 segundos
( )( )( ) ( )( ) ( )( )
6730,07881,018849,0
8,012,1
8,02,1
2,18,0
05,0
4,046,0
05,0
4,036,046,036,0
=+=
==
=
=
ZPZP
ZPZP
ZP
ZPXP(
Si lo supera el 10%, el 90% queda por debajo P90
( ) 9,005,0
4,09,0 9090 =
= PZPPXP
Al ser ( ) 464,028,105,0
4,09,028,1 90
90==
= PP
ZP
15. Indica cul de las siguientes afirmaciones es correcta:
a. Para los estimadores insesgados el error cuadrtico medio es menor que la varianza.
b. Todo estimador insesgado es mximo verosmil, aunque no todo estimador mximo verosmil es insesgado.
c. Entre dos estimadores sesgados, el que tenga menor varianza tendr menor error cuadrtico medio.
d. Entre dos estimadores sesgados, el que tenga menor sesgo tendr menor error cuadrtico medio.
e. Entre dos estimadores insesgados, el que tenga menor varianza tendr menor error cuadrtico medio.
a es falsa, ya que ECM=Varianza + Sesgo2, por lo que ser mayor o igual, no menor.
b es falsa, para una variable normal S2 es un estimador insesgado de 2,pero no es mximo verosimil. c es falsa, ya que depende de lo grande que sea el sesgo de cada uno de los estimadores (no dice que sea iguales).
d es falsa, ya que falta saber lo que vale la varianza de cada uno de los estimadores.
e es cierta, ya que para los estimadores insesgados el ECM coincide con la varianza.
16. En determinadas circunstancias interesa calcular un ndice combinado de dos variables: X = tiempo de reaccin a
un estmulo auditivo e Y = tiempo de reaccin a un estmulo visual. Ambas variables se miden en segundos y, en
las circunstancias consideradas, se asume que ambas variables son independientes, con distribucin:
( )05,0;4,0~ == NX ( )08,0;8,0~ == NY El ndice se construye mediante la expresin: YXI 6,04,0 += . Indica cul de las siguientes afirmaciones en relacin
a la distribucin del ndice es la correcta:
a. ( )0027,0;64,0~ == NI b. ( )052,0;64,0~ == NI c. ( )068,0;64,0~ == NI d. ( )06957,0;64,0~ == NI e. ( )06,0;64,0~ == NI
La media de I ser 64,08,06,04,04,06,04,0 =+=+= YXI La varianza de I ser:
0027,008,036,005,016,06,04,0 2222222 =+=+= YXI
Enunciado comn para las preguntas 17 y 18: Se estima que la incidencia de TDAH en nios es del 5%.
17. La probabilidad de que en un aula con 40 nios
encontremos 2 ms con TDAH es, aprox.:
a. 40,6%
b. 48,2%
c. 50,0%
d. 59,4%
e. 9,7%
18. La probabilidad de tener que examinar a ms de 5
nios para encontrar al primero con TDAH es, aprox:
a. 4,1%
b. 81,5%
c. 12,9%
d. 77,4%
e. 16,8%
X = nios con TDAH en el aula X~Bi(n=40;p=0,05)
Xp~Po(=400,05=2) ( ) ( ) ( ) ( )
5940,04060,01
112122
==
=
Bioestadstica Inferencia Ejercicios
4
Enunciado comn para las preguntas 19 y 20: El tiempo de reaccin ante un estmulo visual (TR) es, para los
individuos sanos, una variable normal con media = 0,4 y desviacin tpica = 0,05. Hemos tomado una muestra formada por 16 individuos diagnosticados de adiccin a los juegos electrnicos (JE), para los que la media muestral de
TR ha resultado igual a 0,5, con una desviacin tpica muestral igual a 0,15.
19. Con una significacin del 5%, concluimos:
a. No hay diferencia significativa en la media de TR para los individuos sanos y las adictos a los JE.
b. La adiccin a los JE incrementa de manera significativa el valor medio de TR.
c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que el valor medio de TR es igual
para los individuos sanos y los adictos a los JE.
d. El TR medio para los adictos a los JE est entre 0,42 y 0,58 segundos.
e. b y d son ciertas.
( ) [ ]58,0;42,008,05,00375,01314,25,016
15,05,0 025,0;15%5 ==== tIC
Como 0,4 queda por debajo del intervalo de confianza podemos decir que la media de TR para los adictos a los JE
es significativamente menor que para los individuos sanos.
d es falsa por ser demasiado categrica, no podemos afirmar que el TR medio de los adictos a los JE est dentro
del intervalo, slo podemos decir que tenemos una confianza del 95% de que lo est.
20. Si estamos interesados en contrastar la hiptesis de que la media de TR para los adictos a JE sigue siendo 0,4 frente
a que dicha media es diferente de 0,4, indica cul de los siguientes valores te parece ms adecuado para el p-value:
a. 0,0176
b. 0,0505
c. 0,1623
d. 0,0005
e. 0,9410
Hemos visto que para una significacin del 5% el intervalo de confianza es [0,42; 0,58]. Para
alcanzar en el extremo del intervalo el valor 0,4 deberamos ensanchar un poco el intervalo, es decir,
debera disminuir un poco, es decir, el p-value es un poco menor que 0,05.
21. Estamos interesados en comparar el tiempo de reaccin ante cierto estmulo (TR) entre hombres y mujeres, para lo
que hemos tomado una muestra formada por 20 hombres y 20 mujeres, obteniendo una media muestral igual a 0,40
para los hombres y 0,38 para las mujeres, siendo las varianzas muestrales 0,00009 y 0,00011, respectivamente.
Asumimos que ambas variables son normales, con la misma varianza, aunque esta es desconocida. Si = 0,05, podemos concluir:
a. No hay diferencia significativa en la media de TR para los hombres y las mujeres.
b. La adiccin a los JE incrementa de manera significativa el valor medio de TR.
c. No hemos encontrado una evidencia lo suficientemente fuerte para rechazar que el valor medio de TR es igual
para los hombres y las mujeres.
d. El TR medio para los hombres es significativamente mayor que para las mujeres.
e. a y c son ciertas.
Comparacin de dos medias con varianzas desconocidas, pero iguales, con dos muestras normales independientes.
01,00001,00001,038
00011,01900009,0192===
+= pp SS
( ) [ ]0336,0;0136,00064,002,000316,00244,202,020
1
20
101,038,040,0 025,0;38%5 ===+= tIC MH
El intervalo no contiene al cero y ambos extremos son positivos, por lo que la diferencia es significativamente
positiva, es decir la media de TR es significativamente mayor para los hombres que para las mujeres.
22. Queremos estudiar si cierta intervencin afecta al tiempo de reaccin ante cierto estmulo (TR), para lo que hemos
tomado una muestra formada por 16 individuos para los que se ha medido el TR antes y despus de la intervencin.
El intervalo de confianza para la diferencia de medias ha resultado: ( ) [ ]02,0;01,0%5 = ADIC . Si = 0,05, podemos concluir:
a. La intervencin no afecta de manera significativa a la media de TR.
b. El TR es significativamente mayor despus de la intervencin que antes de la misma.
c. Hemos encontrado una evidencia lo suficientemente fuerte para rechazar la igualdad en el valor medio de TR
antes y despus de la intervencin, en favor de una disminucin del mismo despus de la intervencin.
d. La intervencin reduce el TR.
e. La intervencin aumenta el TR.
Comparacin de dos medias con datos pareados.
El intervalo no contiene al cero y ambos extremos son positivos, por lo que la diferencia es significativamente
positiva, es decir la media de TR despus de la intervencin es significativamente mayor que antes de la misma.
e es falsa por ser demasiado categrica. Tenemos una evidencia fuerte de que la intervencin incrementa el valor
medio de TR, pero no podemos afirmarlo. Adems, en e no se menciona el valor medio de TR, sino de TR.
Bioestadstica Inferencia Ejercicios
5
Enunciado comn para las preguntas 23, 24, 25 y 26: En una clnica tienen 3 especialidades diferentes: {A, B, C} y
estn interesados en saber si la proporcin de pacientes que acuden a consulta es la misma para las tres especialidades.
Para ello toma una muestra aleatoria de 120 pacientes, de los que 30 eran de la especialidad A, 35 de la especialidad B y
55 de la especialidad C.
23. Indica cul de las siguientes afirmaciones resume las conclusiones que se pueden alcanzar con los resultados
obtenidos para los 120 coches:
a. Para = 0,05 aceptamos la igualdad de proporciones, pero para = 0,01 la rechazamos.
b. Para = 0,05 rechazamos la igualdad de proporciones, pero para = 0,01 la aceptamos.
c. Aceptamos la igualdad de proporciones tanto para = 0,05 como para = 0,01.
d. Rechazamos la igualdad de proporciones tanto para = 0,05 como para = 0,01.
e. No podemos contestar a la pregunta por no conocer el p-value del contraste.
H0: pA=pB=pC=1/3; Si H0 d~22; 99,52 05,0;2 = ; 21,92 01,0;2 =
A B C
O 30 35 55
T 40 40 40
( ) ( ) ( ) 75,840
4055
40
4035
40
4030222
=
+
+
=d
d est entre ambos lmites, por lo que con = 0,05 rechazamos H0 y con = 0,01 la aceptamos.
24. De entre los siguientes valores, Cul te parece ms creble para ser el p-value del contraste del ejercicio 23?:
a. 0,045
b. 0,472
c. 0,875
d. 0,013
e. 0,002
d est entre 5,99 y 9,21, pero est ms cerca de 9,21, por lo que el p-value estar entre 0,05 y 0,01,
pero ms cerca de 0,01.
25. Entre los 30 de la especialidad A 20 eran hombres y 10 eran mujeres; Entre los 35 de la especialidad B 25 eran
hombres y 10 eran mujeres; Entre los 55 de la especialidad C 27 eran hombres y 28 eran mujeres. Con estos datos y
para una significacin = 0,05, podemos decir:
a. Hemos encontrado una evidencia fuerte que nos permite rechazar la independencia entre el sexo del paciente y
la especialidad a la que acude.
b. Hemos encontrado una relacin significativa entre el sexo del paciente y la especialidad a la que acude
c. Aceptamos que la especialidad a la que acude el paciente no depende de su sexo.
d. Las respuestas a y b son correctas.
e. Ninguna de las respuestas anteriores es correcta.
H0: La especialidad es independiente del sexo; Si H0 d~22; 99,52 05,0;2 =
Obs A B C Teo A B C
H 20 25 27 72 H 18 21 33
M 10 10 28 48 M 12 14 22
30 35 55 120
( ) ( )19,5
22
2228
18
182022
=
++
= Ld
d es menor que el valor crtico, por lo que aceptamos la hiptesis nula.
26. De entre los siguientes valores, Cul te parece ms creble para ser el p-value del contraste del ejercicio 25?:
a. 0,075
b. 0,175
c. 0,045
d. 0,015
e. 0,475
d est un poco por debajo de 5,99, por lo que el p-value ser un poco mayor que 0,05.
27. Queremos estimar la proporcin de empresas en las cuales la Direccin General es ocupada por una mujer,
asegurando que la probabilidad de cometer un error de estimacin mayor que 0,05 sea menor que 0,10 y asumiendo
que dicha proporcin nunca sobrepasar el 30%
De los siguientes valores, cul se aproxima ms al tamao muestral mnimo necesario para asegurar nuestro
objetivo?
a. 81
b. 664
c. 228
d. 558
e. 271
Tamao muestral para estimar una proporcin con =0,1 y d=0,05. Como sabemos que p no supera el 30%, el peor de los casos es p=0,3.
( ) ( ) 2283,22721,005,0
6449,13,013,0
05,01
22
05,0
2
2=
=
=
=
zpp
d
zn
Bioestadstica Inferencia Ejercicios
6
28. Al construir un intervalo de confianza para la diferencia de medias de dos poblaciones normales, con varianzas
iguales, aunque desconocidas, con una significacin del 5%, resulta: ( ) [ ]32,1;21,4%5 = YXIC , la conclusin para dicho resultado es:
a. Aceptamos que ambas medias son iguales.
b. No podemos contestar a la pregunta si no conocemos el p-value.
c. La media de X es significativamente mayor que la de Y.
d. La media de X es significativamente menor que la de Y.
e. Ninguna de las anteriores afirmaciones es correcta.
Hemos encontrado una evidencia muy fuerte de que 0
Bioestadstica Inferencia Ejercicios
7
Hoja de Respuestas
Grupo:
Nombre y Apellidos:
a b c d e
1 2 3 4 5 6 7 8 9
10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28