5
Estad´ ıstica Computacional ILI 280 Certamen II. Viernes 26.09.14 1. (a) Si denotamos por x, y, z los datos correspondientes a los sistemas 1, 2y3 sort(x)=0.061 0.079 0.128 0.147 0.158 0.162 0.191 0.194 0.226 0.284 sort(y)=0.089 0.122 0.144 0.153 0.166 0.172 0.172 0.176 0.187 0.188 sort(z)=0.043 0.066 0.076 0.080 0.081 0.083 0.084 0.087 0.089 0.113. De este modo, Sistema 1 Sistema 2 Mediana 0.5 · x 5 +0.5 · x 6 0.16 0.5 · y 5 +0.5 · y 6 0.169 Q 1 x 3 0.128 y 3 0.144 Q 3 x 8 0.194 y 8 0.176 IQR Q 3 - Q 1 0.066 Q 3 - Q 1 0.032 Tol. Outliers 1.5 · IQR 0.099 1.5 · IQR 0.048 Lim. Sup. Outliers Q 3 +1.5 · IQR 0.293 Q 3 +1.5 · IQR 0.224 Lim. Inf. Outliers Q 1 - 1.5 · IQR 0.029 Q 1 - 1.5 · IQR 0.096 Outliers? NO NO SI: y 1 0.089 Sistema 3 Mediana 0.5 · z 5 +0.5 · z 6 0.082 Q 1 z 3 0.076 Q 3 z 8 0.087 IQR Q 3 - Q 1 0.011 Tol. Outliers 1.5 · IQR 0.0165 Lim. Sup. Outliers Q 3 +1.5 · IQR 0.1035 Lim. Inf. Outliers Q 1 - 1.5 · IQR 0.0595 Outliers SI: z 1 ,z 10 0.043, 0.113 Criterios: +10 por cuart´ ıles y explicaci´ on del c´ alculo en al menos1 sistema. +15 por alculo de bigotes y detecci´ on de outliers. +15 por representaci´ on gr´ afica correcta. (b) La primera muestra exhibe un alto grado de simetr´ ıa (ausencia de sesgo) lo que se verifica cuantitativamente al comparar la media y la mediana (0.163 versus 0.16). La dispersi´on es significativamente mayor que aquella de las muestras 2 y 3, tanto en los 2 cuart´ ıles centrales como globalmente. Esto se verifica sea al comparar las desviaciones est´ andar (0.066 versus 0.031 y 0.018) que al comparar los IQR (0.066 versus 0.032 y 0.011). Esta muestra no presenta outliers. 1

PautaC1 II 2014

Embed Size (px)

DESCRIPTION

Prueba Estadistica

Citation preview

  • Estadstica Computacional ILI 280Certamen II. Viernes 26.09.14

    1. (a) Si denotamos por x, y, z los datos correspondientes a los sistemas 1, 2 y 3sort(x)=0.061 0.079 0.128 0.147 0.158 0.162 0.191 0.194 0.226 0.284sort(y)=0.089 0.122 0.144 0.153 0.166 0.172 0.172 0.176 0.187 0.188sort(z)=0.043 0.066 0.076 0.080 0.081 0.083 0.084 0.087 0.089 0.113.De este modo,

    Sistema 1 Sistema 2Mediana 0.5 x5 + 0.5 x6 0.16 0.5 y5 + 0.5 y6 0.169Q1 x3 0.128 y3 0.144Q3 x8 0.194 y8 0.176IQR Q3 Q1 0.066 Q3 Q1 0.032Tol. Outliers 1.5 IQR 0.099 1.5 IQR 0.048Lim. Sup. Outliers Q3 + 1.5 IQR 0.293 Q3 + 1.5 IQR 0.224Lim. Inf. Outliers Q1 1.5 IQR 0.029 Q1 1.5 IQR 0.096Outliers? NO NO SI: y1 0.089

    Sistema 3Mediana 0.5 z5 + 0.5 z6 0.082Q1 z3 0.076Q3 z8 0.087IQR Q3 Q1 0.011Tol. Outliers 1.5 IQR 0.0165Lim. Sup. Outliers Q3 + 1.5 IQR 0.1035Lim. Inf. Outliers Q1 1.5 IQR 0.0595Outliers SI: z1, z10 0.043, 0.113

    Criterios: +10 por cuartles y explicacion del calculo en al menos1 sistema. +15 porcalculo de bigotes y deteccion de outliers. +15 por representacion grafica correcta.

    (b) La primera muestra exhibe un alto grado de simetra (ausencia de sesgo) lo que severifica cuantitativamente al comparar la media y la mediana (0.163 versus 0.16). Ladispersion es significativamente mayor que aquella de las muestras 2 y 3, tanto en los 2cuartles centrales como globalmente. Esto se verifica sea al comparar las desviacionesestandar (0.066 versus 0.031 y 0.018) que al comparar los IQR (0.066 versus 0.032 y0.011). Esta muestra no presenta outliers.

    1

  • Figure 1: Boxplot P1.

    La segunda muestra presenta un evidente sesgo negativo que se verifica al compararla media y la mediana (0.1569 versus 0.169). La diferencia esta fuertemente determi-nada por el outlier inferior (0.089). La dispersion es significativamente menor que en laprimera muestra, tanto en los 2 cuartles centrales como globalmente. Tanto usando lasdesviaciones estandar (0.031 versus 0.066) como los IQR (0.032 versus 0.066), tenemosque la dispersion es la mitad de la observada en el primer caso.

    La tercera muestra no exhibe un sesgo considerable (media 0.08 versus 0.082) y mues-tra una dispersion significativamente menor que la primera y menor que la segunda, enterminos absolutos. Esto se verifica sea al comparar las desviaciones estandar (0.018versus 0.066 y 0.031) que al comparar los IQR (0.011 versus 0.066 y 0.032). Esta mues-tra presenta 2 outliers: uno inferior y otro superior que se compensan en el calculo demedia y varianza.

    Criterios: +10 explicar correctamente la simetra/asimetra y +10 por referirse a ladispersion. Todo debe ser justificado cuantitativamente con medidas estadsticas, porejemplo: x x e IQR.

  • (c) El sistema 3 muestra errores considerablemente menores que los demas, que se verifica alcomparar tanto las medias como las medianas. La diferencia es en todos los casos mayorque la dispersion medida tanto en terminos del IQR como de la desviacion estandar. Esimportante considerar la dispersion al medir la diferencia en terminos de tendencia, puesla diferencia podra deberse a efectos del muestreo aleatorio (10 casos de una poblacionvirtualmente infinita): si la dispersion fuese considerablemente mayor que la diferenciaobservadas entre las medianas (o las medias) esta diferencia no podra considerarseconcluyente. Tendra sentido elegir un sistema en base al IQR pues este refleja que tanvariable (poco confiable) es el comportamiento del sistema.

    Criterios: +3+3+5+4 por cada sub-pregunta.

    (d) Cambiar la escala a centmetros, corresponde a escalar la variable de interes por 100.Por lo tanto las medias, medianas, IQR y desviaciones estandares se escalaran por lamisma cantidad. x = 163, y = 156.9, z = 80.2, x = 160, y = 169, z = 82, Sx = 66,Sy = 31, Sz = 18, IQRx = 66, IQRy = 32, IQRz = 11. Las varianzas se escalaran porun factor 1002: S2x = 66

    2, S2y = 312, S2z = 18

    2.

    Criterios: +7 por lo que se mantiene, +8 por lo que cambia.

    (e) Puede crecer hasta y las estadsticas de orden se mantendran. Puede tambiendecrecer hasta acercarse infinitesimalmente a Q3.

    Criterios: +5+5 por cada lmite.

    2. (a) Definamos los eventos:N: Nino sicologicamente normal. AN: Nino sicologicamente anormal. Ri: Elige re-spuesta i, i = 1, 2, 3.

    P (R2) = P (R2|N)P (N) + P (R2|AN)P (AN) = 0.25 0.7 + 0.2 0.3 = 0.235(b) Comparemos las dos probabilidades condicionales (P (N |R2) y P (AN |R2)):

    P (N |R2) = P (R2|N)P (N)P (R2)

    =0.25 0.7

    0.235= 0.7447

    P (AN |R2) = P (R2|AN)P (AN)P (R2)

    =0.2 0.30.235

    = 0.2553

    P (N |R2) > P (AN |R2), por lo tanto clasificaremos como normal al que elige la segundarespuesta.

    (c) Errar en la clasificacion es equivalente a clasificar como normal a un nino anormal yvice versa. Definamos los eventos:CAN: Clasificar a un nino como anormal.CN: Clasificar a un nino como normal.Entonces,

    P (err. clas.) = P (CAN |N)P (N) + P (CN |AN)P (AN)Ademas, clasificaremos mal a un nino normal solamente si eligio la tercera respuesta, ycometeremos un error con un nino anormal, solo si eligio algunas de las dos primerasrespuestas, por lo tanto:

  • P (err. clas.) = P (R3|N)P (N)+P ((R1R2)|AN)P (AN) = 0.20.7+(0.15+0.2)0.3 = 0.245Criterios: +8 si se calularon (correctamente) las probabilidades P (R3|N), P (R1|AN) yP (R2|AN). Notar que estas no son el resultado que se pide.

    (d) Para la respuesta i, clasificaremos al nino normal si P (N |Ri) > 0.5 Por lo tanto, parala primera respuesta tenemos que: P (R1) = P (R1|N)P (N) + P (R1|AN)P (AN) =0.55 p + 0.15 (1 p) = 0.15 + 0.4pP (N |R1) = P (R1|N)P (N)P (R1) =

    0.55p0.15+0.4p

    > 0.5 Si p > 0.2143

    Usando el mismo criterio para las respuestas 2 y 3:

    P (R2) = P (R2|N)P (N) + P (R2|AN)P (AN) = 0.25 p + 0.2 (1 p) = 0.2 + 0.05pP (N |R2) = P (R2|N)P (N)P (R2) =

    0.25p0.2+0.05p

    > 0.5 Si p > 0.4444

    P (R3) = P (R3|N)P (N) + P (R3|AN)P (AN) = 0.2 p + 0.65 (1 p) = 0.65 0.45pP (N |R3) = P (R3|N)P (N)P (R3) =

    0.2p0.650.45p > 0.5 Si p > 0.7647

    Por lo tanto, p > 0.7647 es la restriccion mas fuerte.

    Criterios: +8 si se inicio el calculo de modo correcto y no se completo.-7 si no seconcluyo diciendo p > 0.7647.

    3. (a) Sea X el numero de licitaciones que se adjudica la empresa. X Bin(n, p)Entonces la probabilidad de que se adjudique al menos 3 es:P (X 3) = P (X = 3) + P (X = 4) = (4

    3

    )0.430.61 +

    (44

    )0.440.60 = 0.1152 + 0.0256 =

    0.1408

    (b) Sea B el beneficio total de la empresa.

    B = 11X 5Y,X Y.Donde Y es el numero de bases que la empresa compro.

    Tenemos que EX [B|Y ] =4

    x=0 (B|Y )p(x|y). Donde p(x|Y = y) =(yx

    )0.4x0.6yx, x =

    0, 1, ..., y.

    Calculemos E[B|Y = 2]. En este caso,B =

    {11X 10 X 20 e.t.o.c.

    .

    Ademas p(0|Y = 2) = 0.62 = 0.36, p(1|Y = 2) = 2 0.6 0.4 = 0.48, p(2|Y = 2) =0.42 = 0.16

    Entonces,

    E[B|Y = 2] =2

    x=0

    (11x 10)p(x|y)

    = 10 0.36 + 1 0.48 + 12 0.16 = 1.2.Ahora calculemos E[B|Y = 3] En este caso,B =

    {11X 15 X 30 e.t.o.c.

    .

  • Ademas p(0|Y = 3) = 0.63 = 0.216, p(1|Y = 3) = 3 0.62 0.4 = 0.432, p(2|Y = 3) =3 0.42 0.6 = 0.288, p(3|Y = 3) = 0.42 = 0.064 Por lo tanto,

    E[B|Y = 3] =x=0

    3(11x 15)p(x|y)

    = 15 0.216 4 0.432 + 7 0.288 + 36 0.064 = 0.6480.

    E[B|Y = 3] > E[B|Y = 2], por lo que en promedio, es mas conveniente que la tiendase presente a 3 licitaciones.

    (c) Sea W el numero de licitaciones ganadas sobre un total de 10 licitaciones abiertas ysiendo 6 de ellos usados.W HipGeo(10, 6, n).Entonces, P (W = 2) =

    4i=0 P (W = 2|n = i)P (n = i), donde P (n = i) proviene

    de la binomial(4,0.4), entonces: p(0) = 0.1296, p(1) = 0.3456, p(2) = 0.3456, p(3) =0.1536, p(4) = 0.0256 Si se compran 0 o 1 bases es imposible adjudicarse 2. Por lo queP (W = 2|n = i) = 0, i = 0, 1.Para i = 2, 3, 4:

    P (W = 2|n = i) =(62

    )(4

    n2)(

    10n

    ) .As P (W = 2|n = 2) = 0.3333, P (W = 2|n = 3) = 0.5, P (W = 2|n = 4) = 0.4286.Reemplazando los valores tenemos que,

    P (W = 2) = 0.3333 0.3456 + 0.5 0.1536 + 0.4286 0.0256 = 0.203

    (d) Sabemos que X Bin(4, p), donde E[X|p = p0] = n p0.Ademas,P (p = 0.4) = 0.3, P (p = 0.5) = 0.5, P (p = 0.65) = 0.2

    Entonces,

    E[X] = E[X|p = 0.4]P (p = 0.4) + E[X|p = 0.5]P (p = 0.5) + E[X|p = 0.65]P (p = 0.65)= 1.6 0.3 + 2 0.5 + 2.6 0.2 = 2

    Por lo tanto, la tienda espera vender 2 motores.

    CVV+RNA LATEX