18
Estadística. Grado en Biología. Universidad de Alcalá. Curso 2017-18. Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Fernando San Segundo. Actualizado: 2017-10-26 Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística. Fernando San Segundo. Actualizado: 2017-10-26 1 / 18

Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

  • Upload
    lehanh

  • View
    215

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Estadística.Grado en Biología. Universidad de Alcalá. Curso 2017-18.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal.

Fernando San Segundo. Actualizado: 2017-10-26

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 1

/ 18

Page 2: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

La curva normal.Empezamos recordando que al estudiar las binomiales con n grande y p moderado noshemos encontrado con la curva normal.

y que A. de Moivre descubrió que esa curva normal es la gráfica de esta función:

fµ,σ(x) = 1σ√2π

e−12 ( x−µ

σ )2

donde, recuérdalo, para la binomial es µ = p · q, σ2 = n · p · q.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 2

/ 18

Page 3: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Cálculos de probabilidad en binomiales con n muy grande.La binomial que aparece en la anterior figura es X ∼ B(n = 100, p = 1/3). Vamos asuponer que queremos calcular esta probabilidad:

P(20 ≤ X ≤ 40) = P(X = 20) + P(X = 21) + · · ·+ P(X = 39) + P(X = 40)

Usaremos la Calculadora de Probabilidad de Geogebra (menú Vista) para visualizar esteproblema.Calcular la probabilidad del intervalo equivale a calcular el área sombreada.

Computacionalmente calcular esa suma de términos implica, por ejemplo, calcular:

P(X = 29) =(10029

)(13

)29 (23

)71

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 3

/ 18

Page 4: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

(continuación. . . )Pero

(10029

)= 100!

29! 71! =

29 factores︷ ︸︸ ︷100 · 99 · 98 · · · 73 · 7229 · 28 · 27 · · · 2 · 1︸ ︷︷ ︸

29 factores

= 1917353200780443050763600

Para calcular este impresionante resultado hemos recurrido a Wolfram Alpha y hemosejecutado la orden 100 choose 29 (en R puedes usar choose(100, 29), pero elresultado es numérico, aproximado, no simbólico).

Recuerda que para calcular P(20 ≤ X ≤ 40) tenemos que calcular 21 coeficientes comoese. ¡Y sólo estamos hablando de n = 100! Imagínate lo que supone calcularP(200 ≤ X ≤ 400) en una binomial B(n = 1000, p = 1/3).

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 4

/ 18

Page 5: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Otra vez la discusión “discreto frente a continuo”.Por otra parte, si volvemos a pensar en una figura como esta (en la que se representa elcálculo P(150 ≤ X ≤ 160) en una X ∼ B(n = 500, p = 1/3))

veremos que cada uno de los valores, cada una de las barras que forman ese gráfico, tieneun peso individual muy pequeño. Lo que importa es el área conjunta. Porque si la variableX puede tomar valores desde 0 hasta 500, ¿crees que la diferencia entre X = 135 yX = 136 será muy relevante en la mayoría de las aplicaciones de esa variable?Esta discusión recuerda a la que ya tuvimos al distinguir entre variables discretas ycontinuas. Cuando una variable toma muchos valores distintos y la diferencia entre valoresindividuales no es relevante, muchas veces es mejor considerarla continua. No nosinteresa la probabilidad de un valor concreto, sino la de un intervalo.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 5

/ 18

Page 6: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Una solución alternativa.Por otra parte, hemos visto que la curva normal describe muy aproximadamente el perfil dela distribución binomial. Así que para calcular la probabilidad de un intervalo, que es lasuma de las áreas de los rectángulos sobre ese intervalo, podemos aproximarla por el áreabajo la curva normal en ese mismo intervalo.

Las dos figuras muestran las dos formas de trabajar para calcular P(a ≤ X ≤ b):

a la izquierda calculamos (de forma exacta)∑b

k=a P(X = k) =∑b

k=a

(nk

)pk q(n−k).

a la derecha, si la curva normal es y = f (x), aproximamos esa probabilidad mediante

P(a ≤ X ≤ b) ≈ área bajo la gráfica de f =∫ b

af (x) dx .

Si crees que la integral es complicada, ¡recuerda cómo son los números combinatorios!

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 6

/ 18

Page 7: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Función de densidad de probabilidad continua.Acabamos de ver una expresión que pretende usar la integral de la función quedescribe la curva normal para calcular (aproximadamente) el valor de probabilidad deuna variable aleatoria binomial.Pero una vez que los matemáticos empezaron a pensar en esa idea, se hizo evidenteque en otros problemas de probabilidad el papel de esa función lo podían representarotras funciones. Así pues necesitamos pensar en cómo usar funciones para definirprobabilidades mediante el área bajo sus gráficas.No nos sirve cualquier función. Pero basta con que se cumplan dos condiciones.

Definición.Una función f (x) es una función de densidad continua si posee estas características:

Es no negativa: f (x) ≥ 0 para todo x ; es decir, f no toma valores negativos.El área total bajo la gráfica de f es 1:∫ ∞

−∞f (x) dx = 1

En particular, la función fµ,σ(x) que define la curva normal es una función dedensidad continua.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 7

/ 18

Page 8: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Distribuciones continuas.Si tenemos una función f (x) con las propiedades que acabamos de ver, entoncesdiremos que f define una variable aleatoria continua X con función de densidad f .En tal caso la probabilidad de que el valor de X pertenezca a cualquier intervalo (a, b)se define así

P(a ≤ X ≤ b) = área bajo la gráfica de f =∫ b

af (x) dx .

que. como ves, es la misma idea que vimos cuando pensamos en usar la curva normalpara aproximar la binomial.

Ejemplo.La función

f (x) =√2

(6

((x − 3)4 + 1) + 3((x + 5)4 + 1)

)es una función de densidad continua. Puedes comprobar que su integral de −∞ a ∞ es 1usando Wolfram Alpha con este comando:integrate f(x) = (sqrt(2) / (9 pi)) * (6 / ((x - 3)^4 + 1) + 3 / ((x + 5)^4 + 1)) from -oo to oo

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 8

/ 18

Page 9: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Ejemplo (continuación)La gráfica de esta función es:

Usemos Wolfram Alpha para calcular tres probabilidades:

P(−6 < x < 4) ≈ 0.26034. Usa este enlaceP(1 < x < 5) ≈ 0.642484. Usa este enlaceP(−2 < x < 0) ≈ 0.0043287. Usa este enlace

Observa los intervalos y el valor de las probabilidades. ¿Notas algo?

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 9

/ 18

Page 10: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Interpretación de la función de densidad.Lo que hemos observado en ese ejemplo es una propiedad general de las funciones dedensidad continuas, que se ilustra en esta figura.

Es en este sentido en el que decimos que una de estas funciones define unadistribución (una forma de repartir) la probabilidad.En las variables discretas teníamos una tabla de valores y probabilidades. Ahoratenemos la función f para hacer el mismo trabajo.Otra observación importante es que sea cual sea x0 se cumple P(X = x0) = 0

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 10

/ 18

Page 11: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Media y varianza de una variable aleatoria continua.Recuerda que para un variable aleatoria discreta con valores x1, . . . , xk yprobabilidades p1, . . . , pk era:

µ = E(X) =k∑

i=1

xi · pi

σ2 = Var(X) =k∑

i=1

(xi − µ)2 · pi

Para una variable aleatoria continua con densidad f (x) se tiene:

µ = E(X) =∫ ∞−∞

x · f (x) dx

σ2 = Var(X) =∫ ∞−∞

(x − µ)2 · f (x) dx

El paso de discreto a continuo se consigue cambiando el sumatorio por una integral yla probabilidad pi por el diferencial de probabilidad dp = f (x) dx (ver la Sección 5.4.2del libro).No hay sorpresa: la media de la curva normal es µ y su varianza es σ2.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 11

/ 18

Page 12: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

La distribución uniforme.Hay otro ejemplo muy importante de variable aleatoria continua (que ya nos hemosencontrado en el Cap. 3). Es la distribución uniforme en el intervalo [a, b]. Estadistribución es la que usamos cuando queremos que ninguna parte del intervalo seamás probable que otra del mismo tamaño.Concretamente, la función de densidad que consigue esto es constante en el intervalo[a, b] y vale 0 fuera:

f (x) =

1

b − a si a ≤ x ≤ b

0 en otro caso

Esta distribución representa la idea intuitiva de que todos los puntos del intervalo sonigual de probables. (¡Pero, cuidado, esa idea es inútil! ¿Ves por qué?)La media de la variable uniforme es, como cabía esperar

µ = a + b2

y su desviación típica es:

σ2 = (b − a)2

12En prácticas veremos cómo usar la función runif para simulaciones.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 12

/ 18

Page 13: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Función de distribución.Recuerda que hemos definido la función de distribución de una variable aleatoria X(¡discreta o continua!) así:

F (k) = P(X ≤ k)

Para una variable continua se traduce en (ver la Sección 5.5 del libro):

F (k) =∫ k

−∞f (x) dx

La gráfica típica de la f. de distribución de una variable discreta tiene forma deescalera (Cap. 4). Para una variable continua la gráfica típica de la función dedistribución es como esta:

Para un intervalo [a, b] se cumple esta propiedad que hace que F sea más útil que f :

P(a < X < b) = F (b)− F (a)

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 13

/ 18

Page 14: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

El zoo de las normalesUna variable aleatoria continua X con función de densidad fµ,σ(x) es una variablenormal y escribiremos X ∼ N(µ, σ) (algunos libros usan N(µ, σ2), cuidado).Ya vimos que las binomiales tienen formas bastante distintas según los valores de n yde p. En el caso de las normales las diferencias no son tan acusadas; todas tienen esaforma acampanada característica. El valor de µ determina el centro de la distribución(que es simétrica) y σ controla cómo de estrecha y alta o ancha y baja es la campana.La figura muestra curvas normales para varios valores de µ y σ.

Vamos a usar el fichero GeoGebra Tut05-CurvasNormalesAreas.ggb para explorar esta idea.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 14

/ 18

Page 15: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Regla 68 - 95 - 99Si X es una variable normal de tipo N(µ, σ) entonces se cumplen estas aproximaciones:

P(µ− σ < X < µ+ σ) ≈ 0.683,

P(µ− 2σ < X < µ+ 2σ) ≈ 0.955

P(µ− 3σ < X < µ+ 3σ) ≈ 0.997

TipificaciónSi X es una variable aleatoria normal de tipo N(µ, σ), entonces la variable que se obtienemediante la transformación de tipificación:

Z = X − µσ

es una variable normal de tipo N(0, 1), la normal estándar a la que siempre llamaremos Z .

La tipificación permite reducir cualquier observación de una normal N(µ, σ) a unaescala universal que nos proporciona la distribución Z .

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 15

/ 18

Page 16: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Ejemplo:Tenemos una variable X ∼ N(123, 17) y observamos el valor 168. ¿Es un valor raro? Pararesponder lo tipificamos:

Z = 158− 12317 ≈ 2.65

Y por la regla 68-95-99 concluimos que menos del 5% de los valores de X son así.

Suma (y mezcla) de normales independientes.Si X1 ∼ N(µ1, σ1) y X2 ∼ N(µ2, σ2) son variables normales independientes, susuma es de nuevo una variable normal de tipo

N(µ1 + µ2,

√σ2

1 + σ22

).

Insistimos, la novedad es que la suma sigue siendo normal.Y este resultado se generaliza a la suma de k variables normales independientes, quedan como resultado una normal de tipo

N(µ1 + · · ·+ µk ,

√σ2

1 + · · ·+ σ2k

).

La mezcla de variables normales es un proceso completamente distinto. A menudo dacomo resultado distribuciones bimodales o multimodales.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 16

/ 18

Page 17: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

Distribuciones normales en R.La función pnorm permite calcular en R la función de distribución de una variablenormal X ∼ N(µ, σ).

P(X < b) = pnorm(b, mean = mu, sd = sigma)

Por eso para calcular la probabilidad de un intervalo [a, b] usamos en R:

pnorm(b, mean = mu, sd = sigma) - pnorm(a, mean = mu, sd = sigma)

La función qnorm resuelve el problema inverso. Dada una probabilidad p nos dice cuáles el valor b tal que:

P(X < b) = p

La usaremos mucho al hacer Inferencia.La función rnorm es muy útil para simulaciones. Sirve para fabricar una muestra conn valores de una variable X ∼ N(µ, σ) mediante:

muestra = rnorm(n, mean = mu, sd = sigma)

¡Atención! mean(muestra) no es mu y sd(muestra) no es sigma. ¿Ves por qué? Cuandoqueramos conseguir eso usaremos la función mvrnorm de la librería MASS (ver tutoriales).

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 17

/ 18

Page 18: Estadística. - Grado en Biología. Universidad de Alcalá ...€¦ · MiralaFigura5.25,página180dellibro,paraentenderesosajustesde1/2. Capítulo 5: El Teorema Central del Límite

El Teorema Central del Límite (1ª versión).Explica como aproximar una binomial X ∼ B(n, p) por normal Y ∼ N(µ, σ).Vamos a usar

µ = n · p, σ = √n · p · q

Entonces, siempre que se cumpla

n · p > 5, n · q > 5

1 para calcular P(k1 ≤ X ≤ k2), la aproximación por la normal que usamos esP(k1 − 0.5 ≤ Y ≤ k2 + 0.5).

2 Para calcular P(X = k), la aproximación por la normal que usamos esP(k − 0.5 ≤ Y ≤ k + 0.5).

3 Para calcular P(X ≤ k), la aproximación por la normal que usamos esP(Y ≤ k + 0.5). Del mismo modo, para P(X ≥ k), la aproximación por la normalque usamos es P(Y ≥ k − 0.5)

Las condiciones sobre n y p significan que estamos en una binomial de n grande y pmoderada.Mira la Figura 5.25, página 180 del libro, para entender esos ajustes de 1/2.

Capítulo 5: El Teorema Central del Límite. Parte 2: distribución normal. Estadística.Fernando San Segundo. Actualizado: 2017-10-26 18

/ 18