10
UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD Si un experimento puede dar lugar a un número infinito y no enumerable de resultados, entonces la variable aleatoria correspondiente debe ser continua. Cuando el valor de una variable aleatoria se “mide” y no se “cuenta” (nivel de agua en un tanque, presión en una caldera, distancia entre dos puntos, etc), queda definida una V.A. continua. En los ejemplos dados, el valor de la variable aleatoria puede ser cualquiera de infinitos números pertenecientes a un intervalo definido (0; n). Cuando hablamos de errores (o sea de desviaciones respecto a la media) que se originan al medir, entonces un valor de la variable aleatoria puede ser cualquier número comprendido entre n y +n (en algunos casos, n puede ser infinito). Las funciones de probabilidad correspondientes a una variable aleatoria continua recibe el nombre de funciones de densidad de probabilidad (f.d.p), o simplemente funciones de densidad. Al referirnos a la función de masa de probabilidad (f.m.p), el valor de P(x=x) se representaba coma la altura de una barra situada en el punto x = x. Una de las principales diferencias entre las distribuciones de probabilidad discretas y las continuas consiste en que una f.d.p. se representa por el área comprendida entre el eje x y la función de densidad. De modo más formalizado, en el límite, cuando x 0, la amplitud del intervalo de clase se denota por el símbolo dx en vez de x. El polígono de frecuencias se llama ahora función de densidad, y la altura de la función de densidad en x = x se denota por (x). Finalmente el símbolo sumatoria se transforma en el de integral a b que se interpreta como “el límite de la suma cuando x 0”: Pa x b Px x fx dx x a b a b lim ( ) () () 0 = Área bajo la curva desde a hasta b Propiedades de todas las funciones de densidad: 1. (x) 0 La función de densidad nunca es negativa . 2. P( x ) = 1 El área total bajo la función de densidad siempre es igual a 1 Distribuciones Continuas - 1 la probabilidad de que la variable aleatoria x caiga entre los valores a y b, P(a x b), es exactamente igual al área que está bajo el polígono de frecuencias, entre a y b

Apunte Distribución Normal (1)

Embed Size (px)

Citation preview

Page 1: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

DISTRIBUCIONES CONTINUAS DE PROBABILIDAD

Si un experimento puede dar lugar a un número infinito y no enumerable de resultados, entonces la variable aleatoria correspondiente debe ser continua. Cuando el valor de una variable aleatoria se “mide” y no se “cuenta” (nivel de agua en un tanque, presión en una caldera, distancia entre dos puntos, etc), queda definida una V.A. continua. En los ejemplos dados, el valor de la variable aleatoria puede ser cualquiera de infinitos números pertenecientes a un intervalo definido (0; n). Cuando hablamos de errores (o sea de desviaciones respecto a la media) que se originan al medir, entonces un valor de la variable aleatoria puede ser cualquier número comprendido entre n y +n (en algunos casos, n puede ser infinito).

Las funciones de probabilidad correspondientes a una variable aleatoria continua recibe el nombre de funciones de densidad de probabilidad (f.d.p), o simplemente funciones de densidad. Al referirnos a la función de masa de probabilidad (f.m.p), el valor de P(x=x) se representaba coma la altura de una barra situada en el punto x = x. Una de las principales diferencias entre las distribuciones de probabilidad discretas y las continuas consiste en que una f.d.p. se representa por el área comprendida entre el eje x y la función de densidad.

De modo más formalizado, en el límite, cuando x 0, la amplitud del intervalo de clase se denota por el símbolo dx en vez de x. El polígono de frecuencias se llama ahora función de densidad, y la altura de la función de densidad en x = x se denota por (x). Finalmente el símbolo sumatoria se

transforma en el de integral a

b que se interpreta como “el límite de la suma cuando x 0”:

P a x b P x x f x dxx

a

b

a

b

lim( ) ( ) ( )

0

= Área bajo la curva desde a hasta b

Propiedades de todas las funciones de densidad:

1. (x) 0 La función de densidad nunca es negativa .

2. P( x ) = 1 El área total bajo la función de densidad siempre es igual a 1

Valores Esperados de Variables Aleatorias Continuas

Como en el caso discreto, con frecuencia se desea resumir la información contenida en una distribución de probabilidad calculando los valores esperados de la variable aleatoria y determinadas funciones de la misma.

El valor esperado de una variable aleatoria continua X que tiene una función de densidad de probabilidad (x), está dada por:

E[x] = x

(x) dxSi g(x) es cualquier función X de valor real, entonces:

E[g(x)] = g x( )

(x) dx

Ejemplo:

Distribuciones Continuas - 1

la probabilidad de que la variable aleatoria x caiga entre los valores a y b, P(a x b), es exactamente igual al área que está bajo el polígono de frecuencias, entre a y b

Page 2: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

Sea X el porcentaje del tiempo que no trabaja un torno de un taller de maquinaria, de una semana de trabajo de 40 hs., que es el tiempo que debería trabajar el torno. Supóngase que X tiene una función de densidad de probabilidad dada por: (x)

3 0 1

0

2x x

en lo demas

Calcular el promedio y la varianza de X

E[x] = x

(x) dx ; E x x dx[ ] x( )0

1 3 2 ; E x x dx[ ]

0

1 33

E xx

[ ] ,

3

4

3

40 75

4

0

1

Así, en promedio, el torno se usa el 75% del tiempo.

Para calcular V[x], se determina primero E[x2] mediante:

E[x2] = x2

(x) dx ; E x x x dx[ ] ( )2 2

0

1 23 ; E x x dx[ ]2

0

1 43

E xx

[ ] ,25

0

1

35

3

50 60

Entonces: V[x] = E[x2] (E[x] )2 = 0,60 (0,75)2 = 0,60 0,5625 = 0,0375

DISTRIBUCIÓN UNIFORME

Dejando por ahora el estudio general de variables aleatorias continuas, para analizar modelos específicos que son útiles en la práctica. Un modelo muy sencillo supone que igualmente probable que x quede en cualquier subintervalo, de longitud d, sin importar dónde queda ese subintervalo dentro de (a , b) siendo a el menor valor que pueda tomar x y b el mayor valor que pueda tomar x. Esta hipótesis conduce a la distribución uniforme de probabilidad, cuya función de densidad de probabilidad está dada por:

(x) = 1

0

b aa x b

en cualquier otro caso

Valor Esperado y Variancia de la distribución uniforme

E[x] = x

(x) dx ; E x xb a

dxa

b[ ]

1

; 1

2 2

2 2

b a

b a a b

E[x2] = x

2 (x) dx ; E x xb a

dxa

b[ ]2

2 1

=

1

3 3

3 3 2 3

b a

b a b ab a

V xb ab a a b

b ab a a b[ ]

2 2 2

2 2 2

3 2

1

124 3

Valor Esperado y Variancia de la distribución uniforme

E xa b

[ ]2

; V xb a

[ ]( )

2

12

Puede ser que el resultado no sea intuitivo, pero se observa que la variancia sólo depende de la longitud del intervalo (a , b )

Problema tipo:

Distribuciones Continuas - 2

(x)

1

b a

a b

Page 3: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

Cuando deja de funcionar una tarjeta de circuito integrado, un sistema de cómputo se detiene hasta que se reponga una tarjeta nueva. El tiempo de reposición X está uniformemente distribuido en el intervalo de uno a cinco días, calcular la probabilidad de que el tiempo de entrega sea de dos o más días.Solución:

El tiempo de entrega X está uniformemente distribuido de uno a cinco días, lo cual da:

f xx

en lo demas( )

1

5 11

4 1 5

0

de esta manera: P(x 2) = 1

42

5 dx = 0,25 (5 2) = 0,75

DISTRIBUCIÓN EXPONENCIAL

Un investigador mide la duración o vida útil de un transistor. En este caso hay un número infinito de valores posibles que puede tomar la variable x. No se puede asignar una probabilidad positiva a c/u de los resultados posibles del experimento por su infinitud. Sin embargo, si se pueden asignar probabilidades positivas a intervalos de números reales de modo consistente con los axiomas de la probabilidad.

Intuitivamente podemos retratar el comportamiento de la duración o vida, dándonos cuenta que no será uniforme la probabilidad de duración a lo largo del tiempo, sino casualmente a medida que este transcurre, va disminuyendo esa probabilidad, la una idea de modelo probabilístico posible es la representación mediante una curva exponencial negativa. En general, la densidad de probabilidad exponencial está dada por:

f xe x

en lo demas

x

( )

10

0

El parámetro es una constante que determina la razón a la cual disminuye la curva.

Función de densidad de probabilidad (f.d.p.) de probabilidad exponencial

Valor Esperado y Variancia de la distribución exponencial

E x[ ] ; V x[ ]2

DISTRIBUCIÓN NORMAL

Es indiscutiblemente la más conocida y usada de todas las distribuciones. Muchos fenómenos naturales tienden a dar como resultado una distribución normal, también la distribución de los errores de medición y la distribución del grado de perfección de diversos procesos de producción. Debido a ello se ha convertido en un patrón de referencia para muchos problemas probabilísticos.

Distribuciones Continuas - 3

P(x)

x

Page 4: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

La distribución normal es una distribución continua en la que x puede tomar cualquier valor comprendido entre { x + }. Dos son los parámetros que describen la distribución normal: µ y la desviación estándar . Una distribución normal con media µ y varianza 2 se denota N(µ, 2 ). La función de densidad es simétrica y de forma acampanada.

La f.d.p. normal contiene dos constantes: (3,14159...) y e (2,71828...)

Función de densidad normal, N(µ, 2 ): f x ex

( )

1

2

1

2

2

para x +

Puesto que (3,14159...) y e (2,71828...) son constantes, si se conoce el valor de µ y de es posible calcular áreas bajo esta función por medio del cálculo integral. Sin embargo, tales áreas (probabilidades) están tabuladas, de modo que no es necesario recurrir al cálculo.

Nótese que el área comprendida bajo la curva entre µ y µ+1 es igual a 0,3413.

Por tanto, P(µ x µ+1) = 0,3413. Por simetría P(µ1 x µ+1) = 2 (0,3413) = 0,6826.

Igualmente puede verse que: P(µ2 x µ+2) = 0,9544

P(µ3 x µ+3) = 0,9987

La regla práctica que hemos estado usando hasta ahora para interpretar el tamaño de la desviación estándar se basa, como vemos ahora, en la distribución normal.

Distribución normal con media µ y desvío estándar

Distribuciones Continuas - 4

(x)

0,399/

µ xµ1 µ+1

x

(x)

µ

= 0,5

= 1,0

= 1,5

0,266

0,399

0,798

Page 5: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

Tres distribuciones normales con diferentes desviaciones estándar.

Estos resultados pueden obtenerse sustituyendo x por µ en la fórmula de la función normal y observando que e 0 = 1 y que 1/2 =0,399. Así cuando = 1,0 se tiene que (µ) = 0,399/1,0. Cuando = 0,5 se tiene que (µ) = 0,399/0,5 = 0,798 y cuando = 1,5 se tiene que (µ) = 0,399/1,5 = 0,266.

Normal EstandarizadaRecuérdese que hemos transformado una variable aleatoria x (que puede ser normal o no) con media µ y

desviación estándar en una variable estandarizada con media cero y desviación estándar 1. Se indicó que la

transformación adecuada es zx

( )

; que tiene E[z] = 0 y V[z] = 1,0. Ahora agregamos el hecho adicional de

que, si la variable aleatoria original (x) tiene distribución normal, entonces la variable estandarizada z tendrá también distribución normal. Si la distribución normal de media µ y variancia 2 la denotamos por N(µ, 2),

entonces zx

( )

es N(0,1).

La interpretación de los valores de z es relativamente simple ya que indica: la distancia de x a la media, en términos de desviaciones estándar. La función de densidad de la variable normal estandarizada

f z e z( ) , 1

20 5 2

Valores normales estandarizados

¿Cómo se calculan las probabilidades expresadas en la forma estandarizada?. Existen tablas de los valores normales estandarizados (llamados valores z) que sirven para este propósito. Antes de describir el uso de la tabla (de Gauss como se la llama también), investigaremos F(z), la función de distribución acumulativa de la variable z. Esta función, nos da P(zz), representada en la siguiente figura:

Función acumulada para los valores z

Nótese que en esta gráfica sólo se han tomado en cuenta los valores de z comprendidos entre -3 y 3, porque hay muy poca área fuera de estos límites. En z = 0 (la media de z), el valor de F(z) es igual a 0,5 porque z = 0 representa la mediana de los valores de z.

Puesto que la distribución normal es completamente simétrica, las tablas de valores z sólo incluyen por lo general los valores positivos de la variable (esto es la mitad positiva de los valores)

z ,00 ,01 ,02 ,03 ,04 ,05 ,06 ,07 ,08 ,090,0 0,0000 0,0040 0,0080 0,0120 0,0160 0,0199 0,0239 0,0279 0,319 0,0359

0,1 0,0398 0,0438 0,0478 0,0517 0,0557 0,0596 0,0636 0,0675 0,0714 0,0753

.... .... .... .... .... .... .... .... .... .... ....

.... .... .... .... .... .... .... .... .... .... ....

Distribuciones Continuas - 5

F(z)

z

P(z<1,25) = F(1,25) = 0,8944

P(z>1,25) = 0,1056

z = 1,25z

Probabilidades = área desde z = 0 hacia adelante

Page 6: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

2,9 0,4981 0,4986

3,0 0,4987 0,4987 0,4987 0,4988 0,4988 0,4989 0,4989 0,4989 0,4990 0,4990

Método de resolución de problemas por medio de la normal estandarizada

Problema referente a una variablenormal x con media µ y varianza 2

(Uso del cálculo demasiado tedioso)

No hay tablas para cada valor de µ y

Obtención de larespuesta alproblema original

Expresar el problema entérminos de la variable normal estandarizada z

Uso de la tabla de la distribución

normal estandarizada

Obtención de larespuesta entérminos de lavariable z

Gráfica de un problema de cálculo probabilístico con Normal Estandarizada

APROXIMACIÓN NORMAL A LA BINOMIAL

Al estudiar la distribución binomial vimos que, cuando el número n de pruebas es grande, resulta difícil efectuar el cálculo de las probabilidades. Cuando el valor de n no figura en la tabla binomial que se dispone, hay que usar la fórmula binomial para determinar el valor exacto de la probabilidad binomial lo que puede suponer una tarea muy pesada. Análogamente, cuando p está expresado con tres o más dígitos significativos (p.e. p = 0,585) no es posible usar la tabla binomial. En vez de resolver esos problemas en forma directa, usaremos la distribución normal, que nos dará una buena aproximación.

Para hallar los valores aproximados de la binomial por medio de la normal podemos asegurarnos de que sus medias sean iguales haciendo µ (la media normal) igual a np (la media binomial), también hacemos 2 = npq. Recordemos que Binomial Normal cuando n ; por lo general, se considera que n es suficientemente grande cuando npq 3 y

Al usar la normal como una aproximación de la binomial, hay que tomar en consideración un factor adicional, consistente en que está tratando de aproximarse una distribución discreta que sólo incluye valores enteros (la binomial) mediante una distribución continua (la normal) en la que x puede tomar cualquier valor comprendido entre y +. La forma usual de resolver este problema es asociar la mitad de cada intervalo (paso) con cada uno de los enteros adyacentes, este ajuste se denomina corrección por continuidad, por ejemplo: P(51 x 59) se convierte en P(50,5 x 59,5)

Problema:Suponga que deseamos calcular la probabilidad de que, en una muestra aleatoria de 100 elementos, por lo menos 60 y no más de 70 cumplan una determinada especificación, dado que la verdadera proporción es del 64% (p = 0,64).

Probabilidad binomial: P(60 x 70) = x

60

70

100Cx(0,64)x(0,36)100x = 0,7397

Aproximación normal: P(59,5 x 70,5) = =

APROXIMACIÓN NORMAL CUANDO SE USA LA PROPORCIÓN BINOMIAL

Distribuciones Continuas - 6

z = (x µ) /

x = µ z . µ

0

xi

zi

P(xi o mayor) = 0,5 P(zi)

Page 7: Apunte Distribución Normal (1)

UTN – FRBB – Ingeniería Civil PROBABILIDAD Y ESTADÍSTICA - 2010

Usando el mismo ejemplo anterior: Proporción Binomial: Px

n0 60 0 70, ,

Aproximación normal: == P(-0,94) z

P(1,35) = 0,73,79

Identidad de Euler :

Fórmula de la Campana de Gauss :

Fórmula de Stirling:

Distribuciones Continuas - 7