Upload
daniel-webb
View
48
Download
1
Embed Size (px)
Citation preview
DISTRIBUCIONES DE PROBABILIDAD
Una distribucin de probabilidad describe los valores posibles que puede
tomar una variable aleatoria y las probabilidades asociadas a esos valores.
Dependiendo del tipo de variable aleatoria, podemos tener distribuciones
continuas, definidas por la densidad de probabilidad, o distribuciones
discretas, definidas por la funcin de probabilidad. Tanto la densidad como
la funcin de probabilidad dependen de uno o ms parmetros. Algunas
distribuciones continuas pueden asumir diferentes formas y tamaos,
dependiendo del valor de los parmetros.
Si la variable es discreta, existe la probabilidad de que la variable tome un
valor especfico.
Si la variable es continua, slo se puede determinar la probabilidad de que
la variable tome un valor dentro de un intervalo.
Existen tres tipos de parmetros bsicos:
PARAMETRO DE FORMA: que controla la forma bsica de la
distribucin, y que dependiendo del tipo de distribucin, el cambio puede
ser leve o severo.
PARAMETRO DE ESCALA: que controla la unidad de medida dentro
del rango de la distribucin. Cambiando este parmetro, la distribucin se
contrae o se expande a lo largo del eje horizontal.
PARAMETRO DE LOCALIZACION: que especifica la localizacin de
la distribucin relativa al cero en el eje horizontal.
Algunas distribuciones pueden no tener los tres parmetros, mientras que
otras pueden tener ms de un parmetro de forma.
DISTRIBUCION NORMAL
Es una distribucin simtrica y tiene la propiedad que la media, la mediana
y la moda son iguales.
La distribucin normal estndar esta tabulada, y el rea bajo la curva de
esta distribucin estandarizada refleja la probabilidad entre el valor
negativo infinito (-) y z estndar sobre o bajo la media cuando z esta dado por:
x
z
Tericamente una variable normal puede tener cualquier valor entre (-) y (+) pero en la prctica podemos despreciar la posibilidad de que un valor x caiga fuera de los limites de 3. Este hecho es una regla importante de la distribucin normal y se llama la
regla de 3 sigma, que nos indica que dentro de los limites 3 se encuentran el 99.7 % de los datos, entre los lmites 2 estn el 95.4% de los datos y dentro de los lmites estn el 68.3% de los datos.
PARAMETROS: tiene dos parmetros, la media que es un parmetro de localizacin, y la desviacin estndar que es un parmetro de escala.
APLICACIONES: Tasas de rendimiento, tasas de inflacin, precios de
bienes y servicios, peso, estatura.
FORMULA:
La densidad de probabilidad es:
2
2
2
1
2
1
x
exf
EJEMPLO:
En un proceso de produccin se desea analizar el peso de cada unidad.
Segn el estndar, dicho peso debe estar normalizado con una media de
430g y se admite una variacin (desviacin estndar) de 5g. N(430, 5). Si
se toma una muestra aleatoria:
Determinar la probabilidad de que tal muestra sea a lo ms de 422g.
0548.06.15
430422
422
ZPZP
XZPXP
Lo que significa que hay un 5,48% de probabilidad de
que la muestra registre un peso inferior a 422g.
EN EXCEL:
OTRA OPCION EXCEL:
Normal(430 5)
Value
s x 10
^-2
0
1
2
3
4
5
6
7
8
415
420
425
430
435
440
445
< >5,5% 94,5%
422,00 +Infinity
Determinar la probabilidad de que tal muestra sea al menos de 422g.
9452.00548.01
6.15
430422
422
ZPZP
XZPXP
Normal(430 5)
Val
ues
x 10
^-2
0
1
2
3
4
5
6
7
8
415
420
425
430
435
440
445
< >5,5% 94,5%
422,00 +Infinity
Normal(430 5)
0,0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
0,9
1,0
415
420
425
430
435
440
445
< >5,5% 94,5%
422,00 +Infinity
Determinar la probabilidad de que la muestra se encuentre entre 435g y 438g.
8413.00.15
430435
4351
ZPZP
XZPXP
9452.06.15
430438
4382
ZPZP
XZPXP
1039.06.11
8413.09452.00.16.1
ZP
ZPZP
Normal(430 5)
Values
x 10^
-2
0
1
2
3
4
5
6
7
8
415
420
425
430
435
440
445
< >84,1% 5,5%
435,00
PRUEBA JARQUE BERA
Es una prueba de bondad de ajuste para verificar si un conjunto de datos siguen una distribucin normal.
Ejercicio Prueba de Normalidad
En el archivo adjunto se encuentran los rendimientos diarios de un proceso. Aplique la prueba Jarque-Bera, utilizando las frmulas de Excel para dichos datos. Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento sea menor o igual a -1,25. Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento sea mayor o igual al 0,75. Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento se encuentre entre -1,0 y 1,5.
Determinar un intervalo de confianza al 95% para el
rendimiento promedio. NOTA: este mtodo de estimacin por intervalo se basa en el supuesto de que puede utilizarse la distribucin Normal de probabilidad. Esta suposicin es vlida cuando 1)
30n debido al teorema del Lmite Central, o 2) cuando 30n pero la poblacin tiene distribucin normal y se conoce la desviacin estndar poblacional
JARQUE BERA
SESGO 0.12923191
CURTOSIS RELATIVA -0.17352191
CUENTA 250
JB 1.00951454
MEDIA 0,0483
DESV. ESTANADAR 1,011
VALORES CRITICOS
NIVEL DE CONFIANZA VALOR
90% 4.61
95% 5.99
99% 9.21
CONCLUSION:
COMO JB = 1.0095 ES MENOR QUE 4.61 NO SE RECHAZA HIPOTESIS DE NORMALIDAD AL 90%
SOLUCION:
Columna1
Media 0,04837951 Error tpico 0,06400354 Mediana 0,07572965 Moda -1,18574008 Desviacin estndar 1,01198477 Varianza de la muestra 1,02411317 Curtosis -0,17352191 Coeficiente de asimetra 0,12923191 Rango 5,9496233 Mnimo -3,05401045 Mximo 2,89561285 Suma 12,0948778 Cuenta 250
Si los rendimientos tienen distribucin normal, determinar la probabilidad de que el rendimiento sea menor o igual a -1,25.
Normal(0,0483; 1,011)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
2,5
< >10,0% 90,0%
-1,250 35,000
Mean = 0,048300
Norm
al
Si los rendimientos tienen distribucin normal, determinar la probabilidad de que el rendimiento sea mayor o igual al 0,75.
Normal(0,0483; 1,011)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
2,5
< >75,6% 24,4%
0,750 35,000
Mean = 0,048300
Norm
al
Si los rendimientos tienen distribucin normal, determinar la
probabilidad de que el rendimiento se encuentre entre -1,0 y 1,5.
Normal(0,0483; 1,011)
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
-2,5
-2,0
-1,5
-1,0
-0,5
0,0
0,5
1,0
1,5
2,0
2,5
< >15,0% 7,6%77,5%
-1,000 1,500
Mean = 0,048300
Norm
al
Determinar un intervalo de confianza al 95% para el rendimiento promedio.
TEOREMA DEL LIMITE CENTRAL: al aumentar el tamao de la muestra, la distribucin muestral de la media se
aproxima a la forma de la distribucin Normal sin importar la
forma de la distribucin de las mediciones individuales de la
poblacin. Para propsitos prcticos, puede suponerse que la
distribucin muestral de la media es aproximadamente Normal
cuando el tamao de la muestra es 30n .
NIVEL DE CONFIANZA: es el valor de la probabilidad que el investigador escoge para la estimacin que hace de la
importancia o del posible significado prctico de su
investigacin. Por lo general se trabaja con el 95% o 99% de
confianza.
ERROR TIPICO:
1,0110,064
1 250 1
SSx
n
El valor Z al 95% de confianza lo podemos calcular con la ayuda de Excel, por tratarse de una prueba bilateral, el nivel de
significancia 5% lo repartimos en las dos colas de la
distribucin Normal, con lo que la probabilidad que debemos
ingresar en Excel es: 5%
95% 97,5% 0,9752
0,4
0,3
0,2
0,1
0,0
X
De
nsit
y
1,96
0,975
0
Distribution PlotNormal; Mean=0; StDev=1
INTERVALO DE CONFIANZA: se puede estimar un rango de valores para la media, de la siguiente manera:
Intervalo de confianza = media muetral Z * error tpico
Intervalo de confianza = 0,0483 1,96*0,064
De tal manera que el rendimiento promedio de la inversin se
encontrar con un 95% de confianza en el intervalo:
0,077 0,0483 0,173
EJEMPLO 2 Una empresa ha registrado las unidades vendidas diariamente en la siguiente tabla:
DIA VENTAS
da 1 4
da 2 1
da 3 6
da 4 9
da 5 9
da 6 10
da 7 2
da 8 4
da 9 8
da 10 2
da 11 3
da 12 0
da 13 1
da 14 2
da 15 3
da 16 1
da 17 3
da 18 4
da 19 5
da 20 4
da 21 4
da 22 4
da 23 9
da 24 5
da 25 4
da 26 3
da 27 11
da 28 8
da 29 12
da 30 3
da 31 10
da 32 0
da 33 7
Aplique la prueba Jarque-Bera para determinar si las ventas se pueden modelar mediante una distribucin Normal.
SOLUCION:
Histograma
02468
101214
0 2,4 4,8 7,2 9,6 y
mayor...
Clase
Fre
cu
en
cia
Frecuencia
Columna1
Media 4,88 Error tpico 0,58 Mediana 4 Moda 4 Desviacin estndar 3,34 Varianza de la muestra 11,17 Curtosis -0,73 Coeficiente de asimetra 0,56 Rango 12 Mnimo 0 Mximo 12 Suma 161 Cuenta 33
2 2
0,56 0,7333 2,45
6 24JB
VALORES CRITICOS
NIVEL DE CONFIANZA VALOR
90% 4.61
95% 5.99
99% 9.21
CONCLUSION:
COMO JB = 2.45 ES MENOR QUE 4.61 NO SE RECHAZA HIPOTESIS DE NORMALIDAD AL 90%. En este caso los parmetros de la distribucin sern: N(5, 3.34)
EJEMPLO 3
Una empresa ha registrado los precios de venta histricos de su producto en la siguiente tabla:
PRECIOS
96,3
99,9
98,6
99,5
95,4
98,5
95,0
103,0
102,6
100,6
98,9
102,0
97,3
99,4
100,9
Aplique la prueba Jarque-Bera para determinar si las ventas se pueden modelar mediante una distribucin Normal.
EJEMPLO 4
Una empresa ha registrado los costos de compra histricos de su producto en la siguiente tabla:
Aplique la prueba Jarque-Bera para determinar si las ventas se pueden modelar mediante una distribucin Normal.
COSTOS
93,7
91,6
86,5
87,9
90,0
80,3
84,3
87,7
87,6
83,5
92,1
80,1
84,8
91,5
82,4
86,8
92,2
83,7
81,7
90,5
83,4
84,5
89,8
81,4
90,1
89,1
85,4
87,4
DETERMINACION DEL TAMAO DE UNA
MUESTRA
Pueden presentarse 2 casos:
Cuando se conoce la poblacin:
2 2
2 2 2
* *
1 * *
N Zn
N E Z
Donde:
n = tamao de la muestra.
N = tamao de la poblacin.
2 = varianza = p*q= S2 Z = nivel de confianza.
E = error admisible.
p = probabilidad de xito (0,5).
q = probabilidad de fracaso (0,5).
Cuando no se conoce la poblacin:
2 2
2
*Zn
E
EJERCICIO:
Para una investigacin de campo, en una poblacin de 8400 empresarios,
mediante estimacin se propone un error admisible del 6% y un 95% de
nivel de confianza. Calcular el tamao de la muestra.
SOLUCION:
N = tamao de la poblacin = 8400
2 = varianza = p*q= S2 = 0,5*0,5 = 0,25 Z = nivel de confianza = 95% = 0,95 = 1,96
E = error admisible = 6%
p = probabilidad de xito (0,5).
q = probabilidad de fracaso (0,5).
0,4
0,3
0,2
0,1
0,0
X
De
nsit
y
1,96
0,975
0
Distribution PlotNormal; Mean=0; StDev=1
2 2
2 2 2
* *
1 * *
N Zn
N E Z
2
2 2 2
8400*0,25* 1,96258,59 259
8400 1 * 0,06 0,25 * 1,96n
El tamao de la muestra debe ser de 259
personas.
EJERCICIOS DE APLICACIN 1
Resolver el ejercicio anterior, considerando que no se conoce el tamao de
la poblacin.
EJERCICIOS DE APLICACIN 3
Aplique la prueba Jarque-Bera para determinar si los datos se pueden modelar mediante una distribucin Normal.
DATOS
22,5
25,3
25,2
24,4
23,0
23,7
30,6
29,5
18,6
25,5
22,5
28,3
26,6
29,7
22,4
24,1
30,3
23,4
27,1
24,6
25,6
26,2
18,9
26,1
23,8
24,4
27,9
28,5
19,1
23,9
28,5
23,2
23,7
26,7
22,8
20,7
22,2
19,0
29,3
26,8
20,2
27,2
26,4
30,0
26,5
22,0
23,3
21,9
26,9
23,3
EJERCICIOS DE APLICACIN 4
1.- Una fbrica de telas ha determinado que la resistencia a la rotura de una
tela sinttica se distribuye de acuerdo con: N(800, 12) Newtons. El
comprador de la tela exige que sta tenga una resistencia de al menos 772
Newtons.
a) Si se selecciona aleatoriamente una muestra de la tela, determinar la probabilidad de que tal muestra cumpla con las exigencias del
comprador.
b) Existe otro comprador al que le interesa que la tela tenga mximo una resistencia de 780 Newtons.
c) Determinar la probabilidad de que la tela tenga mximo 810 Newtons de resistencia.
d) Calcular la probabilidad de que la tela tenga una resistencia entre 785 y 815 Newtons.
e) Para un tamao de muestra de 45 determinar el intervalo de confianza para la media al 95%.