23
DISTRIBUCIONES DE PROBABILIDAD Una distribución de probabilidad describe los valores posibles que puede tomar una variable aleatoria y las probabilidades asociadas a esos valores. Dependiendo del tipo de variable aleatoria, podemos tener distribuciones continuas, definidas por la densidad de probabilidad, o distribuciones discretas, definidas por la función de probabilidad. Tanto la densidad como la función de probabilidad dependen de uno o más parámetros. Algunas distribuciones continuas pueden asumir diferentes formas y tamaños, dependiendo del valor de los parámetros. Si la variable es discreta, existe la probabilidad de que la variable tome un valor específico. Si la variable es continua, sólo se puede determinar la probabilidad de que la variable tome un valor dentro de un intervalo. Existen tres tipos de parámetros básicos: PARAMETRO DE FORMA: que controla la forma básica de la distribución, y que dependiendo del tipo de distribución, el cambio puede ser leve o severo. PARAMETRO DE ESCALA: que controla la unidad de medida dentro del rango de la distribución. Cambiando este parámetro, la distribución se contrae o se expande a lo largo del eje horizontal. PARAMETRO DE LOCALIZACION: que especifica la localización de la distribución relativa al cero en el eje horizontal. Algunas distribuciones pueden no tener los tres parámetros, mientras que otras pueden tener más de un parámetro de forma. DISTRIBUCION NORMAL Es una distribución simétrica y tiene la propiedad que la media, la mediana y la moda son iguales.

DISTRIBUCION NORMAL.pdf

Embed Size (px)

Citation preview

  • DISTRIBUCIONES DE PROBABILIDAD

    Una distribucin de probabilidad describe los valores posibles que puede

    tomar una variable aleatoria y las probabilidades asociadas a esos valores.

    Dependiendo del tipo de variable aleatoria, podemos tener distribuciones

    continuas, definidas por la densidad de probabilidad, o distribuciones

    discretas, definidas por la funcin de probabilidad. Tanto la densidad como

    la funcin de probabilidad dependen de uno o ms parmetros. Algunas

    distribuciones continuas pueden asumir diferentes formas y tamaos,

    dependiendo del valor de los parmetros.

    Si la variable es discreta, existe la probabilidad de que la variable tome un

    valor especfico.

    Si la variable es continua, slo se puede determinar la probabilidad de que

    la variable tome un valor dentro de un intervalo.

    Existen tres tipos de parmetros bsicos:

    PARAMETRO DE FORMA: que controla la forma bsica de la

    distribucin, y que dependiendo del tipo de distribucin, el cambio puede

    ser leve o severo.

    PARAMETRO DE ESCALA: que controla la unidad de medida dentro

    del rango de la distribucin. Cambiando este parmetro, la distribucin se

    contrae o se expande a lo largo del eje horizontal.

    PARAMETRO DE LOCALIZACION: que especifica la localizacin de

    la distribucin relativa al cero en el eje horizontal.

    Algunas distribuciones pueden no tener los tres parmetros, mientras que

    otras pueden tener ms de un parmetro de forma.

    DISTRIBUCION NORMAL

    Es una distribucin simtrica y tiene la propiedad que la media, la mediana

    y la moda son iguales.

  • La distribucin normal estndar esta tabulada, y el rea bajo la curva de

    esta distribucin estandarizada refleja la probabilidad entre el valor

    negativo infinito (-) y z estndar sobre o bajo la media cuando z esta dado por:

    x

    z

    Tericamente una variable normal puede tener cualquier valor entre (-) y (+) pero en la prctica podemos despreciar la posibilidad de que un valor x caiga fuera de los limites de 3. Este hecho es una regla importante de la distribucin normal y se llama la

    regla de 3 sigma, que nos indica que dentro de los limites 3 se encuentran el 99.7 % de los datos, entre los lmites 2 estn el 95.4% de los datos y dentro de los lmites estn el 68.3% de los datos.

  • PARAMETROS: tiene dos parmetros, la media que es un parmetro de localizacin, y la desviacin estndar que es un parmetro de escala.

    APLICACIONES: Tasas de rendimiento, tasas de inflacin, precios de

    bienes y servicios, peso, estatura.

    FORMULA:

    La densidad de probabilidad es:

    2

    2

    2

    1

    2

    1

    x

    exf

    EJEMPLO:

    En un proceso de produccin se desea analizar el peso de cada unidad.

    Segn el estndar, dicho peso debe estar normalizado con una media de

    430g y se admite una variacin (desviacin estndar) de 5g. N(430, 5). Si

    se toma una muestra aleatoria:

  • Determinar la probabilidad de que tal muestra sea a lo ms de 422g.

    0548.06.15

    430422

    422

    ZPZP

    XZPXP

    Lo que significa que hay un 5,48% de probabilidad de

    que la muestra registre un peso inferior a 422g.

    EN EXCEL:

  • OTRA OPCION EXCEL:

  • Normal(430 5)

    Value

    s x 10

    ^-2

    0

    1

    2

    3

    4

    5

    6

    7

    8

    415

    420

    425

    430

    435

    440

    445

    < >5,5% 94,5%

    422,00 +Infinity

    Determinar la probabilidad de que tal muestra sea al menos de 422g.

    9452.00548.01

    6.15

    430422

    422

    ZPZP

    XZPXP

    Normal(430 5)

    Val

    ues

    x 10

    ^-2

    0

    1

    2

    3

    4

    5

    6

    7

    8

    415

    420

    425

    430

    435

    440

    445

    < >5,5% 94,5%

    422,00 +Infinity

    Normal(430 5)

    0,0

    0,1

    0,2

    0,3

    0,4

    0,5

    0,6

    0,7

    0,8

    0,9

    1,0

    415

    420

    425

    430

    435

    440

    445

    < >5,5% 94,5%

    422,00 +Infinity

  • Determinar la probabilidad de que la muestra se encuentre entre 435g y 438g.

    8413.00.15

    430435

    4351

    ZPZP

    XZPXP

    9452.06.15

    430438

    4382

    ZPZP

    XZPXP

    1039.06.11

    8413.09452.00.16.1

    ZP

    ZPZP

    Normal(430 5)

    Values

    x 10^

    -2

    0

    1

    2

    3

    4

    5

    6

    7

    8

    415

    420

    425

    430

    435

    440

    445

    < >84,1% 5,5%

    435,00

  • PRUEBA JARQUE BERA

    Es una prueba de bondad de ajuste para verificar si un conjunto de datos siguen una distribucin normal.

    Ejercicio Prueba de Normalidad

    En el archivo adjunto se encuentran los rendimientos diarios de un proceso. Aplique la prueba Jarque-Bera, utilizando las frmulas de Excel para dichos datos. Si los rendimientos tienen distribucin normal, determinar la

    probabilidad de que el rendimiento sea menor o igual a -1,25. Si los rendimientos tienen distribucin normal, determinar la

    probabilidad de que el rendimiento sea mayor o igual al 0,75. Si los rendimientos tienen distribucin normal, determinar la

    probabilidad de que el rendimiento se encuentre entre -1,0 y 1,5.

    Determinar un intervalo de confianza al 95% para el

    rendimiento promedio. NOTA: este mtodo de estimacin por intervalo se basa en el supuesto de que puede utilizarse la distribucin Normal de probabilidad. Esta suposicin es vlida cuando 1)

    30n debido al teorema del Lmite Central, o 2) cuando 30n pero la poblacin tiene distribucin normal y se conoce la desviacin estndar poblacional

  • JARQUE BERA

    SESGO 0.12923191

    CURTOSIS RELATIVA -0.17352191

    CUENTA 250

    JB 1.00951454

    MEDIA 0,0483

    DESV. ESTANADAR 1,011

    VALORES CRITICOS

    NIVEL DE CONFIANZA VALOR

    90% 4.61

    95% 5.99

    99% 9.21

    CONCLUSION:

    COMO JB = 1.0095 ES MENOR QUE 4.61 NO SE RECHAZA HIPOTESIS DE NORMALIDAD AL 90%

  • SOLUCION:

    Columna1

    Media 0,04837951 Error tpico 0,06400354 Mediana 0,07572965 Moda -1,18574008 Desviacin estndar 1,01198477 Varianza de la muestra 1,02411317 Curtosis -0,17352191 Coeficiente de asimetra 0,12923191 Rango 5,9496233 Mnimo -3,05401045 Mximo 2,89561285 Suma 12,0948778 Cuenta 250

    Si los rendimientos tienen distribucin normal, determinar la probabilidad de que el rendimiento sea menor o igual a -1,25.

  • Normal(0,0483; 1,011)

    0,00

    0,05

    0,10

    0,15

    0,20

    0,25

    0,30

    0,35

    0,40

    -2,5

    -2,0

    -1,5

    -1,0

    -0,5

    0,0

    0,5

    1,0

    1,5

    2,0

    2,5

    < >10,0% 90,0%

    -1,250 35,000

    Mean = 0,048300

    Norm

    al

    Si los rendimientos tienen distribucin normal, determinar la probabilidad de que el rendimiento sea mayor o igual al 0,75.

    Normal(0,0483; 1,011)

    0,00

    0,05

    0,10

    0,15

    0,20

    0,25

    0,30

    0,35

    0,40

    -2,5

    -2,0

    -1,5

    -1,0

    -0,5

    0,0

    0,5

    1,0

    1,5

    2,0

    2,5

    < >75,6% 24,4%

    0,750 35,000

    Mean = 0,048300

    Norm

    al

    Si los rendimientos tienen distribucin normal, determinar la

    probabilidad de que el rendimiento se encuentre entre -1,0 y 1,5.

  • Normal(0,0483; 1,011)

    0,00

    0,05

    0,10

    0,15

    0,20

    0,25

    0,30

    0,35

    0,40

    -2,5

    -2,0

    -1,5

    -1,0

    -0,5

    0,0

    0,5

    1,0

    1,5

    2,0

    2,5

    < >15,0% 7,6%77,5%

    -1,000 1,500

    Mean = 0,048300

    Norm

    al

    Determinar un intervalo de confianza al 95% para el rendimiento promedio.

    TEOREMA DEL LIMITE CENTRAL: al aumentar el tamao de la muestra, la distribucin muestral de la media se

    aproxima a la forma de la distribucin Normal sin importar la

    forma de la distribucin de las mediciones individuales de la

    poblacin. Para propsitos prcticos, puede suponerse que la

    distribucin muestral de la media es aproximadamente Normal

    cuando el tamao de la muestra es 30n .

    NIVEL DE CONFIANZA: es el valor de la probabilidad que el investigador escoge para la estimacin que hace de la

    importancia o del posible significado prctico de su

    investigacin. Por lo general se trabaja con el 95% o 99% de

    confianza.

    ERROR TIPICO:

    1,0110,064

    1 250 1

    SSx

    n

  • El valor Z al 95% de confianza lo podemos calcular con la ayuda de Excel, por tratarse de una prueba bilateral, el nivel de

    significancia 5% lo repartimos en las dos colas de la

    distribucin Normal, con lo que la probabilidad que debemos

    ingresar en Excel es: 5%

    95% 97,5% 0,9752

    0,4

    0,3

    0,2

    0,1

    0,0

    X

    De

    nsit

    y

    1,96

    0,975

    0

    Distribution PlotNormal; Mean=0; StDev=1

    INTERVALO DE CONFIANZA: se puede estimar un rango de valores para la media, de la siguiente manera:

  • Intervalo de confianza = media muetral Z * error tpico

    Intervalo de confianza = 0,0483 1,96*0,064

    De tal manera que el rendimiento promedio de la inversin se

    encontrar con un 95% de confianza en el intervalo:

    0,077 0,0483 0,173

    EJEMPLO 2 Una empresa ha registrado las unidades vendidas diariamente en la siguiente tabla:

    DIA VENTAS

    da 1 4

    da 2 1

    da 3 6

    da 4 9

    da 5 9

    da 6 10

    da 7 2

    da 8 4

    da 9 8

    da 10 2

    da 11 3

    da 12 0

    da 13 1

    da 14 2

    da 15 3

    da 16 1

    da 17 3

    da 18 4

    da 19 5

    da 20 4

    da 21 4

    da 22 4

    da 23 9

    da 24 5

    da 25 4

    da 26 3

    da 27 11

    da 28 8

  • da 29 12

    da 30 3

    da 31 10

    da 32 0

    da 33 7

    Aplique la prueba Jarque-Bera para determinar si las ventas se pueden modelar mediante una distribucin Normal.

    SOLUCION:

    Histograma

    02468

    101214

    0 2,4 4,8 7,2 9,6 y

    mayor...

    Clase

    Fre

    cu

    en

    cia

    Frecuencia

    Columna1

    Media 4,88 Error tpico 0,58 Mediana 4 Moda 4 Desviacin estndar 3,34 Varianza de la muestra 11,17 Curtosis -0,73 Coeficiente de asimetra 0,56 Rango 12 Mnimo 0 Mximo 12 Suma 161 Cuenta 33

  • 2 2

    0,56 0,7333 2,45

    6 24JB

    VALORES CRITICOS

    NIVEL DE CONFIANZA VALOR

    90% 4.61

    95% 5.99

    99% 9.21

    CONCLUSION:

    COMO JB = 2.45 ES MENOR QUE 4.61 NO SE RECHAZA HIPOTESIS DE NORMALIDAD AL 90%. En este caso los parmetros de la distribucin sern: N(5, 3.34)

  • EJEMPLO 3

    Una empresa ha registrado los precios de venta histricos de su producto en la siguiente tabla:

    PRECIOS

    96,3

    99,9

    98,6

    99,5

    95,4

    98,5

    95,0

    103,0

    102,6

    100,6

    98,9

    102,0

    97,3

    99,4

    100,9

    Aplique la prueba Jarque-Bera para determinar si las ventas se pueden modelar mediante una distribucin Normal.

  • EJEMPLO 4

    Una empresa ha registrado los costos de compra histricos de su producto en la siguiente tabla:

    Aplique la prueba Jarque-Bera para determinar si las ventas se pueden modelar mediante una distribucin Normal.

    COSTOS

    93,7

    91,6

    86,5

    87,9

    90,0

    80,3

    84,3

    87,7

    87,6

    83,5

    92,1

    80,1

    84,8

    91,5

    82,4

    86,8

    92,2

    83,7

    81,7

    90,5

    83,4

    84,5

    89,8

    81,4

    90,1

    89,1

    85,4

    87,4

  • DETERMINACION DEL TAMAO DE UNA

    MUESTRA

    Pueden presentarse 2 casos:

    Cuando se conoce la poblacin:

    2 2

    2 2 2

    * *

    1 * *

    N Zn

    N E Z

    Donde:

    n = tamao de la muestra.

    N = tamao de la poblacin.

    2 = varianza = p*q= S2 Z = nivel de confianza.

    E = error admisible.

    p = probabilidad de xito (0,5).

    q = probabilidad de fracaso (0,5).

    Cuando no se conoce la poblacin:

    2 2

    2

    *Zn

    E

    EJERCICIO:

    Para una investigacin de campo, en una poblacin de 8400 empresarios,

    mediante estimacin se propone un error admisible del 6% y un 95% de

    nivel de confianza. Calcular el tamao de la muestra.

  • SOLUCION:

    N = tamao de la poblacin = 8400

    2 = varianza = p*q= S2 = 0,5*0,5 = 0,25 Z = nivel de confianza = 95% = 0,95 = 1,96

    E = error admisible = 6%

    p = probabilidad de xito (0,5).

    q = probabilidad de fracaso (0,5).

    0,4

    0,3

    0,2

    0,1

    0,0

    X

    De

    nsit

    y

    1,96

    0,975

    0

    Distribution PlotNormal; Mean=0; StDev=1

  • 2 2

    2 2 2

    * *

    1 * *

    N Zn

    N E Z

    2

    2 2 2

    8400*0,25* 1,96258,59 259

    8400 1 * 0,06 0,25 * 1,96n

    El tamao de la muestra debe ser de 259

    personas.

    EJERCICIOS DE APLICACIN 1

    Resolver el ejercicio anterior, considerando que no se conoce el tamao de

    la poblacin.

    EJERCICIOS DE APLICACIN 3

    Aplique la prueba Jarque-Bera para determinar si los datos se pueden modelar mediante una distribucin Normal.

    DATOS

    22,5

    25,3

    25,2

    24,4

    23,0

    23,7

    30,6

    29,5

    18,6

  • 25,5

    22,5

    28,3

    26,6

    29,7

    22,4

    24,1

    30,3

    23,4

    27,1

    24,6

    25,6

    26,2

    18,9

    26,1

    23,8

    24,4

    27,9

    28,5

    19,1

    23,9

    28,5

    23,2

    23,7

    26,7

    22,8

    20,7

    22,2

    19,0

    29,3

    26,8

    20,2

    27,2

    26,4

    30,0

    26,5

    22,0

    23,3

    21,9

    26,9

    23,3

  • EJERCICIOS DE APLICACIN 4

    1.- Una fbrica de telas ha determinado que la resistencia a la rotura de una

    tela sinttica se distribuye de acuerdo con: N(800, 12) Newtons. El

    comprador de la tela exige que sta tenga una resistencia de al menos 772

    Newtons.

    a) Si se selecciona aleatoriamente una muestra de la tela, determinar la probabilidad de que tal muestra cumpla con las exigencias del

    comprador.

    b) Existe otro comprador al que le interesa que la tela tenga mximo una resistencia de 780 Newtons.

    c) Determinar la probabilidad de que la tela tenga mximo 810 Newtons de resistencia.

    d) Calcular la probabilidad de que la tela tenga una resistencia entre 785 y 815 Newtons.

    e) Para un tamao de muestra de 45 determinar el intervalo de confianza para la media al 95%.