num aleatorios sep

Embed Size (px)

Citation preview

  • 8/7/2019 num aleatorios sep

    1/21

    17

    SEGUNDA UNIDAD. PRUEBAS DE BONDAD DE AJUSTE Y NUMEROS

    PSEUDOALEATORIOS.

    2.1 PRUEBAS DE BONDAD DE AJUSTE

    2.1.1 Distribuciones de probabilidad.

    Al modelar un sistema, se debe diferenciar entre dos tipos de datos los primeros

    permanecen sin cambio a travs del tiempo y se conocen como parmetros; los segundospresentan cambios a travs del tiempo y se conocen como variables. Por ejemplo, elmodelado de un sistema mediante simulacin es til cuando la informacin del sistema

    tiene carcter de dinmico y probabilstico, debido principalmente a que la interaccin de

    esa informacin es, por lo general, difcil de analizar.

    La variabilidad que presenta el segundo tipo de datos debe modelarse de acuerdo con

    ciertas ecuaciones matemticas que son capaces de reproducirla; en la mayora de los casos

    dicha variabilidad puede clasificarse dentro de alguna distribucin de probabilidad. Aspues, uno de los pasos ms importantes de todo el proceso de modelado estocstico es la

    bsqueda de informacin y su anlisis estadstico posterior basado principalmente en la

    clasificacin de cada serie de datos dentro de alguna distribucin de probabilidad. Algunas

    de las distribuciones ms comunes se analizan a continuacin.

    2.1.1.1 Distribuciones continuas.Este tipo de distribuciones se utilizan para modelar la aleatoriedad en aquellas actividades o

    eventos en los cuales los valores de las variables pueden estar dentro de un rango de valores

    reales. A continuacin se describen algunas de las funciones continuas ms utilizadas.

    Uniforme U(a, b)

    Funcin de densidad

    abxf

    =

    1)( si bxa

    Distribucin acumulada

    ab

    axxF

    =)( si bxa

    Parmetros A y b son nmeros reales con a < b; a es un

    parmetro de ubicacin; b-a es un parmetro

    de escala

    Rango [ ]ba,Media

    2

    ba +

  • 8/7/2019 num aleatorios sep

    2/21

    18

    Variancia ( )12

    2ab

    Figura 2.1. Distribucin de probabilidad Uniforme continua.

    Exponencial Expo()Funcin de densidad

    x

    exf

    =1

    )( si 0x

    Distribucin acumulada xexF

    = 1)( si0x

    Parmetros Parmetro de escala > 0Rango [ ),0 Media

    Variancia 2

    Figura 2.2. Distribucin de probabilidad Exponencial.

    Weibull Weib(, )Funcin de densidad

    ( )x

    ex 1 si x > 0

    =)(xf

    0

    Distribucin acumulada

    ( )xe

    1 si x > 0=)(xF

    0 de otra ma

  • 8/7/2019 num aleatorios sep

    3/21

    19

    Parmetros Parmetro de escala > 0

    Parmetro de forma > 0Rango

    [ ),0 [ ),0Media

    1

    Variancia

    22 1122

    Figura 2.3. Distribucin de probabilidad Weibull.

    Triangular TR(a,b,c)

    Funcin de densidad

    ( )( )( )bcac

    ax

    2si bxa

    =)(xf

    ( )

    ( )( )bcacxc

    2si cxb

    Distribucin acumulada

    ( )( )( )abac

    ax

    2

    si bxa

    =)(xF

    ( )

    ( )( )bcacxc

    2

    1 si cxb

    Parmetros Parmetro de localizacin:

    Parmetro de escala: Rango a, b

    Media

    3

    cba ++

    Variancia

    18

    222bcabaccba +++

  • 8/7/2019 num aleatorios sep

    4/21

    20

    Figura 2.4. Distribucin de probabilidad Triangular.

    Normal N(, )Funcin de densidad 2

    2

    1

    2

    1)(

    =

    x

    exf x

    Distribucin acumulada No existe ecuacin

    Parmetros Parmetro de localizacin:

    Parmetro de escala: Rango ( ) ,Media Variancia 2

    Figura 2.5. Distribucin de probabilidad Normal.

    Lognormal LOGN(, )Funcin de densidad

    ( )2

    2

    2

    ln

    2exp

    2

    1

    x

    xsi x > 0

    =)(xf

    0

    Distribucin acumulada No existe ecuacin

    Parmetros Parmetro de escala:

    Parmetro de forma: Rango [ ),0

  • 8/7/2019 num aleatorios sep

    5/21

    21

    Media 2+e

    Variancia )1222 + ee

    Figura 2.6. Distribucin de probabilidad Lognormal.

    2.1.1.2 Distribuciones discretas.

    Este tipo de distribuciones sirven para modelar la aleatoriedad de una variable que slo

    puede tomar valores enteros. Las siguientes distribuciones son algunas de las ms utilizadas

    en el modelado de sistemas estocsticos.

    Bernoulli Be(t, p)

    Distribucin de probabilidad p1 si 0=x

    =)(xp

    p si 1=x

    Distribucin acumulada 0 si0x =)(xF p1 si 10 x

    1 si1x Rango { }1,0 Media p

    Variancia ( )pp 1

    Figura 2.7. Distribucin de probabilidad de Bernoulli.

  • 8/7/2019 num aleatorios sep

    6/21

    22

    Uniforme discreta UD(i, j)

    Distribucin de probabilidad

    1

    1)(

    +

    =

    ij

    xp si { }jiix ,,1, +

    Distribucin acumulada 0 siix

    =)(xF 1

    1

    +

    +

    ij

    ixsi jxi

    1 sixj

    Rango { }jii ,,1, + Media

    2

    ji +

    Variancia ( )12

    112

    + ij

    Figura 2.8. Distribucin de probabilidad. Uniforme discreta.

    Binomial BI(n, p)Distribucin de probabilidad

    ( ) xnx ppx

    n

    1 { }nx ,,1,0

    =)(xp

    0 de otra manera

    Distrubucin acumulada 0

    =)(xF ( )iix

    i

    ppj

    nx

    =

    10

    si nx 0

    1

    Rango

    { }n,,1,0

    Media np

    Variancia ( )pnp 1

  • 8/7/2019 num aleatorios sep

    7/21

    23

    Figura 2.9. Distribucin de probabilidad Binomial.

    Poisson PS()Distribucin de probabilidad

    !x

    e xsi { },1,0x

    =)(xp

    0 de otra manera

    Distribucin acumulada

    =

    =x

    i

    i

    iexF

    0 !)(

    si 0x

    Rango > 0, x enteroMedia Variancia

    Figura 2.10. Distribucin de probabilidad Poisson.

    Geomtrica GE(p)

    Distribucin de probabilidad ( )

    x

    pp 1 si ( )

    ,1,0x =)(xf

    0 de otra mane

    Distribucin acumulada ( )[ ] 111 + xp si 0x =)(xF

    0

    Rango { }n,,1,0 Media

    p

    p1

  • 8/7/2019 num aleatorios sep

    8/21

    24

    Variancia2

    1

    p

    p

    Figura 2.11. Distribucin de probabilidad Geomtrica

    2.1.2 Determinacin del tipo de distribucin.

    En la mayor parte de los sistemas, al analizar la informacin, sta se encuentra disponible

    en forma de series a travs del tiempo.

    Est informacin, tabulada en dicho formato no es de utilidad cuando se trata de obtener un

    comportamiento basado en variabilidad con cierto comportamiento probabilistico. As pues,si el analista desea conocer el comportamiento, es necesario modificar la forma depresentacin de datos y presentarla como tablas de frecuencia, con la finalidad de realizar

    cualquiera de las siguiente pruebas:

    Prueba de bondad de ajuste 2. Prueba de Kolgomorov Smirnov.

    2.1.2.1 Prueba de bondad de ajuste 2.

    Como ya se menciono, esta prueba se utiliza para encontrar la distribucin de probabilidad

    de una serie de datos. La metodologa de la prueba 2es la siguiente:

    1. Se colocan los n datos histricos (al menos 30 datos) en una tabla de frecuencias de

    nm = intervalos. Se obtiene la frecuencia observada en cada intervalo i, (FOi). Se

    calcula la media y la variancia de los datos.2. Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de

    frecuencias obtenida en el paso 1.3. Con la distribucin propuesta, se calcula la frecuencia esperada para cada uno de los

    intervalos (FEi) mediante la integracin de la distribucin propuesta y su posterior

    multiplicacin por el nmero total de datos.

    4. Se calcula el estimador:

    ( )

    =

    =

    m

    i i

    ii

    FE

    FOFEC

    1

    2

  • 8/7/2019 num aleatorios sep

    9/21

    25

    5. Si el estimador C es menor o igual al valor correspondiente 2con 1 km grados de

    libertad ( =k nmero de parmetros estimados de la distribucin) y a un nivel de

    confiabilidad de 1 , entonces no se puede rechazar la hiptesis de que lainformacin histrica sigue la distribucin propuesta en el punto 2.Ejemplo:

    Se desea obtener la distribucin de probabilidad ideal, conque se reciben llamadas para

    consulta en un servicio de biblioteca. La informacin histrica se resume en el siguiente

    cuadro, en el cual se menciona la cantidad de llamadas que se recibieron en el intervalo de

    una hora, esto es, el total de horas que se tomaron para informacin, fue de 509.

    No. de llamadas Frecuencia observada

    0 315

    1 1422 40

    3 9

    4 2

    5 1

    509

    Tabla de frecuencias: Ya esta dada con la informacin. As como la frecuencia observada.

    Media y variancia de los datos.

    Marca de clase x f fx x2

    fx2

    0 315 0 0 01 142 142 1 142

    2 40 80 4 160

    3 9 27 9 814 2 8 16 32

    5 1 5 25 25

    Sumatoria 509 262 440

    5147.0509

    262===

    n

    fxx ( ) ( ) 5995.05147.0

    509

    440 222

    2 ===

    xn

    fxs

    Se propone una distribucin de probabilidad.

    Figura 2.12. Histgrma del sistema de llamadas a la biblioteca

    0 1 2 3 4 5

    315

    142

    409 2 1

    0

    100

    200

    300

    400

    1 2 3 4 5 6

    Llamadas

    FO

  • 8/7/2019 num aleatorios sep

    10/21

    26

    Como se puede observar en la grfica anterior, la distribucin de datos se asemeja a una

    distribucin de probabilidad Poisson. Del cuadro anterior de la distribucin de probabilidad

    discreta Poisson, nos muestra que esta distribucin tiene un solo parmetro y que la

    media y la variancia son iguales, es decir, el valor de . Pero en nuestro caso tenemos dosvalores, uno para la media, 0.5147 y otro para la variancia, 0.5995. Entonces para hacer

    estos dos valores uno solo, se procede de la siguiente manera:

    5571.02

    5995.05147.0=

    +=

    Por lo tanto se propone Poisson con media = 0.5571

    Clculo de la frecuencia esperada.

    Del mismo cuadro de la distribucin Poisson, se tiene que la frmula para calcular ladistribucin de probabilidad es:

    =)(xp!x

    ex

    5729.0!0

    )5571.0()0(

    5571.000

    ==

    e

    p

    3191.0!1

    )5571.0()1(

    5571.001

    ==

    e

    p

    0889.0

    !2

    )5571.0()2(

    5571.002

    ==

    e

    p

    0165.0!3

    )5571.0()3(

    5571.003

    ==

    e

    p

    0023.0!4

    )5571.0()4(

    5571.004

    ==

    e

    p

    0003.0!5

    )5571.0()5(

    5571.005

    ==

    e

    p

    Multiplicacin por el nmero total de datos.

    No. de

    llamadas

    FO PO PE FE

    0 315 0.6189 0.5729 291.6061

    1 142 0.2790 0.3191 162.4219

    2 40 0.0786 0.0889 45.2501

    3 9 0.0177 0.0165 8.3985

    4 2 0.0039 0.0023 1.1707

    5 1 0.0020 0.0003 0.1527

    Sumatoria 509 1.0000 1 509.0000

    Se calcula el estimador:

  • 8/7/2019 num aleatorios sep

    11/21

    27

    ( )

    =

    =

    m

    i i

    ii

    FE

    FOFEC

    1

    2

    No. de

    llamadas

    FO PO PE FE (FE-FO)2/FE

    0 315 0.6189 0.5729 291.6061 1.87681 142 0.2790 0.3191 162.4219 2.5677

    2 40 0.0786 0.0889 45.2501 0.6091

    3 9 0.0177 0.0165 8.3985 0.04314 2 0.0039 0.0023 1.1707 0.5875

    5 1 0.0020 0.0003 0.1527 4.7015

    Sumatoria 509 1.0000 1 509.0000

    No. dellamadas

    PO

    3 0.01774 0.0039

    5 0.002

    Sumatoria 0.0236

    Como la suma de los intervalos para 3, 4 y 5 llamadas (0.0236 o 2.36%), no es

    representativo para la muestra, es necesario agruparlos en un solo bloque, ya que

    tratndolos por separado acarreara un grave error. Por lo tanto se recomienda agruparlos,quedando el clculo como se muestra en el siguiente cuadro.

    No. de

    llamadasFO FE (FE-

    FO)2/FEFO FE (FE-

    FO)2/FE

    0 315 291.6061 1.8768 315 291.6061 1.87681 142 162.4219 2.5677 142 162.4219 2.56772 40 45.2501 0.6091 40 45.2501 0.60913 9 8.3985 0.0431 Agrupando Agrupando Agrupando4 2 1.1707 0.5875 3, 4 y 5 3, 4 y 5 3, 4 y 55 1 0.1527 4.7015 12 9.7219 0.5338

    Sumatoria 509 509.0000 509 509.0000 5.5874

    C = 5.5874

    Clculo del estimador de tablas 2 ,1 km .

    m = nmero de intervalos, en este caso, cuatro, ya que de seis originales, se agruparon tres

    en uno.

    k = 1, la distribucin de probabilidad Poisson, solo tiene un parmetro.

    Coeficiente de error de = 0.05.Entonces:

    99.52 05.0,22

    05.0,114 ==

  • 8/7/2019 num aleatorios sep

    12/21

    28

    5.5874 < 5.99. Entonces no se puede rechazar la hiptesis de que la informacin histrica

    sigue una distribucin Poisson con media = 0.5571 con un 95% de confianza.

    2.1.2.2 Prueba de bondad de ajuste de Kolmogorov Smirnov

    Si el objetivo es encontrar el tipo de distribucin de probabilidad de una serie de datos, es

    posible utilizar la prueba de bondad de ajuste de Kolgomorov Smirnov, la cual,

    comparandola con la de 2, es ms eficiente en varios aspectos ya que trabaja con la

    distribucin de probabilidad acumulada. La metodologa es la siguiente:

    1. Se colocan los n datos histricos en una tabla de frecuencias con nm = intervalos.

    Para cada intervalo se tendr la frecuencia observada i (FOi). Se calcula media y la

    variancia de los datos.2. Se divide la frecuencia observada de cada intervalo por el nmero total de datos, para

    obtener la probabilidad observada i (POi).3. Se calcula la probabilidad acumulada observada de cada intervalo (PAOi) del paso 2.

    4. Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de

    frecuencias obtenidas en 1.

    5. Con la distribucin propuesta se calcula la probabilidad esperada para cada uno de los

    intervalos (PEi) mediante la integracin de la distribucin propuesta.

    6. Se calcula la probabilidad acumulada esperada (PAEi) para cada intervalo de clase.

    7. Se calcula el valor absoluto entre PAO y PEO para cada intervalo y se selecciona la

    mxima diferencia, llamndola DM.

    8. El estimador DM se compara con un valor lmite correspondiente a la tabla 6 en elapndice B del libro de texto, con n datos a un nivel de confiabilidad de 1 - . Si elestimador DM es menor o igual al valor lmite de la tabla 6, entonces no se puederechazar que la informacin histrica sigue la distribucin propuesta en el paso 4.

    Ejemplo. Mediante la prueba de Kolgomorov Smirnov determine el tipo de distribucin de

    probabilidad que siguen los datos del ejemplo anterior, con un nivel de confianza del 95%.

    Los primeros pasos ya se resolvieron en el ejemplo anterior y los ltimos pueden resumirse

    con la elaboracin del siguiente cuadro.

    No. dellamadas

    FO PO PAO PE PAE Abs(PAO-PAE)

    0 315 0.6189 0.6189 0.5729 0.5729 0.0460

    1 142 0.2790 0.8978 0.3191 0.8920 0.00582 40 0.0786 0.9764 0.0889 0.9809 0.00453 9 0.0177 0.9941 0.0165 0.9974 0.00334 2 0.0039 0.9980 0.0023 0.9997 0.00175 1 0.0020 1.0000 0.0003 1.0000 0.0000

    Sumatoria 509 1.0000 1

    DM = 0.0460

  • 8/7/2019 num aleatorios sep

    13/21

    29

    Lmite correspondiente a la tabla con 509 datos y un nivel de confianza de 95%, igual a:

    0603.0509

    36.136.1

    ==n

    Como el estimador DM = 0.0460 es menor al valor lmite de la tabla D 0.05 = 0.0603, no se

    puede rechazar que la informacin histrica sigue una distribucin Pisson con = 0.5571.

    2.2 NUMEROS PSEUDOALEATORIOS.

    Son nmeros con la misma probabilidad de ocurrencia. Serie de nmeros cuya secuencia no

    puede predecirse.Generacin de aleatorios entre 0 y 1.

    U (0, 1)

    Utilidad.

    Se utilizan para generar el comportamiento de la informacin de entrada.

    2.2.1 Mtodos de generacin de nmeros pseudoaleatorios U(0, 1).Existen un gran nmero de mtodos para generar los nmeros aleatorios entre 0 y 1. El

    mtodo a utilizar, en s mismo, no tiene importancia; la importancia radica en los nmeros

    que genera, ya que estos nmeros deben cumplir ciertas caractrsticas para que sean

    vlidos. Dichas caractersticas son:

    1. Uniformemente distribuidos.

    2. Estadsticamente independientes.

    3. Su media debe ser estrictamente igual a2

    1.

    4. Su variancia debe ser estadsticamente igual a12

    1.

    5. Su perodo o ciclo de vida debe ser largo.

    f(x) = Funcin de densidad

    1

    1 x

    Figura 2.13. Funcin de densidad de probabilidad para el conjunto de los nmeros

    pseudoaleatorios

  • 8/7/2019 num aleatorios sep

    14/21

    30

    =1

    0

    1

    0)( dxdxxf

    2

    12

    )(1

    0

    1

    02===

    xdxxxf

    12

    10833.0

    2

    1)(

    2

    1 1

    0

    21

    0

    2

    2 ==

    =

    = dxxdxxfx

    Mtodos congruenciales.

    [ ]ii rcar +=+ )(1 donde:

    =0r semilla del generador=mca ., constantes

    Ejemplo. Genere nmeros con los siguientes datos:

    =0r semilla 5

    a = Cte 7

    =c Cte 3=m Cte 9

    50 =r

    =1r (7 * 5 + 3) mod 9 = 2=2r (7 * 2 + 3) mod 9 = 8

    =3r (7 * 8 + 3) mod 9 = 5

    Generar 5 nmeros pseudoaleatorios con el generador congruencial multiplicativo siguiente

    con la semilla 767,13,441,470 ==== mcar .

    ( ) mcrar ii mod1 +=+

    ) 767mod134411 ji rr +=+

    38767mod))441(13441(

    441767mod))649(13441(

    649767mod))311(13441(

    311767mod))285(13441(285767mod))47(13441(

    5

    4

    3

    2

    1

    =+=

    =+=

    =+=

    =+==+=

    r

    r

    r

    rr

    Dividiendo por 7661 =m , los nmeros aleatorios son:

  • 8/7/2019 num aleatorios sep

    15/21

    31

    0496.0

    5757.08473.0

    4060.0

    3721.0

    5

    4

    3

    2

    1

    =

    ==

    =

    =

    r

    rr

    r

    r

    Existen reglas para la seleccin de las constantes, algunas de ellas son:

    c debe ser un entero impar, no divisible ni por 3 ni por 5.

    a usualmente puede ser cualquier constante. Sin embargo para asegurar buenosresultados, seleccione a de tal forma que 58mod)( =a para una computadora binaria o

    2200mod)( =a para una computadora decimal.

    m debe ser el nmero entero ms grande que la computadora acepte.

    De acuerdo con Holl y Dovell, los mejores resultados para un generador congruencial

    mixto en una computadora binaria son:

    3*8 = ca

    =c cualquier entero.

    =0r cualquier entero impar.

    bm 2= donde b >2 y que m sea aceptado por la computadora.

    Existen generadores de nmeros aleatorios entre 0 y 1 integrados a la mayora de lossistemas, que pueden ser llamados como funciones, algunos ejemplos son:

    Mtodo de cuadrados medios.

    El procedimiento de obtencin de nmeros con este tipo de generadores es el siguiente:

    Generar una semilla.

    Elevarla al cuadrado. Tomar de la parte central un conjunto de k dgitos que formarn el nmero aleatorio. Los k dgitos pasarn a ser la nueva semilla con el fin de repetir el proceso n ocasiones.

    Ejemplo. Generar 3 nmeros de cuatro dgitos a partir de un generador de cuadrados

    medios utilizando la semilla 445.

    (445)2

    = 198025 =1 9802 5 0.9802(9802)

    2= 96079204 = 96 0792 04 0.0792

    (792)2

    = 627264= 6 2726 4 0.2726

  • 8/7/2019 num aleatorios sep

    16/21

    32

    2.2.2 Pruebas estadsticas para aleatorios.

    Una vez que se ha creado o se puede usar un generador es importante verificar s los

    nmeros generados poseen las caractersticas mencionadas. La comprobacin de talescaractersticas se realiza mediante ciertas pruebas estadsticas, que son las siguientes:

    Prueba de medias

    Consiste en verificar que los nmeros generados tengan una media estadsticamente igual a

    21 , de esta manera, se analiza la siguiente hiptesis

    H0 : media = 0.5

    H1 : media 0.5

    Paso 1.

    Calcular la media de los n nmeros generados.

    =

    =n

    i

    ir

    nx

    1

    1

    Paso 2.Calcular los lmites superior e inferior de aceptacin:

    +=

    nzls

    x12

    1

    2

    12

    =

    n

    zlix

    12

    1

    2

    1

    2

    Paso 3.

    Si el valor de x se encuentra entrex

    li yx

    ls , aceptamos que los nmeros tienen una media

    estadsticamente igual a21 con un nivel de aceptacin de 1 - .

    Ejemplo. Realice la prueba de medias a los primeros 30 nmeros aleatorios entre 0 y 1 de

    un generador congruencial mixto, con un nivel de confianza del 955. Los nmeros

    generados son los siguientes:

    .03991 .10461 .93716 .16894 .98953 .73231

    .25593 .34565 .02345 .67347 .10987 .25678

    .71890 .61234 .86322 .94134 .99872 .27657

    .82345 .12387 .05389 .82474 .59289 .36782

    .72484 .48999 .50502 .39528 .36782 .90234

    Se calcula la media de los 30 datos.

    507.01

    1

    == =

    n

    i

    irn

    x

    Ahora se calcula los lmites de aceptacin para n = 30

  • 8/7/2019 num aleatorios sep

    17/21

    33

    5298.03012

    196.1

    2

    1

    12

    1

    2

    12

    =

    +=

    +=

    nzls

    x

    4701.03012

    196.1

    2

    1

    12

    1

    2

    12

    =

    =

    =

    nzli

    x

    dado que el valor promedio se encuentra entre los lmites, se acepta la hiptesis H0, es

    decir, se puede afirmar que la media de los nmeros es estadsticamente igual a21 .

    Prueba de Variancia.

    Consiste en verificar si los nmeros aleatorios generados tienen una variancia de 0.083, de

    tal forma que la hiptesis queda expresada como:

    H0 : Var = 1/12

    H1 : Var 1/12

    Paso 1.

    Calcular la variancia de los n nmeros generados )(xV .

    ( )

    1)( 1

    2

    =

    =

    n

    xr

    xV

    n

    i

    i

    Paso 2.

    Calcular los lmites superior e inferior de aceptacin.

    ( )112

    2

    1,

    )(2

    =

    nls

    n

    xv

    ( )112

    2

    1,

    )(2

    =

    nli

    n

    xv

    Paso 3.

    Si )(xV se encuentra entre los valores de )(xvls y )(xvli , aceptamos la hiptesis nula y losnmeros aleatorios tienen una variancia estadsticamente igual a

    121 .

    Ejemplo. Realice la prueba de variancia a los siguientes 30 nmeros con un nivel de

    confianza del 95%.

    .72484 .48999 .50502 .39528 .36782 .90234

    .71890 .61234 .86322 .94134 .99872 .27657

    .34565 .02345 .67347 .10987 .25678 .25593

  • 8/7/2019 num aleatorios sep

    18/21

    34

    .82345 .12387 .05389 .82474 .59289 .36782

    .03991 .10461 .93716 .16894 .98953 .73231

    Al calcular V(x) se obtiene que es igual a 0.104. Al calcular los lmites de aceptacin paramuestras de tamao 30.

    ( )1313.0

    )29(12

    7.45

    )1(12112

    2

    29,025.0

    2

    1,

    )(2 ==

    =

    =

    nnls

    n

    xv

    ( ) ( )046.0

    )29(12

    04.16

    112112

    2

    29,975.0

    2

    1,

    )(2 ==

    =

    =

    nnli

    n

    xv

    el valor se encuentra dentro de lmites por lo que se acepta que la variancia de la muestra es

    estadsticamente igual a121 .

    Prueba de Forma.

    Para realizar esta prueba se utiliza la prueba de bondad de ajuste 2 , ya vista con

    anterioridad. Esta prueba se emplear en el caso especfico de los nmeros aleatorios

    uniformes entre 0 y 1, para probar que un conjunto de datos siga esta distribucin. De esta

    manera la hiptesis propuesta se resume como sigue

    H0 : ir U ( 0,1 )

    H1 : ir U ( 0,1 )

    Ejemplo. Tomando los 30 nmeros del ejemplo anterior, determine con un nivel de

    confianza del 95% si pertenecen a una poblacin uniforme.

    Dividiendo el rango de 0 a 1 en 10 intervalos y clasificando los 30 nmeros segn su valor,se obtiene la siguiente tabla.

    Intervalo FO FE = 30/10 (FE-FO)2/FE

    0.0 - 0.1 3 3 0.0000

    0.1 - 0.2 4 3 0.3333

    0.2 - 0.3 3 3 0.0000

    0.3 - 0.4 4 3 0.3333

    0.4 - 0.5 1 3 1.33330.5 - 0.6 2 3 0.3333

    0.6 - 0.7 2 3 0.3333

    0.7 - 0.8 3 3 0.0000

    0.8 - 0.9 3 3 0.00000.9 - 1.0 5 3 1.3333

    Sumatoria 4.0000

    Se obtiene un valor de C = 4.0. Se compara con el valor de tablas 2con 10 0 1 = 9

    grados de libertad y un nivel de 5%, que es igual a 16.90 y la comparacin indica que los

    nmeros generados siguen una distribucin uniforme entre 0 y 1.

  • 8/7/2019 num aleatorios sep

    19/21

    35

    Pruebas de independencia.

    Las pruebas de independencia consisten en demostrar que los nmeros generados sonestadsticamente independientes entre s, esto es, que no dependen uno de otro. Para esto se

    propone la siguiente hiptesis:

    H0: ir Independiente

    H1: ir Dependiente

    Para realizar esta prueba de hiptesis existen varios mtodos, puede seleccionarse

    cualquiera de la siguiente lista:

    Pruebas de pker Prueba de corridas arriba y abajo.

    Prueba de corridas arriba y abajo de la media. Prueba de la longitud de las corridas.

    Prueba de distancia.

    Pruebas de series. Prueba de huecos.

    Prueba de Pker :Paso 1.

    Calcular las probabilidades esperadas para un juego de pker con cinco cartas numeradasdel 0 al 9 con remplazo, se tienen siete eventos o intervalos, con las siguientes

    probabilidades:

    p ( pachuca ) = 10/10 * 9/10 . . . 1/10 = 0.3024

    p ( par ) = 10/10 * 9/10 * 8/10 * 7/10 * (5/2) = 0.504

    p ( dos pares ) = 0.108p ( tercia ) = 0.0720

    p ( full ) = 0.0090

    p ( poker ) = 0.0045

    p ( quintilla) = 0.0001

    Paso 2.

    Calcular la frecuencia esperada de cada uno de los eventos (FE i) multiplicando la

    probabilidad de cada evento por el total de nmeros aleatorios generados.

    Paso 3.

    Para cada nmero aleatorio generado verificar (imaginando que es una mano de pker) si es

    pachuca, un par, dos pares, etctera, tomando los primeros cinco dgitos a la derecha del

    punto decimal. Por ejemplo 0.03408 es un par, 0.44343 es un full, 0.00121 dos pares,

  • 8/7/2019 num aleatorios sep

    20/21

    36

    etctera. Con estos resultados se genera una tabla de frecuencia de estos eventos. La

    frecuencia observada de cada uno de los eventos se conoce como (FO i).

    Paso 4.

    Calcular el estadstico C de 2con 7=m .

    Paso 5.

    Si el valor de C es menor o igual al estadstico de tablas 2con 6 grados de libertad y una

    probabilidad de rechazo , entonces se acepta que los datos son estadsticamenteindependientes entre s.

    Ejemplo. Realice la prueba de pker a los siguientes 30 nmeros con un nivel de confianza

    del 95%.

    .72484 .48999 .50502 .39528 .36782 .90234

    .71890 .61234 .86322 .94134 .99872 .27657

    .34565 .02345 .67347 .10987 .25678 .25593

    .82345 .12387 .05389 .82474 .59289 .36782

    .03991 .10461 .93716 .16894 .98953 .73231

    Agrupando los nmeros de acuerdo con sus dgitos, como si fuera una mano de pker seobtiene la siguiente tabla de frecuencias:

    Intervalo FO PE FE=(n * PE) (FE-FO)2/FE

    Pachuca 15 0.3024 9.072 3.874Un par 13 0.504 15.12 0.297

    Dos pares 1 0.108 3.24 1.549

    Una tercia 1 0.072 2.16 0.623Full 0 0.009 0.27 0.270

    Pker 0 0.0045 0.135 0.135

    Quintilla 0 0.0001 0.003 0.003

    Sumatoria 30 1 30 6.750

    El clculo de C es igual a 6.75 que comparado contra el valor de tablas 2con 7-1 = 6

    grados de libertad, y con un nivel de 5%, que es igual a 12.59, indica que los nmero

    generados son estadsticamente independientes.

    Prueba de corridas.

    Paso 1.

    Clasificar cada nmero aleatorio con respecto al anterior, de acuerdo con:

    Si 1 ii rr =ir

    Si 1 ii rr +=ir

    Paso 2.

  • 8/7/2019 num aleatorios sep

    21/21

    37

    Calcular el nmero de corridas observadas h . Una corrida se forma por un conjunto de

    nmeros aleatorios consecutivos del mismo signo.

    0.2 0.4 0.6 + + -

    Paso 3.

    Calcular )(hE y )(hV de acuerdo con:

    90

    2916)(

    3

    12)(

    =

    =

    nhV

    nhE

    donde n es el nmero de datos generados.Paso 4.

    Calcular el estadstico( )

    )(

    )(

    hV

    hEhz

    = , si es menor que el valor crtico

    2Z se acepta la

    hiptesis de independencia.

    Ejemplo. Determine si la siguiente secuencia de 20 nmeros puede ser aceptada como

    independiente con un nivel de confianza del 95%, usando la prueba de corridas.

    0.75

    (-)0.21

    (-)0.01

    (+)0.92

    (-)0.74

    (-) 0.58 (-) 0.17 (+) 0.55 (-) 0.12 (+) 0.42(+)

    0.63(+)

    0.74(-)

    0.11(+)

    0.95(-)

    0.38(-)

    0.37(+)

    0.63(+)

    0.72(-)

    0.17(-)

    0.04

    Existen 11=h corridas. Con 20=n tenemos, 13)( =hE corridas y 23.3)( =hV .

    El valor de 112.1797.1

    1311

    )(

    ))((=

    =

    =

    hV

    hEhz

    Que comparado contra 96.1025.0 =Z , de tal manera que la independencia de estos nmeros

    no puede ser rechazada.