Upload
andrezdb
View
234
Download
0
Embed Size (px)
Citation preview
8/7/2019 num aleatorios sep
1/21
17
SEGUNDA UNIDAD. PRUEBAS DE BONDAD DE AJUSTE Y NUMEROS
PSEUDOALEATORIOS.
2.1 PRUEBAS DE BONDAD DE AJUSTE
2.1.1 Distribuciones de probabilidad.
Al modelar un sistema, se debe diferenciar entre dos tipos de datos los primeros
permanecen sin cambio a travs del tiempo y se conocen como parmetros; los segundospresentan cambios a travs del tiempo y se conocen como variables. Por ejemplo, elmodelado de un sistema mediante simulacin es til cuando la informacin del sistema
tiene carcter de dinmico y probabilstico, debido principalmente a que la interaccin de
esa informacin es, por lo general, difcil de analizar.
La variabilidad que presenta el segundo tipo de datos debe modelarse de acuerdo con
ciertas ecuaciones matemticas que son capaces de reproducirla; en la mayora de los casos
dicha variabilidad puede clasificarse dentro de alguna distribucin de probabilidad. Aspues, uno de los pasos ms importantes de todo el proceso de modelado estocstico es la
bsqueda de informacin y su anlisis estadstico posterior basado principalmente en la
clasificacin de cada serie de datos dentro de alguna distribucin de probabilidad. Algunas
de las distribuciones ms comunes se analizan a continuacin.
2.1.1.1 Distribuciones continuas.Este tipo de distribuciones se utilizan para modelar la aleatoriedad en aquellas actividades o
eventos en los cuales los valores de las variables pueden estar dentro de un rango de valores
reales. A continuacin se describen algunas de las funciones continuas ms utilizadas.
Uniforme U(a, b)
Funcin de densidad
abxf
=
1)( si bxa
Distribucin acumulada
ab
axxF
=)( si bxa
Parmetros A y b son nmeros reales con a < b; a es un
parmetro de ubicacin; b-a es un parmetro
de escala
Rango [ ]ba,Media
2
ba +
8/7/2019 num aleatorios sep
2/21
18
Variancia ( )12
2ab
Figura 2.1. Distribucin de probabilidad Uniforme continua.
Exponencial Expo()Funcin de densidad
x
exf
=1
)( si 0x
Distribucin acumulada xexF
= 1)( si0x
Parmetros Parmetro de escala > 0Rango [ ),0 Media
Variancia 2
Figura 2.2. Distribucin de probabilidad Exponencial.
Weibull Weib(, )Funcin de densidad
( )x
ex 1 si x > 0
=)(xf
0
Distribucin acumulada
( )xe
1 si x > 0=)(xF
0 de otra ma
8/7/2019 num aleatorios sep
3/21
19
Parmetros Parmetro de escala > 0
Parmetro de forma > 0Rango
[ ),0 [ ),0Media
1
Variancia
22 1122
Figura 2.3. Distribucin de probabilidad Weibull.
Triangular TR(a,b,c)
Funcin de densidad
( )( )( )bcac
ax
2si bxa
=)(xf
( )
( )( )bcacxc
2si cxb
Distribucin acumulada
( )( )( )abac
ax
2
si bxa
=)(xF
( )
( )( )bcacxc
2
1 si cxb
Parmetros Parmetro de localizacin:
Parmetro de escala: Rango a, b
Media
3
cba ++
Variancia
18
222bcabaccba +++
8/7/2019 num aleatorios sep
4/21
20
Figura 2.4. Distribucin de probabilidad Triangular.
Normal N(, )Funcin de densidad 2
2
1
2
1)(
=
x
exf x
Distribucin acumulada No existe ecuacin
Parmetros Parmetro de localizacin:
Parmetro de escala: Rango ( ) ,Media Variancia 2
Figura 2.5. Distribucin de probabilidad Normal.
Lognormal LOGN(, )Funcin de densidad
( )2
2
2
ln
2exp
2
1
x
xsi x > 0
=)(xf
0
Distribucin acumulada No existe ecuacin
Parmetros Parmetro de escala:
Parmetro de forma: Rango [ ),0
8/7/2019 num aleatorios sep
5/21
21
Media 2+e
Variancia )1222 + ee
Figura 2.6. Distribucin de probabilidad Lognormal.
2.1.1.2 Distribuciones discretas.
Este tipo de distribuciones sirven para modelar la aleatoriedad de una variable que slo
puede tomar valores enteros. Las siguientes distribuciones son algunas de las ms utilizadas
en el modelado de sistemas estocsticos.
Bernoulli Be(t, p)
Distribucin de probabilidad p1 si 0=x
=)(xp
p si 1=x
Distribucin acumulada 0 si0x =)(xF p1 si 10 x
1 si1x Rango { }1,0 Media p
Variancia ( )pp 1
Figura 2.7. Distribucin de probabilidad de Bernoulli.
8/7/2019 num aleatorios sep
6/21
22
Uniforme discreta UD(i, j)
Distribucin de probabilidad
1
1)(
+
=
ij
xp si { }jiix ,,1, +
Distribucin acumulada 0 siix
=)(xF 1
1
+
+
ij
ixsi jxi
1 sixj
Rango { }jii ,,1, + Media
2
ji +
Variancia ( )12
112
+ ij
Figura 2.8. Distribucin de probabilidad. Uniforme discreta.
Binomial BI(n, p)Distribucin de probabilidad
( ) xnx ppx
n
1 { }nx ,,1,0
=)(xp
0 de otra manera
Distrubucin acumulada 0
=)(xF ( )iix
i
ppj
nx
=
10
si nx 0
1
Rango
{ }n,,1,0
Media np
Variancia ( )pnp 1
8/7/2019 num aleatorios sep
7/21
23
Figura 2.9. Distribucin de probabilidad Binomial.
Poisson PS()Distribucin de probabilidad
!x
e xsi { },1,0x
=)(xp
0 de otra manera
Distribucin acumulada
=
=x
i
i
iexF
0 !)(
si 0x
Rango > 0, x enteroMedia Variancia
Figura 2.10. Distribucin de probabilidad Poisson.
Geomtrica GE(p)
Distribucin de probabilidad ( )
x
pp 1 si ( )
,1,0x =)(xf
0 de otra mane
Distribucin acumulada ( )[ ] 111 + xp si 0x =)(xF
0
Rango { }n,,1,0 Media
p
p1
8/7/2019 num aleatorios sep
8/21
24
Variancia2
1
p
p
Figura 2.11. Distribucin de probabilidad Geomtrica
2.1.2 Determinacin del tipo de distribucin.
En la mayor parte de los sistemas, al analizar la informacin, sta se encuentra disponible
en forma de series a travs del tiempo.
Est informacin, tabulada en dicho formato no es de utilidad cuando se trata de obtener un
comportamiento basado en variabilidad con cierto comportamiento probabilistico. As pues,si el analista desea conocer el comportamiento, es necesario modificar la forma depresentacin de datos y presentarla como tablas de frecuencia, con la finalidad de realizar
cualquiera de las siguiente pruebas:
Prueba de bondad de ajuste 2. Prueba de Kolgomorov Smirnov.
2.1.2.1 Prueba de bondad de ajuste 2.
Como ya se menciono, esta prueba se utiliza para encontrar la distribucin de probabilidad
de una serie de datos. La metodologa de la prueba 2es la siguiente:
1. Se colocan los n datos histricos (al menos 30 datos) en una tabla de frecuencias de
nm = intervalos. Se obtiene la frecuencia observada en cada intervalo i, (FOi). Se
calcula la media y la variancia de los datos.2. Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de
frecuencias obtenida en el paso 1.3. Con la distribucin propuesta, se calcula la frecuencia esperada para cada uno de los
intervalos (FEi) mediante la integracin de la distribucin propuesta y su posterior
multiplicacin por el nmero total de datos.
4. Se calcula el estimador:
( )
=
=
m
i i
ii
FE
FOFEC
1
2
8/7/2019 num aleatorios sep
9/21
25
5. Si el estimador C es menor o igual al valor correspondiente 2con 1 km grados de
libertad ( =k nmero de parmetros estimados de la distribucin) y a un nivel de
confiabilidad de 1 , entonces no se puede rechazar la hiptesis de que lainformacin histrica sigue la distribucin propuesta en el punto 2.Ejemplo:
Se desea obtener la distribucin de probabilidad ideal, conque se reciben llamadas para
consulta en un servicio de biblioteca. La informacin histrica se resume en el siguiente
cuadro, en el cual se menciona la cantidad de llamadas que se recibieron en el intervalo de
una hora, esto es, el total de horas que se tomaron para informacin, fue de 509.
No. de llamadas Frecuencia observada
0 315
1 1422 40
3 9
4 2
5 1
509
Tabla de frecuencias: Ya esta dada con la informacin. As como la frecuencia observada.
Media y variancia de los datos.
Marca de clase x f fx x2
fx2
0 315 0 0 01 142 142 1 142
2 40 80 4 160
3 9 27 9 814 2 8 16 32
5 1 5 25 25
Sumatoria 509 262 440
5147.0509
262===
n
fxx ( ) ( ) 5995.05147.0
509
440 222
2 ===
xn
fxs
Se propone una distribucin de probabilidad.
Figura 2.12. Histgrma del sistema de llamadas a la biblioteca
0 1 2 3 4 5
315
142
409 2 1
0
100
200
300
400
1 2 3 4 5 6
Llamadas
FO
8/7/2019 num aleatorios sep
10/21
26
Como se puede observar en la grfica anterior, la distribucin de datos se asemeja a una
distribucin de probabilidad Poisson. Del cuadro anterior de la distribucin de probabilidad
discreta Poisson, nos muestra que esta distribucin tiene un solo parmetro y que la
media y la variancia son iguales, es decir, el valor de . Pero en nuestro caso tenemos dosvalores, uno para la media, 0.5147 y otro para la variancia, 0.5995. Entonces para hacer
estos dos valores uno solo, se procede de la siguiente manera:
5571.02
5995.05147.0=
+=
Por lo tanto se propone Poisson con media = 0.5571
Clculo de la frecuencia esperada.
Del mismo cuadro de la distribucin Poisson, se tiene que la frmula para calcular ladistribucin de probabilidad es:
=)(xp!x
ex
5729.0!0
)5571.0()0(
5571.000
==
e
p
3191.0!1
)5571.0()1(
5571.001
==
e
p
0889.0
!2
)5571.0()2(
5571.002
==
e
p
0165.0!3
)5571.0()3(
5571.003
==
e
p
0023.0!4
)5571.0()4(
5571.004
==
e
p
0003.0!5
)5571.0()5(
5571.005
==
e
p
Multiplicacin por el nmero total de datos.
No. de
llamadas
FO PO PE FE
0 315 0.6189 0.5729 291.6061
1 142 0.2790 0.3191 162.4219
2 40 0.0786 0.0889 45.2501
3 9 0.0177 0.0165 8.3985
4 2 0.0039 0.0023 1.1707
5 1 0.0020 0.0003 0.1527
Sumatoria 509 1.0000 1 509.0000
Se calcula el estimador:
8/7/2019 num aleatorios sep
11/21
27
( )
=
=
m
i i
ii
FE
FOFEC
1
2
No. de
llamadas
FO PO PE FE (FE-FO)2/FE
0 315 0.6189 0.5729 291.6061 1.87681 142 0.2790 0.3191 162.4219 2.5677
2 40 0.0786 0.0889 45.2501 0.6091
3 9 0.0177 0.0165 8.3985 0.04314 2 0.0039 0.0023 1.1707 0.5875
5 1 0.0020 0.0003 0.1527 4.7015
Sumatoria 509 1.0000 1 509.0000
No. dellamadas
PO
3 0.01774 0.0039
5 0.002
Sumatoria 0.0236
Como la suma de los intervalos para 3, 4 y 5 llamadas (0.0236 o 2.36%), no es
representativo para la muestra, es necesario agruparlos en un solo bloque, ya que
tratndolos por separado acarreara un grave error. Por lo tanto se recomienda agruparlos,quedando el clculo como se muestra en el siguiente cuadro.
No. de
llamadasFO FE (FE-
FO)2/FEFO FE (FE-
FO)2/FE
0 315 291.6061 1.8768 315 291.6061 1.87681 142 162.4219 2.5677 142 162.4219 2.56772 40 45.2501 0.6091 40 45.2501 0.60913 9 8.3985 0.0431 Agrupando Agrupando Agrupando4 2 1.1707 0.5875 3, 4 y 5 3, 4 y 5 3, 4 y 55 1 0.1527 4.7015 12 9.7219 0.5338
Sumatoria 509 509.0000 509 509.0000 5.5874
C = 5.5874
Clculo del estimador de tablas 2 ,1 km .
m = nmero de intervalos, en este caso, cuatro, ya que de seis originales, se agruparon tres
en uno.
k = 1, la distribucin de probabilidad Poisson, solo tiene un parmetro.
Coeficiente de error de = 0.05.Entonces:
99.52 05.0,22
05.0,114 ==
8/7/2019 num aleatorios sep
12/21
28
5.5874 < 5.99. Entonces no se puede rechazar la hiptesis de que la informacin histrica
sigue una distribucin Poisson con media = 0.5571 con un 95% de confianza.
2.1.2.2 Prueba de bondad de ajuste de Kolmogorov Smirnov
Si el objetivo es encontrar el tipo de distribucin de probabilidad de una serie de datos, es
posible utilizar la prueba de bondad de ajuste de Kolgomorov Smirnov, la cual,
comparandola con la de 2, es ms eficiente en varios aspectos ya que trabaja con la
distribucin de probabilidad acumulada. La metodologa es la siguiente:
1. Se colocan los n datos histricos en una tabla de frecuencias con nm = intervalos.
Para cada intervalo se tendr la frecuencia observada i (FOi). Se calcula media y la
variancia de los datos.2. Se divide la frecuencia observada de cada intervalo por el nmero total de datos, para
obtener la probabilidad observada i (POi).3. Se calcula la probabilidad acumulada observada de cada intervalo (PAOi) del paso 2.
4. Se propone una distribucin de probabilidad de acuerdo con la forma de la tabla de
frecuencias obtenidas en 1.
5. Con la distribucin propuesta se calcula la probabilidad esperada para cada uno de los
intervalos (PEi) mediante la integracin de la distribucin propuesta.
6. Se calcula la probabilidad acumulada esperada (PAEi) para cada intervalo de clase.
7. Se calcula el valor absoluto entre PAO y PEO para cada intervalo y se selecciona la
mxima diferencia, llamndola DM.
8. El estimador DM se compara con un valor lmite correspondiente a la tabla 6 en elapndice B del libro de texto, con n datos a un nivel de confiabilidad de 1 - . Si elestimador DM es menor o igual al valor lmite de la tabla 6, entonces no se puederechazar que la informacin histrica sigue la distribucin propuesta en el paso 4.
Ejemplo. Mediante la prueba de Kolgomorov Smirnov determine el tipo de distribucin de
probabilidad que siguen los datos del ejemplo anterior, con un nivel de confianza del 95%.
Los primeros pasos ya se resolvieron en el ejemplo anterior y los ltimos pueden resumirse
con la elaboracin del siguiente cuadro.
No. dellamadas
FO PO PAO PE PAE Abs(PAO-PAE)
0 315 0.6189 0.6189 0.5729 0.5729 0.0460
1 142 0.2790 0.8978 0.3191 0.8920 0.00582 40 0.0786 0.9764 0.0889 0.9809 0.00453 9 0.0177 0.9941 0.0165 0.9974 0.00334 2 0.0039 0.9980 0.0023 0.9997 0.00175 1 0.0020 1.0000 0.0003 1.0000 0.0000
Sumatoria 509 1.0000 1
DM = 0.0460
8/7/2019 num aleatorios sep
13/21
29
Lmite correspondiente a la tabla con 509 datos y un nivel de confianza de 95%, igual a:
0603.0509
36.136.1
==n
Como el estimador DM = 0.0460 es menor al valor lmite de la tabla D 0.05 = 0.0603, no se
puede rechazar que la informacin histrica sigue una distribucin Pisson con = 0.5571.
2.2 NUMEROS PSEUDOALEATORIOS.
Son nmeros con la misma probabilidad de ocurrencia. Serie de nmeros cuya secuencia no
puede predecirse.Generacin de aleatorios entre 0 y 1.
U (0, 1)
Utilidad.
Se utilizan para generar el comportamiento de la informacin de entrada.
2.2.1 Mtodos de generacin de nmeros pseudoaleatorios U(0, 1).Existen un gran nmero de mtodos para generar los nmeros aleatorios entre 0 y 1. El
mtodo a utilizar, en s mismo, no tiene importancia; la importancia radica en los nmeros
que genera, ya que estos nmeros deben cumplir ciertas caractrsticas para que sean
vlidos. Dichas caractersticas son:
1. Uniformemente distribuidos.
2. Estadsticamente independientes.
3. Su media debe ser estrictamente igual a2
1.
4. Su variancia debe ser estadsticamente igual a12
1.
5. Su perodo o ciclo de vida debe ser largo.
f(x) = Funcin de densidad
1
1 x
Figura 2.13. Funcin de densidad de probabilidad para el conjunto de los nmeros
pseudoaleatorios
8/7/2019 num aleatorios sep
14/21
30
=1
0
1
0)( dxdxxf
2
12
)(1
0
1
02===
xdxxxf
12
10833.0
2
1)(
2
1 1
0
21
0
2
2 ==
=
= dxxdxxfx
Mtodos congruenciales.
[ ]ii rcar +=+ )(1 donde:
=0r semilla del generador=mca ., constantes
Ejemplo. Genere nmeros con los siguientes datos:
=0r semilla 5
a = Cte 7
=c Cte 3=m Cte 9
50 =r
=1r (7 * 5 + 3) mod 9 = 2=2r (7 * 2 + 3) mod 9 = 8
=3r (7 * 8 + 3) mod 9 = 5
Generar 5 nmeros pseudoaleatorios con el generador congruencial multiplicativo siguiente
con la semilla 767,13,441,470 ==== mcar .
( ) mcrar ii mod1 +=+
) 767mod134411 ji rr +=+
38767mod))441(13441(
441767mod))649(13441(
649767mod))311(13441(
311767mod))285(13441(285767mod))47(13441(
5
4
3
2
1
=+=
=+=
=+=
=+==+=
r
r
r
rr
Dividiendo por 7661 =m , los nmeros aleatorios son:
8/7/2019 num aleatorios sep
15/21
31
0496.0
5757.08473.0
4060.0
3721.0
5
4
3
2
1
=
==
=
=
r
rr
r
r
Existen reglas para la seleccin de las constantes, algunas de ellas son:
c debe ser un entero impar, no divisible ni por 3 ni por 5.
a usualmente puede ser cualquier constante. Sin embargo para asegurar buenosresultados, seleccione a de tal forma que 58mod)( =a para una computadora binaria o
2200mod)( =a para una computadora decimal.
m debe ser el nmero entero ms grande que la computadora acepte.
De acuerdo con Holl y Dovell, los mejores resultados para un generador congruencial
mixto en una computadora binaria son:
3*8 = ca
=c cualquier entero.
=0r cualquier entero impar.
bm 2= donde b >2 y que m sea aceptado por la computadora.
Existen generadores de nmeros aleatorios entre 0 y 1 integrados a la mayora de lossistemas, que pueden ser llamados como funciones, algunos ejemplos son:
Mtodo de cuadrados medios.
El procedimiento de obtencin de nmeros con este tipo de generadores es el siguiente:
Generar una semilla.
Elevarla al cuadrado. Tomar de la parte central un conjunto de k dgitos que formarn el nmero aleatorio. Los k dgitos pasarn a ser la nueva semilla con el fin de repetir el proceso n ocasiones.
Ejemplo. Generar 3 nmeros de cuatro dgitos a partir de un generador de cuadrados
medios utilizando la semilla 445.
(445)2
= 198025 =1 9802 5 0.9802(9802)
2= 96079204 = 96 0792 04 0.0792
(792)2
= 627264= 6 2726 4 0.2726
8/7/2019 num aleatorios sep
16/21
32
2.2.2 Pruebas estadsticas para aleatorios.
Una vez que se ha creado o se puede usar un generador es importante verificar s los
nmeros generados poseen las caractersticas mencionadas. La comprobacin de talescaractersticas se realiza mediante ciertas pruebas estadsticas, que son las siguientes:
Prueba de medias
Consiste en verificar que los nmeros generados tengan una media estadsticamente igual a
21 , de esta manera, se analiza la siguiente hiptesis
H0 : media = 0.5
H1 : media 0.5
Paso 1.
Calcular la media de los n nmeros generados.
=
=n
i
ir
nx
1
1
Paso 2.Calcular los lmites superior e inferior de aceptacin:
+=
nzls
x12
1
2
12
=
n
zlix
12
1
2
1
2
Paso 3.
Si el valor de x se encuentra entrex
li yx
ls , aceptamos que los nmeros tienen una media
estadsticamente igual a21 con un nivel de aceptacin de 1 - .
Ejemplo. Realice la prueba de medias a los primeros 30 nmeros aleatorios entre 0 y 1 de
un generador congruencial mixto, con un nivel de confianza del 955. Los nmeros
generados son los siguientes:
.03991 .10461 .93716 .16894 .98953 .73231
.25593 .34565 .02345 .67347 .10987 .25678
.71890 .61234 .86322 .94134 .99872 .27657
.82345 .12387 .05389 .82474 .59289 .36782
.72484 .48999 .50502 .39528 .36782 .90234
Se calcula la media de los 30 datos.
507.01
1
== =
n
i
irn
x
Ahora se calcula los lmites de aceptacin para n = 30
8/7/2019 num aleatorios sep
17/21
33
5298.03012
196.1
2
1
12
1
2
12
=
+=
+=
nzls
x
4701.03012
196.1
2
1
12
1
2
12
=
=
=
nzli
x
dado que el valor promedio se encuentra entre los lmites, se acepta la hiptesis H0, es
decir, se puede afirmar que la media de los nmeros es estadsticamente igual a21 .
Prueba de Variancia.
Consiste en verificar si los nmeros aleatorios generados tienen una variancia de 0.083, de
tal forma que la hiptesis queda expresada como:
H0 : Var = 1/12
H1 : Var 1/12
Paso 1.
Calcular la variancia de los n nmeros generados )(xV .
( )
1)( 1
2
=
=
n
xr
xV
n
i
i
Paso 2.
Calcular los lmites superior e inferior de aceptacin.
( )112
2
1,
)(2
=
nls
n
xv
( )112
2
1,
)(2
=
nli
n
xv
Paso 3.
Si )(xV se encuentra entre los valores de )(xvls y )(xvli , aceptamos la hiptesis nula y losnmeros aleatorios tienen una variancia estadsticamente igual a
121 .
Ejemplo. Realice la prueba de variancia a los siguientes 30 nmeros con un nivel de
confianza del 95%.
.72484 .48999 .50502 .39528 .36782 .90234
.71890 .61234 .86322 .94134 .99872 .27657
.34565 .02345 .67347 .10987 .25678 .25593
8/7/2019 num aleatorios sep
18/21
34
.82345 .12387 .05389 .82474 .59289 .36782
.03991 .10461 .93716 .16894 .98953 .73231
Al calcular V(x) se obtiene que es igual a 0.104. Al calcular los lmites de aceptacin paramuestras de tamao 30.
( )1313.0
)29(12
7.45
)1(12112
2
29,025.0
2
1,
)(2 ==
=
=
nnls
n
xv
( ) ( )046.0
)29(12
04.16
112112
2
29,975.0
2
1,
)(2 ==
=
=
nnli
n
xv
el valor se encuentra dentro de lmites por lo que se acepta que la variancia de la muestra es
estadsticamente igual a121 .
Prueba de Forma.
Para realizar esta prueba se utiliza la prueba de bondad de ajuste 2 , ya vista con
anterioridad. Esta prueba se emplear en el caso especfico de los nmeros aleatorios
uniformes entre 0 y 1, para probar que un conjunto de datos siga esta distribucin. De esta
manera la hiptesis propuesta se resume como sigue
H0 : ir U ( 0,1 )
H1 : ir U ( 0,1 )
Ejemplo. Tomando los 30 nmeros del ejemplo anterior, determine con un nivel de
confianza del 95% si pertenecen a una poblacin uniforme.
Dividiendo el rango de 0 a 1 en 10 intervalos y clasificando los 30 nmeros segn su valor,se obtiene la siguiente tabla.
Intervalo FO FE = 30/10 (FE-FO)2/FE
0.0 - 0.1 3 3 0.0000
0.1 - 0.2 4 3 0.3333
0.2 - 0.3 3 3 0.0000
0.3 - 0.4 4 3 0.3333
0.4 - 0.5 1 3 1.33330.5 - 0.6 2 3 0.3333
0.6 - 0.7 2 3 0.3333
0.7 - 0.8 3 3 0.0000
0.8 - 0.9 3 3 0.00000.9 - 1.0 5 3 1.3333
Sumatoria 4.0000
Se obtiene un valor de C = 4.0. Se compara con el valor de tablas 2con 10 0 1 = 9
grados de libertad y un nivel de 5%, que es igual a 16.90 y la comparacin indica que los
nmeros generados siguen una distribucin uniforme entre 0 y 1.
8/7/2019 num aleatorios sep
19/21
35
Pruebas de independencia.
Las pruebas de independencia consisten en demostrar que los nmeros generados sonestadsticamente independientes entre s, esto es, que no dependen uno de otro. Para esto se
propone la siguiente hiptesis:
H0: ir Independiente
H1: ir Dependiente
Para realizar esta prueba de hiptesis existen varios mtodos, puede seleccionarse
cualquiera de la siguiente lista:
Pruebas de pker Prueba de corridas arriba y abajo.
Prueba de corridas arriba y abajo de la media. Prueba de la longitud de las corridas.
Prueba de distancia.
Pruebas de series. Prueba de huecos.
Prueba de Pker :Paso 1.
Calcular las probabilidades esperadas para un juego de pker con cinco cartas numeradasdel 0 al 9 con remplazo, se tienen siete eventos o intervalos, con las siguientes
probabilidades:
p ( pachuca ) = 10/10 * 9/10 . . . 1/10 = 0.3024
p ( par ) = 10/10 * 9/10 * 8/10 * 7/10 * (5/2) = 0.504
p ( dos pares ) = 0.108p ( tercia ) = 0.0720
p ( full ) = 0.0090
p ( poker ) = 0.0045
p ( quintilla) = 0.0001
Paso 2.
Calcular la frecuencia esperada de cada uno de los eventos (FE i) multiplicando la
probabilidad de cada evento por el total de nmeros aleatorios generados.
Paso 3.
Para cada nmero aleatorio generado verificar (imaginando que es una mano de pker) si es
pachuca, un par, dos pares, etctera, tomando los primeros cinco dgitos a la derecha del
punto decimal. Por ejemplo 0.03408 es un par, 0.44343 es un full, 0.00121 dos pares,
8/7/2019 num aleatorios sep
20/21
36
etctera. Con estos resultados se genera una tabla de frecuencia de estos eventos. La
frecuencia observada de cada uno de los eventos se conoce como (FO i).
Paso 4.
Calcular el estadstico C de 2con 7=m .
Paso 5.
Si el valor de C es menor o igual al estadstico de tablas 2con 6 grados de libertad y una
probabilidad de rechazo , entonces se acepta que los datos son estadsticamenteindependientes entre s.
Ejemplo. Realice la prueba de pker a los siguientes 30 nmeros con un nivel de confianza
del 95%.
.72484 .48999 .50502 .39528 .36782 .90234
.71890 .61234 .86322 .94134 .99872 .27657
.34565 .02345 .67347 .10987 .25678 .25593
.82345 .12387 .05389 .82474 .59289 .36782
.03991 .10461 .93716 .16894 .98953 .73231
Agrupando los nmeros de acuerdo con sus dgitos, como si fuera una mano de pker seobtiene la siguiente tabla de frecuencias:
Intervalo FO PE FE=(n * PE) (FE-FO)2/FE
Pachuca 15 0.3024 9.072 3.874Un par 13 0.504 15.12 0.297
Dos pares 1 0.108 3.24 1.549
Una tercia 1 0.072 2.16 0.623Full 0 0.009 0.27 0.270
Pker 0 0.0045 0.135 0.135
Quintilla 0 0.0001 0.003 0.003
Sumatoria 30 1 30 6.750
El clculo de C es igual a 6.75 que comparado contra el valor de tablas 2con 7-1 = 6
grados de libertad, y con un nivel de 5%, que es igual a 12.59, indica que los nmero
generados son estadsticamente independientes.
Prueba de corridas.
Paso 1.
Clasificar cada nmero aleatorio con respecto al anterior, de acuerdo con:
Si 1 ii rr =ir
Si 1 ii rr +=ir
Paso 2.
8/7/2019 num aleatorios sep
21/21
37
Calcular el nmero de corridas observadas h . Una corrida se forma por un conjunto de
nmeros aleatorios consecutivos del mismo signo.
0.2 0.4 0.6 + + -
Paso 3.
Calcular )(hE y )(hV de acuerdo con:
90
2916)(
3
12)(
=
=
nhV
nhE
donde n es el nmero de datos generados.Paso 4.
Calcular el estadstico( )
)(
)(
hV
hEhz
= , si es menor que el valor crtico
2Z se acepta la
hiptesis de independencia.
Ejemplo. Determine si la siguiente secuencia de 20 nmeros puede ser aceptada como
independiente con un nivel de confianza del 95%, usando la prueba de corridas.
0.75
(-)0.21
(-)0.01
(+)0.92
(-)0.74
(-) 0.58 (-) 0.17 (+) 0.55 (-) 0.12 (+) 0.42(+)
0.63(+)
0.74(-)
0.11(+)
0.95(-)
0.38(-)
0.37(+)
0.63(+)
0.72(-)
0.17(-)
0.04
Existen 11=h corridas. Con 20=n tenemos, 13)( =hE corridas y 23.3)( =hV .
El valor de 112.1797.1
1311
)(
))((=
=
=
hV
hEhz
Que comparado contra 96.1025.0 =Z , de tal manera que la independencia de estos nmeros
no puede ser rechazada.