Upload
leanh
View
220
Download
0
Embed Size (px)
Citation preview
LICENCIATURA EN MATEMÁTICAS
(SEP)
UNIVERSIDAD ABIERTA Y A DISTANCIA DE MÉXICO
MODELACIÓN ESTOCÁSTICA
UNIDAD 1.
DETERMINACIÓN DEL TIPO DE DISTRIBUCIÓN QUE
PRESENTA UN PROCESO ESTOCÁSTICO.D
Por: Lic. María de la Luz Pérez Limón.
ESO ESTOCÁSTICO. Actividad 2. Determinación d
UNIDAD I. DETERMINACIÓN DEL TIPO
DE DISTRIBUCIÓN QUE PRESENTA UN
PROCESO ESTOCÁSTICO. Actividad 1. Determinación del tipo de distribución que presenta un
proceso estocástico.
Revisa detenidamente cada uno de los siguientes casos y especifica el tipo de comportamiento probabilístico que presentan, justificando tu respuesta. Usa el foro para discutir tus soluciones. Analiza las siguientes tablas de datos, menciona el tipo de comportamiento probabilístico que presentan y determina su función de densidad, así como su media y varianza. 1)
Modelo propuesto:𝑼𝒏𝒊𝒇𝒐𝒓𝒎𝒆 (𝟕, 𝟏𝟔. 𝟑𝟑) Realizamos la tabla de datos correspondientes
Intervalo Frecuencia
observada Frecuencia esperada
𝑭𝑶 𝑭𝑶/𝟒𝟎 𝑭𝑬
0 – 2 6 0.15 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
2 – 4 5 0.125 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
4 – 6 6 0.15 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
6 – 8 6 0.15 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
8 – 10 6 0.15 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
10 – 12 5 0.125 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
12 – 14 6 0.15 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
∑𝑡𝑜𝑡𝑎𝑙 40 𝑬𝒔𝒕(𝒂) = 𝟎 𝑬𝒔𝒕(𝒃) = 𝟏𝟒
Suponemos que se distribuye de manera uniforme.
La FE esperada ∶ 𝑓(𝑥) = 1/(𝑎 − 𝑏) = 1/14
𝑓(𝑥|0,14) = 1/𝑎 − 𝑏
𝑓(𝑥) =1
14= 0.07142857
𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑎, 𝑏 𝑎 < 𝑏 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
𝑀𝑒𝑑𝑖𝑎: 𝑎 + 𝑏
2
𝝁 = 𝟕
𝑅𝑎𝑛𝑔𝑜: [𝑎, 𝑏] R: [0,14]
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 𝜎 = (𝑏 − 𝑎)2/12 𝝈 =
(𝟏𝟒 − 𝟎)𝟐
𝟏𝟐= 𝟏𝟔. 𝟑𝟑
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑎 = 𝑚í𝑛 𝑋𝑖 Est(a)=0
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑏 = 𝑚𝑎𝑥 𝑋𝑖 Est(b)=14
En este problema, podemos observar que todos los intervalos parecen tener una longitud similar y en la distribución en su rango son igualmente probables; además, el dominio está definido por dos parámetros, a y b, que son sus valores mínimo y máximo, las frecuencias obtenidas en una unidad de tiempo, presentan similitud y se distribuyen de manera muy uniforme.
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
1 2 3 4 5 6 7
FO/40
FE
Vemos aquí que, la distribución que se ajusta al histograma anterior será la distribución uniforme, de hecho propuse una función que se ajusta muy bien a la distribución, la cual se observa como f(x) junto al histograma de los datos, la cual se observa por su simetría y porque el valor intermedio corresponde exactamente al punto medio de los datos y que sus datos extremos tienen igual frecuencia que los datos intermedios. Además por la tabla anterior veo que la medio corresponde a 7 y su varianza al cuadrado de la desviación, que en este caso es 𝜎 = 4 y la varianza corresponde a 𝜌2 = 42 = 16. Por otro lado también realicé el cálculo anterior utilizando una lista con los datos observados en una lista suponiendo el valor observado la marca de clase de cada intervalo, de donde pude corroborar el dato de la varianza como se ve en la tabla mostrada.
2)
Modelo propuesto: 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍(𝟕)
Intervalo Frecuencia observada
𝐹𝑂
𝐹(𝑥) = ∫ 𝜆𝑒−𝜆𝑥𝑑𝑥
𝐿𝑠
𝐿𝑖
Frecuencia esperada 𝐹𝐸𝑖 = 𝑛𝐹(𝑥)
0-2 18 𝟎. 𝟏𝟓𝟑𝟎𝟕𝟏 7.194337
2-4 9 0.553301 26.00514
4-6 7 𝟎. 𝟕𝟑𝟓𝟕𝟔 34.58072
6-8 6 𝟎. 𝟖𝟒𝟖𝟖𝟔𝟕 39.89674
8-10 4 𝟏. 𝟏𝟐𝟗𝟗𝟐 53.10624
10-12 1 𝟏. 𝟕𝟑𝟑𝟕𝟔 81.48672
12-14 2 𝟏. 𝟓𝟎𝟒𝟎𝟑 70.68941
∑𝑇𝑜𝑡𝑎𝑙 47
𝑓(𝑥) = 𝜆𝑒−𝜆𝑥
𝑓(𝑥) =1
7𝑒−
𝑥
7
𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑎, 𝑏 𝑎 < 𝑏 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
𝑀𝑒𝑑𝑖𝑎: 𝜇 =1
𝜆
𝝁 = 𝟕
𝜆 =1
𝜇
𝝀 =𝟏
𝟕= 𝟎.𝟏𝟒𝟐𝟖𝟓𝟕
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 𝜎 =1
𝜆2 𝝈 =
𝟏
(𝟎.𝟏𝟒𝟐𝟖𝟓𝟕)𝟐= 𝟒𝟗
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑎 = 𝑚í𝑛 𝑋𝑖 Est(a)=0
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑏 = 𝑚𝑎𝑥 𝑋𝑖 Est(b)=14
Ahora, calculamos la frecuencia esperada para cada uno de los intervalos (FEi), integrando la función de densidad propuesta y multiplicándola por el número total de datos. Utilizamos la siguiente fórmula:
𝑭𝑬𝒊 = 𝒏𝑭(𝒙)
En este problema, vemos que se trata de una distribución exponencial, dado que tenemos una variable aleatoria continua y es por eso que se puede definir a partir de la especificación de su función de densidad; una característica de la distribución exponencial es que no tiene memoria, con el paso del tiempo la frecuencia parece ir disminuyendo.
0
10
20
30
40
50
60
70
80
90
1 2 3 4 5 6 7
(FO)/47
F(x)
FE
En el ejemplo anterior, la distribución de probabilidad posiblemente corresponde a una curva con un comportamiento exponencial, ello lo comprobé empíricamente trazando la función de densidad de una variable exponencial multiplicada por el número de datos, suponiendo que dicha distribución tenía una media de 4.16666 que fue la que obtuve de los datos. A continuación muestro la definición de la función que aproximan los valores esperados de la muestra:
3)
Modelo propuesto: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏 Realizamos la tabla de datos correspondientes:
Intervalo Frecuencia
observada Frecuencia esperada
𝑭𝑶 𝑭𝑶/𝟔𝟐 𝑭𝑬
0 – 3 1 0.016129 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
3 – 6 5 0.080645 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
6 – 9 9 0.145161 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
9 – 12 13 0.209677 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
12 – 15 17 0.274193 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
15 – 18 11 0.177419 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
18 – 21 4 0.064516 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
21 – 24 2 0.032258 𝟎. 𝟎𝟒𝟏𝟔𝟔𝟔𝟔𝟔𝟔𝟔
∑𝑡𝑜𝑡𝑎𝑙 62 𝑬𝒔𝒕(𝒂) = 𝟎 𝑬𝒔𝒕(𝒃) = 𝟐𝟒
𝑓(𝑥|0,24) = 1/24 = 0.04166667
𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠 𝑎, 𝑏 𝑎 < 𝑏, 0 ≤ 𝑥 ≤ 24
𝑀𝑒𝑑𝑖𝑎: 𝜇 = 12.29
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 𝜎2 = 21.03668
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑎 = 𝑚í𝑛 𝑋𝑖 = 0
𝐸𝑠𝑡𝑖𝑚𝑎𝑑𝑜𝑟 𝑏 = 𝑚𝑎𝑥 𝑋𝑖 = 24
Como vemos, este modelo se caracteriza por un sólo parámetro λ, que debe ser positivo; la esperanza y la varianza coinciden, tenemos también que el número de
éxitos que ocurren por unidad de tiempo, es totalmente al azar y cada intervalo de
tiempo es independiente de otro intervalo dado, así como cada área es independiente
de otra área dada y cada producto es independiente de otro producto dado.
0
2
4
6
8
10
12
14
16
18
1 2 3 4 5 6 7 8
(FO)
FO/62
FE
En este caso tracé una función de densidad normal con media 12.29032 y desviación 4.5865, que es la raíz de la varianza 21.03668 multiplicada por 62 que es el número de datos en juego, que se obtuvo utilizando los datos propuestos a partir de la tabla de frecuencia dada utilizando como representantes la marca de clase de cada intervalo. Por el momento me parece que ello podría representar un argumento empírico para decir que los datos provienen de una distribución normal con una cierta media y una cierta desviación, pero me parece que existirán diversos métodos paramétricos y no paramétricos para argumentar ello de una mejor forma.
4)
Modelo propuesto: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏 Realizamos la tabla de datos correspondientes
Intervalo Frecuencia observada Frecuencia
Esperada
(FO) FO/80 FE
0 – 3 2 0.025 0.037037037
3 – 6 9 0.1125 0.037037037
6 – 9 15 0.1875 0.037037037
9 – 12 21 0.2625 0.037037037
12 – 15 16 0.2 0.037037037
15 – 18 9 0.1125 0.037037037
18 – 21 4 0.05 0.037037037
21 – 24 3 0.0375 0.037037037
24 – 27 1 0.0125 0.037037037
∑𝒕𝒐𝒕𝒂𝒍 80 𝑬𝒔𝒕(𝒂)= 𝟎
𝑬𝒔𝒕(𝒃) = 𝟐𝟕
𝒇(𝒙|𝟎, 𝟐𝟕) = 𝟏/𝟐𝟕 = 𝟎. 𝟎𝟑𝟕𝟎𝟑𝟕𝟎𝟑
𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂,𝒃 𝒂 < 𝒃, 𝟎 ≤ 𝒙 ≤ 𝟐𝟕
𝑴𝒆𝒅𝒊𝒂: 𝝁 =𝟏
𝝀= 𝟏𝟏.𝟒
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂: 𝝈𝟐 = 𝟐𝟓.𝟎𝟔𝟓
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒂 = 𝒎í𝒏 𝑿𝒊 = 𝟎
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒃 = 𝒎𝒂𝒙 𝑿𝒊 = 𝟐𝟕
Como vemos, este modelo se caracteriza por un sólo parámetro λ, que debe ser positivo; la esperanza y la varianza coinciden, tenemos también que el número de
éxitos que ocurren por unidad de tiempo, es totalmente al azar y cada intervalo de
tiempo es independiente de otro intervalo dado, así como cada área es independiente
de otra área dada y cada producto es independiente de otro producto dado.
Analiza las siguientes series de tiempo, menciona el tipo de comportamiento probabilístico que presenta la variable aleatoria del eje vertical, y determina su función de densidad así como su media y varianza.
En este caso tracé una función de densidad normal con media 11.166666 y desviación
4.64774 = √21.60153, multiplicada por 87 que es el número de datos en juego, que se obtuvo utilizando los datos propuestos a partir de la tabla de frecuencia dada utilizando como representantes la marca de clase de cada intervalo. Por el momento
0
5
10
15
20
25
1 2 3 4 5 6 7 8 9
(FO)
FO/80
FE
me parece que ello podría representar un argumento empírico para decir que los datos provienen de una distribución normal con una cierta media y una cierta desviación, pero me parece que existirán diversos métodos paramétricos y no paramétricos para argumentar ello de una mejor forma. Analiza las siguientes series de tiempo, menciona el tipo de comportamiento probabilístico que presenta la variable aleatoria del eje vertical, y determina su función de densidad así como su media y varianza.
5)
En este problema se tienen 45 datos históricos, cada uno de los cuales corresponde al número de computadoras portátiles vendidas en un día determinado, si n es el número de datos conocidos, iniciaremos calculando n clases:
√𝟒𝟓 = 𝟔. 𝟕 = 𝟕 De aquí que debemos considerar 7 intervalos, pues 7 es el menor entero mayor o igual que 6.7
Modelo propuesto:𝑼𝒏𝒊𝒇𝒐𝒓𝒎𝒆 (𝟕, 𝟏𝟔. 𝟑𝟑) Realizamos la tabla de datos correspondientes
Intervalo Frecuencia
observada Frecuencia
esperada
𝑭𝑶 𝑭𝑶/𝟒𝟓 𝑭𝑬
0 – 2 7 0.1566 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
2 – 4 5 0.1111 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
4 – 6 7 0.1556 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
6 – 8 6 0.1333 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
Días
De
ma
nd
a d
e T
ele
vis
ore
s
44403632282420161284
14
12
10
8
6
4
2
0
Serie de tiempo de la demanda de televisores por día
8 – 10 7 0.1556 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
10 – 12 7 0.1556 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
12 – 14 6 0.1333 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
∑𝒕𝒐𝒕𝒂𝒍 45 𝑬𝒔𝒕(𝒂) = 𝟎 𝑬𝒔𝒕(𝒃) = 𝟏𝟒
𝐒𝐮𝐩𝐨𝐧𝐞𝐦𝐨𝐬 𝐪𝐮𝐞 𝐬𝐞 𝐝𝐢𝐬𝐭𝐫𝐢𝐛𝐮𝐲𝐞 𝐝𝐞 𝐦𝐚𝐧𝐞𝐫𝐚 𝐮𝐧𝐢𝐟𝐨𝐫𝐦𝐞.
𝐋𝐚 𝐅𝐄 𝐞𝐬𝐩𝐞𝐫𝐚𝐝𝐚 ∶ 𝒇(𝒙) = 𝟏/(𝒂 − 𝒃) = 𝟏/𝟏𝟒
𝒇(𝒙|𝟎, 𝟏𝟒) = 𝟏/𝒂− 𝒃
𝒇(𝒙) =𝟏
𝟏𝟒= 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂,𝒃 𝒂 < 𝒃 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
𝑴𝒆𝒅𝒊𝒂: 𝒂 + 𝒃
𝟐
𝝁 = 𝟕
𝑹𝒂𝒏𝒈𝒐: [𝒂, 𝒃] R: [0,14]
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂: (𝒃 − 𝒂)𝟐/𝟏𝟐 𝝈 =
(𝟏𝟒 − 𝟎)𝟐
𝟏𝟐= 𝟏𝟔. 𝟑𝟑
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒂 = 𝒎í𝒏 𝑿𝒊 Est(a)=0
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒃 = 𝒎𝒂𝒙 𝑿𝒊 Est(b)=14
En este problema, podemos observar que todos los intervalos parecen tener una longitud similar y en la distribución en su rango son igualmente probables; además, el dominio está definido por dos parámetros, a y b, que son sus valores mínimo y máximo.
0
1
2
3
4
5
6
7
8
0-2 2 – 4 4 – 6 6 – 8 8 – 10 10 – 12 12 – 14
FO
FO/45
FE
En este caso, por la forma del histograma que determinan los datos de la variable y se trata de una v.a. uniforme en el intervalo (0,14) por lo que propuse el valor esperado como el número de datos entre 7 que es el número de intervalos definidos en el histograma propuesto.
6)
Modelo propuesto: 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍(𝟕)
En este problema se tienen 42 datos históricos, cada uno de los cuales corresponde al número de computadoras portátiles vendidas en un día determinado, si n es el número de datos
conocidos, iniciaremos calculando n clases:
Días
De
ma
nd
a d
e H
am
bu
rgu
esa
s
424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Demanda de Hamburguesas por día
√42 = 6.48 = 7 De aquí que debamos considerar 7 intervalos, pues 7 es el menor entero mayor o igual
que 6.48
Intervalo
Frecuencia observada
𝑭𝑶
FO/42 𝑭(𝒙) = ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙
𝑳𝒔
𝑳𝒊
Frecuencia esperada 𝑭𝑬𝒊 = 𝒏𝑭(𝒙)
0-2 15 0.3571 0.23531 9.88302
2-4 10 0.2381 0.48342 20.30364
4-6 7 0.1667 0.73576 30.90192
6-8 4 0.0952 1.12992 47.45664
8-10 3 0.0714 1.30362 54.75204
10-12 2 0.0476 1.50403 63.16926
12-14 1 0.0238 1.73524 72.88008
∑𝑻𝒐𝒕𝒂𝒍 42
𝒇(𝒙) = 𝝀𝒆−𝝀𝒙
𝒇(𝒙) =𝟏
𝟕𝒆−
𝒙
𝟕
𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂,𝒃 𝒂 < 𝒃 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
𝑴𝒆𝒅𝒊𝒂: 𝝁 =𝟏
𝝀
𝝁 = 𝟏𝟏.𝟒
𝝀 =𝟏
𝝁
𝝀 =𝟏
𝟏𝟏.𝟒= 𝟎.𝟎𝟖𝟕𝟕𝟏𝟗𝟐
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂:𝝈 =𝟏
𝝀𝟐 𝝈 =
𝟏
(𝟎.𝟎𝟖𝟕𝟕𝟏𝟗𝟐)𝟐= 𝟐𝟓.𝟎𝟔𝟓
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒂 = 𝒎í𝒏 𝑿𝒊 Est(a)=0
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒃 = 𝒎𝒂𝒙 𝑿𝒊 Est(b)=14
Ahora, calculamos la frecuencia esperada para cada uno de los intervalos (FEi), integrando la función de densidad propuesta y multiplicándola por el número total de datos. Utilizamos la siguiente fórmula:
𝑭𝑬𝒊 = 𝒏𝑭(𝒙)
En este problema, vemos que se trata de una distribución exponencial, dado que tenemos una variable aleatoria continua y es por eso que se puede definir a partir de la especificación de su función de densidad; una característica de la distribución exponencial es que no tiene memoria, con el paso del tiempo la frecuencia parece ir disminuyendo.
En el caso anterior, encontré que la mejor aproximación a los datos se da con una v.a. Poisson, en GeoGebra encontré que existe la forma de simular un histrograma con las probabilidades de una cierta distribución Poisson (es decir, simula la función de densidad de probabilidades) con un cierto parámetro, por lo que inicialmente determiné el valor de la media utilizando los datos, así como el valor de la varianza como se puede ver en la tabla, también generé el histograma de los datos, pero ahora utilizando frecuencias relativas, de donde pude ver que ambos
0
10
20
30
40
50
60
70
80
1 2 3 4 5 6 7
Frecuenciaobservada (FO)
Frecuenciaobservada FO/42
Frecuencia esperadaFei
histogramas son muy cercanos, concuerdo con los compañeros que existe una relación con la distribución exponencial pero en este caso la variable que se uso es el número de eventos en un cierto intervalo de tiempo, siendo la v.a. exponencial utilizada para medir el tiempo de ocurrencia entre eventos. El comando que utilicé en GeoGebra fue Poisson[4.52,false] teniendo en cuenta que el valor segundo es un valor booleano que determina si se muestra la probabilidad acumulada o no.
7)
Modelo propuesto: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏
En este problema se tienen 47 datos históricos, cada uno de los cuales corresponde al número de computadoras portátiles vendidas en un día determinado, si n es el número de
datos conocidos, iniciaremos calculando n clases:
√47 = 6.85 = 7 De aquí que debamos considerar 7 intervalos, pues 7es el menor entero mayor o igual que
6.85
Intervalo Frecuencia observada (𝑭𝑶) = 𝑶
FO/47
Frecuencia esperada
FE
0-2 2 0.0426 0.07142857
2-4 6 0.1277 0.07142857
4-6 12 0.2553 0.07142857
6-8 18 0.3830 0.07142857
8-10 5 0.1064 0.07142857
10-12 2 0.0426 0.07142857
Días
De
ma
nd
a d
e T
axi
s
4746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Demanda de Taxis por día
12-14 2 0.0426 0.07142857
∑𝑻𝒐𝒕𝒂𝒍 47
𝒇(𝒙|𝟎, 𝟐𝟕) = 𝟏/𝟏𝟒 = 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓
𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂,𝒃 𝒂 < 𝒃, 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
𝑴𝒆𝒅𝒊𝒂: 𝝁 = 𝟔.𝟑𝟔𝟏𝟕
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂: 𝝈𝟐 = 𝟔. 𝟖𝟐
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒂 = 𝒎í𝒏 𝑿𝒊 = 𝟎
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒃 = 𝒎𝒂𝒙 𝑿𝒊 = 𝟏𝟒
Como vemos, este modelo se caracteriza por un sólo parámetro λ, que debe ser positivo; la esperanza y la varianza coinciden, tenemos también que el número de
éxitos que ocurren por producto vendido, es totalmente al azar y cada intervalo de
tiempo es independiente de otro intervalo dado, así como cada área es independiente
de otra área dada y cada producto es independiente de otro producto dado.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0.4
0.45
1 2 3 4 5 6 7
FO/47
FE
En el caso anterior observé que la forma del histograma que se generó tiene una forma muy clara de campana de Gauss, por lo cual dibujé una función de densidad normal con media 6.78723 que se obtuvo de los datos y con una desviación de
√6.78723 = 2.61694 con lo cual se obtienen las gráficas anteriores, aunque la función de densidad la multipliqué por el número de datos para observar el parecido entre dicha densidad y el histograma generado por los datos. Me parece que se aproxima de manera clara, por lo cual puede pensarse que es una hipótesis aceptable el pensar que los datos se distribuyen de manera normal.
Por otro lado se aproximó el histograma de frecuencias relativas con la función de densidad de probabilidades de una distribución Poisson con media 6.78723.
8)
Modelo propuesto: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏
En este problema se tienen 48 datos históricos, cada uno de los cuales corresponde al número de computadoras portátiles vendidas en un día determinado, si n es el número de datos
conocidos, iniciaremos calculando n clases:
√48 = 6.92 = 7 De aquí que debamos considerar 7 intervalos, pues 7 es el menor entero mayor o igual
que 6.92
Intervalo
Frecuencia observada (𝑭𝑶) = 𝑶
FO/48
Frecuencia esperada
FE
0-2 2 0.0417 0.0714285
2-4 5 0.1042 0.0714285
4-6 12 0.2500 0.0714285
6-8 16 0.3333 0.0714285
8-10 8 0.1667 0.0714285
10-12 3 0.0625 0.0714285
12-14 2 0.0417 0.0714285
∑𝑻𝒐𝒕𝒂𝒍 48
𝒇(𝒙|𝟎, 𝟐𝟕) = 𝟏/𝟏𝟒 = 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓
𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂,𝒃 𝒂 < 𝒃, 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
Hora
De
ma
nd
a d
e C
afé
Am
eri
ca
no
484746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Demanda de Café Americano por hora
𝑴𝒆𝒅𝒊𝒂: 𝝁 = 𝟔.𝟔
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂: 𝝈𝟐 = 𝟕. 𝟐
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒂 = 𝒎í𝒏 𝑿𝒊 = 𝟎
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒃 = 𝒎𝒂𝒙 𝑿𝒊 = 𝟏𝟒
Señalo lo mismo para este problema, el número de éxitos que ocurren por
producto es totalmente al azar y cada intervalo de tiempo es independiente de
otro intervalo dado, así como cada área es independiente de otra área dada y
cada producto es independiente de otro producto dado.
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
1 2 3 4 5 6 7
FO/48
FE
La gráfica anterior muestra la aproximación del histograma por una función de densidad normal con media 7.1666 y varianza 6.97222, a continuación se muestra la aproximación del histograma de frecuencias relativas por la función de densidad de probabilidad de una v.a Poisson con media 7.1666:
9)
En este problema se tienen 45 datos históricos, cada uno de los cuales corresponde al número de computadoras portátiles vendidas en un día determinado, si n es el
número de datos conocidos, iniciaremos calculando n clases:
√45 = 6.7 = 7 De aquí que debamos considerar 7 intervalos, pues 7 es el menor entero mayor o igual que 6.7
Modelo propuesto:𝑵𝒐𝒓𝒎𝒂𝒍(𝟕,𝟏𝟔. 𝟑𝟑)
Realizamos la tabla de datos correspondientes
Intervalo
Frecuencia observada (𝑭𝑶) = 𝑶
FO/45
Frecuencia esperada
FE
0-2 7 0.1556 0.0714285
2-4 6 0.1333 0.0714285
4-6 7 0.1556 0.0714285
6-8 7 0.1556 0.0714285
8-10 6 0.1333 0.0714285
10-12 5 0.1111 0.0714285
12-14 7 0.1556 0.0714285
∑𝑻𝒐𝒕𝒂𝒍 45
𝐒𝐮𝐩𝐨𝐧𝐞𝐦𝐨𝐬 𝐪𝐮𝐞 𝐬𝐞 𝐝𝐢𝐬𝐭𝐫𝐢𝐛𝐮𝐲𝐞 𝐝𝐞 𝐦𝐚𝐧𝐞𝐫𝐚 𝐮𝐧𝐢𝐟𝐨𝐫𝐦𝐞.
𝐋𝐚 𝐅𝐄 𝐞𝐬𝐩𝐞𝐫𝐚𝐝𝐚 ∶ 𝒇(𝒙) = 𝟏/(𝒂 − 𝒃) = 𝟏/𝟏𝟒
𝒇(𝒙|𝟎, 𝟏𝟒) = 𝟏/𝒂− 𝒃
𝒇(𝒙) =𝟏
𝟏𝟒= 𝟎. 𝟎𝟕𝟏𝟒𝟐𝟖𝟓𝟕
𝑷𝒂𝒓á𝒎𝒆𝒕𝒓𝒐𝒔 𝒂,𝒃 𝒂 < 𝒃 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
Día
De
ma
nd
a d
e b
icic
leta
s
454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Demanda de bicicletas por día
𝑴𝒆𝒅𝒊𝒂: 𝒂 + 𝒃
𝟐
𝝁 = 𝟕
𝑹𝒂𝒏𝒈𝒐: [𝒂, 𝒃] R: [0,14]
𝑽𝒂𝒓𝒊𝒂𝒏𝒛𝒂: (𝒃 − 𝒂)𝟐/𝟏𝟐 𝝈 =
(𝟏𝟒 − 𝟎)𝟐
𝟏𝟐= 𝟏𝟔. 𝟑𝟑
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒂 = 𝒎í𝒏 𝑿𝒊 Est(a)=0
𝑬𝒔𝒕𝒊𝒎𝒂𝒅𝒐𝒓 𝒃 = 𝒎𝒂𝒙 𝑿𝒊 Est(b)=14
En este problema, podemos observar que todos los intervalos parecen tener una longitud similar y en la distribución en su rango son igualmente probables; además, el dominio está definido por dos parámetros, a y b, que son sus valores mínimo y máximo, las frecuencias obtenidas en una unidad de tiempo, presentan similitud y se distribuyen de manera muy uniforme.
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0.18
1 2 3 4 5 6 7
FO/45
FE
En el caso anterior puedo ver que la distribución de los datos parece ser una distribución uniforme, debido a la forma del histograma de datos asociados, la curva en rojo es el valor esperado de cada uno de los intervalos definidos en el histograma de los datos originales. Me parece que en este caso sería muy difícil que se ajustara cualquier otra distribución.
Actividad 2. Pruebas de bondad de ajuste
Aplica la prueba de bondad de ajuste 2 , para verificar que los datos proporcionados
en cada caso encajan en el modelo que se propone. 1)
Datos:
Intervalo Frecuencia observada
(FO)
0 – 2 2
2 – 4 5
4 – 6 8
6 – 8 14
8 – 10 11
10 – 12 6
12 – 14 2
Modelo propuesto: 7.69, 8.05Normal
La media y la desviación estándar de la distribución normal no se estimaron, sino que están propuestas, entonces aplicamos un estadístico de prueba de bondad Chi cuadrada y K-S, para comparar los valores o frecuencias observadas, con las frecuencias que habría en cada grupo o clase, es decir, el valor esperado, y si se cumple lo propuesto. Lo primero que haré, será utilizar la fórmula definida para el modelo Normal.
𝒛 =𝒙 − 𝝁
𝝈=𝒙 − 𝟕. 𝟔𝟗
𝟐. 𝟖𝟒
donde: 𝝁 = 𝟕. 𝟔𝟗, 𝝈𝟐 = 𝟖. 𝟎𝟓 , 𝝈 = 𝟐. 𝟖𝟑𝟕𝟐 𝒚 𝒙 = 𝐥í𝐦 𝐬𝐮𝐩 𝐝𝐞 𝐜𝐚𝐝𝐚 𝐢𝐧𝐭𝐞𝐫𝐯𝐚𝐥𝐨.
Tabla de Probabilidades.
𝒙
𝒛 =𝒙 − 𝟕. 𝟔𝟗
𝟐. 𝟖𝟒
𝑭(𝒙) = 𝑷(𝒂 ≤ 𝒃)
2 -2.00352 𝑃(𝑋 ≤ 2) = 0.002256
4 -1.29929 𝑃(2 ≤ 4) = 0.07436
6 -0.59507 𝑃(4 ≤ 6) = 0.17898
8 0.109154 𝑃(6 ≤ 8) = 0.26756
10 0.81338 𝑃(8 ≤ 10) = 0.24854
12 1.51760 𝑃(10 ≤ 12) = 0.14344 14 2.22830 𝑃(12 ≤ ∞) = 0.06456
Tenemos la definición de la función de densidad y su integral F(x).
𝒇(𝒙) =𝟏
𝝈√𝟐𝝅𝒆−
𝟏
𝟐(𝒙−𝑬(𝒙)
𝝈)𝟐
𝑭(𝒙) =𝟏
𝟐. 𝟖𝟑𝟕𝟐 √𝟐𝝅∫ 𝒆−
𝟏
𝟐(𝒙−𝟕.𝟗𝟔
𝟐.𝟖𝟑𝟕𝟐)𝟐𝒃
𝒂
Donde , 𝑎 y 𝑏 es el límite inferior y superior del intervalo respectivamente, para F(x)
nos apoyamos en wolframalpha.
a) En la siguiente tabla se muestran las frecuencias esperadas para cada uno de los intervalos (FEi), integrando la función de densidad propuesta y multiplicándola por el número total de datos, así como el estimador C con los valores obtenidos y m=7.
Tabla de frecuencias.
Intervalo Mc Frecuencia
observada 𝑭𝑶𝒊
Frecuencia esperada 𝑭𝑬𝒊 =𝒏𝑭(𝒙)
𝑭𝑬𝒊− 𝑭𝑶𝒊
(𝑭𝑬𝒊− 𝑭𝑶𝒊)
𝟐
(𝑭𝑬𝒊 − 𝑭𝑶𝒊)𝟐
𝑭𝑬𝒊
0-2 1 2 1.0828 -0.91 0.8411 0.7767
2-4 3 5 3.5692 -1.43 2.0469 0.5734
4-6 5 8 8.5910 0.59 0.3493 0.0406
6-8 7 14 12.8428 -1.15 1.3389 0.1042
8-10 8 11 11.9299 0.92 0.8647 0.0724
10-12 11 6 6.8851 0.88 0.7834 0.1137
12-14 13 2 3.0988 1.09 1.2075 0.3896
∑𝑻𝒐𝒕𝒂𝒍 𝒏 = 48 48 𝝌𝟐 = 2.0706
b) Ahora determinamos el estimador C con los valores obtenidos y m =
7.
𝑪 =∑(𝑭𝑬𝒊 − 𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊
𝟕
𝒊=𝟏
= 𝟎.𝟕𝟕𝟔𝟕+ 𝟎.𝟓𝟕𝟑𝟒 + 𝟎. 𝟎𝟒𝟎𝟔 + 𝟎. 𝟏𝟎𝟒𝟐+ 𝟎.𝟎𝟕𝟐𝟒 + 𝟎.𝟏𝟏𝟑𝟕+ 𝟎. 𝟑𝟖𝟗𝟔 = 𝟐. 𝟎𝟕𝟎𝟔
c) Realizamos la comparación con un valor de la tabla de probabilidades de
Chi-cuadrada, y ver si el estimador es menor o igual a éste; usaremos la tabla de grados de libertad , con un nivel de significancia de 𝜶 = 𝟎. 𝟎𝟓,
para obtener el valor crítico de 𝝌𝟐𝟓%,𝒅𝒇
Tenemos que 𝒅𝒇 = 𝟕 − 𝟏 = 𝟔
𝑪 = 𝟓. 𝟒𝟓, 𝑿(𝟔,𝟎.𝟎𝟓)
𝟐 = 𝟏𝟐. 𝟓𝟗𝟐
𝟐. 𝟐𝟕𝟖𝟑𝟓𝟗𝟗 ≤ 𝟏𝟐. 𝟓𝟗𝟐
𝑪 ≤ 𝑿𝟐
Consultamos la tabla:
Gráfica de la distribución de Chi cuadrada.
Se considera que es un buen ajuste con la distribución propuesta, por tanto no
podemos refutar que la propuesta es correcta y que se trata del modelo adecuado.
Gráfica y Estadísticas realizadas con Geogebra:
2)
Datos:
Intervalo Frecuencia observada
0 - 2 20 2 - 4 11
4 - 6 7 6 - 8 5
8 - 10 3 10 - 12 2
12 - 14 1
Modelo propuesto: 7.22Exponencial
Se propone el modelo exponencial, entonces procederemos de la siguiente forma, si tenemos que 𝜇 = 7.22, encontramos el valor de Lamba:
𝝁 =𝟏
𝝀→ 𝝀 = 𝟎. 𝟏𝟑𝟖𝟓
a) Realizamos los cálculos de las frecuencia esperadas 𝑭𝑬𝒊 :
𝑭𝑬𝒊 = 𝒏𝑭(𝒙) = 𝒏 ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙
𝑳𝒔
𝑳𝒊
Tabla de datos.
b) Utilizamos la fórmula de Chi cuadrada, tenemos:
𝝌𝟐 =∑(𝑭𝑬𝒊 − 𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊= 𝟕.𝟐𝟖𝟓𝟐
c) Comparamos con un valor de la tabla de probabilidades de Chi-cuadrada, si el estimador es menor o igual a éste, empleamos la tabla de grados de libertad y un nivel de significancia propuesto de 𝜶 = 𝟎. 𝟎𝟓;encontramos el valor crítico:
𝒅𝒇 = 𝟕 − 𝟏 = 𝟔
𝑪 = 𝟓. 𝟒𝟓, 𝑿(𝟔,𝟎.𝟎𝟓)𝟐 = 𝟏𝟐. 𝟓𝟗𝟐
𝟕. 𝟐𝟖𝟓𝟐 ≤ 𝟏𝟐. 𝟓𝟗𝟐
𝑪 ≤ 𝑿𝟐
Intervalo Mc Frecuencia observada (𝑭𝑶) = 𝑶
𝑭(𝒙) = ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙
𝑳𝒔
𝑳𝒊
𝑭𝑬𝒊 = 𝒏𝑭(𝒙)
Frecuencia esperada
(𝑭𝑬𝒊− 𝑭𝑶𝒊)𝟐 (𝑭𝑬𝒊 −𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊
0-2 1 20 0.2419 11.85 66.3719 5.5995
2-4 3 11 0.1834 8.98 4.0537 0.4510
4-6 5 7 0.139 6.81 0.0357 0.0052
6-8 7 7 0.1054 5.16 0.0270 0.0052
8-10 9 5 0.0799 3.91 0.8374 0.2138
10-12 11 3 0.0609 2.96 0.9397 0.3164
12-14 13 1 0.0459 2.24 1.5602 0.6937
∑𝑻𝒐𝒕𝒂𝒍 48 𝝌𝟐 = 7.2852
Consultamos la tabla y construimos la gráfica de distribución de chi cuadrada:
Ahora, graficamos con Geogebra, que nos muestra el Histograma y algunos
parámetros estadísticos.
Se considera que es un buen ajuste con la distribución propuesta, por tanto no podemos refutar que la propuesta es correcta y que se trata del modelo
adecuado. 3)
Datos:
Modelo propuesto: 4.48Exponencial
Se propone el modelo exponencial, entonces tenemos que 𝜇 = 4.48 , entonces encontramos el valor de 𝜆 :
𝝁 =𝟏
𝝀→ 𝝀 = 𝟎. 𝟐𝟐𝟑𝟐
a) Calculamos la frecuencia esperada 𝑭𝑬𝒊 por medio de:
𝑭𝑬𝒊 = 𝒏𝑭(𝒙) = 𝒏 ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙
𝑳𝒔
𝑳𝒊
Tabla de datos.
Día
De
ma
nd
a d
e p
añ
ale
s
46454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Demanda de pañales por día
Intervalo Mc (𝑭𝑶) = 𝑶
𝑭(𝒙) = ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙
𝑳𝒔
𝑳𝒊
𝑭𝑬𝒊 = 𝒏𝑭(𝒙) (𝑭𝑬𝒊 − 𝑭𝑶𝒊)𝟐 (𝑭𝑬𝒊 − 𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊
0-2 1 18 0.3601 16.56 2.0603 0.1243
2-4 3 9 0.2304 10.59 2.5548 0.2410
4-6 5 7 0.1474 6.78 0.0482 0.0071
6-8 7 5 0.0944 4.34 0.4324 0.0995
8-10 9 4 0.0604 2.77 1.4923 0.5371
10-12 11 2 0.0386 1.77 0.0503 0.0283
12-14 13 1 0.0248 1.14 0.0198 0.0173
∑𝑻𝒐𝒕𝒂𝒍 46 𝝌𝟐 = 1.0549
b) Sustituyendo en la fórmula de chi cuadrada:
𝝌𝟐 =∑(𝑭𝑬𝒊 − 𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊= 𝟏.𝟎𝟓𝟒𝟗
c) Comparar con un valor de la tabla de probabilidades de Chi-cuadrada,
para ver si el estimador es menor o igual a éste; usamos la tabla de grados de libertad y un nivel de significancia de 𝜶 = 𝟎. 𝟎𝟓 y obtenemos el valor crítico :
𝒅𝒇 = 𝟕 − 𝟏 = 𝟔
𝑪 = 𝟓. 𝟒𝟓, 𝑿(𝟔,𝟎.𝟎𝟓)𝟐 = 𝟏𝟐. 𝟓𝟗𝟐
𝟏. 𝟎𝟓𝟒𝟗 ≤ 𝟏𝟐. 𝟓𝟗𝟐
𝑪 ≤ 𝑿𝟐 Nos vamos a nuestra tabla y hacemos la gráfica de la distribución de Chi cuadrada:
Como el valor de 𝝌𝟐 < 𝝌(𝟔,𝟎.𝟎𝟓)𝟐 se considera que es un buen ajuste con
la distribución propuesta, por tanto no podemos refutar que la propuesta es correcta y que se trata del modelo adecuado.
Gráfica de Estadísticas con Geogebra:
4)
Datos:
Modelo propuesto: 0, 14Uniforme
Definimos la función de densidad por medio de:
𝒇(𝒙|𝟎, 𝟏𝟒) =𝟏
𝟏𝟒, 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
a) Calculamos la frecuencia esperada para cada uno de los intervalos
integrando la función de densidad propuesta y multiplicando por el número total de datos:
Tabla de Datos.
Día
Bic
icle
tas v
en
did
as
484746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Bicicletas vendidas por día
Intervalo
Mc 𝑭𝑶𝒊
𝑭(𝒙) = ∫ =𝟏
𝟏𝟒⌋𝟎
𝒙𝒙
𝟎
𝑭𝑬𝒊 = 𝒏𝑭(𝒙)
𝑭𝑬𝒊 − 𝑭𝑶𝒊
(𝑭𝑬𝒊 − 𝑭𝑶𝒊)𝟐
(𝑭𝑬𝒊 −𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊
0 – 2 1 7 0.149 7.152 0.152 0.0231 0.003
2 – 4 3 6 0.149 7.152 1.152 1.3271 0.185
4 – 6 5 7 0.149 7.152 0.152 0.0231 0.003
6 – 8 7 6 0.149 7.152 1.152 1.3271 0.185
8 – 10 9 7 0.149 7.152 0.152 0.0231 0.003
10– 12 11 7 0.149 7.152 0.152 0.0231 0.003
12– 14 13 8 0.149 7.152 -0.848 0.7191 0.100
∑𝑻𝒐𝒕𝒂𝒍 =𝒏
48 𝝌𝟐 = 0.4845
b) Sustituimos en la fórmula de chi cuadrada.
𝝌𝟐 =∑(𝑭𝑬𝒊 − 𝑭𝑶𝒊)
𝟐
𝑭𝑬𝒊= 𝟎.𝟒𝟖𝟒𝟓
c) Comparamos con un valor de la tabla de probabilidades de Chi-cuadrada
y si el estimador resulta menor o igual a éste, entonces no podemos refutar que nuestra propuesta de modelo es correcta; obtenemos los grados de libertad con un nivel de significancia de 𝜶 = 𝟎. 𝟎𝟓; vemos que el valor crítico es de:
𝒅𝒇 = 𝟕 − 𝟏 = 𝟔
𝑪 = 𝟓. 𝟒𝟓, 𝑿(𝟔,𝟎.𝟎𝟓)𝟐 = 𝟏𝟐. 𝟓𝟗𝟐
𝟏. 𝟎𝟓𝟒𝟗 ≤ 𝟏𝟐. 𝟓𝟗𝟐
𝑪 ≤ 𝑿𝟐
Vamos a la tabla de distribución 𝝌𝟐, y vemos que 𝝌𝟐 < 𝝌𝟐(𝟔,𝟎.𝟎𝟓),
lo cual indica que es un buen ajuste con la distribución propuesta.
La gráfica que obtenemos para la distribución chi cuadrada es:
Por tanto, concluimos que se trata de un buen ajuste con la distribución propuesta, por lo cual, a razón de lo mencionado, de que la hipótesis no se puede rechazar.
Gráfica con Geogebra, que muestra el Histograma y parámetros estadísticos.
Aplica la prueba de bondad de ajuste de Kolmogorov - Smirnov, para verificar que los datos proporcionados en cada caso encajan en el modelo que se propone. 5)
Datos:
Intervalo Frecuencia observada
(FO)
0 – 2 2 2 – 4 5
4 – 6 9 6 – 8 13
8 – 10 10 10 – 12 7
12 – 14 2
Modelo propuesto: 7.6, 8.78Normal
Emplearemos la fórmula definida del modelo Normal
𝒛 =𝒙 − 𝝁
𝝈=𝒙 − 𝟕. 𝟔
𝟐. 𝟗𝟔
Siendo 𝝁 = 𝟕. 𝟔 y 𝝈𝟐 = 𝟖. 𝟕𝟖 → 𝝈 = 𝟐. 𝟗𝟔
a) Tabla de probabilidades.
𝒙 𝒛 =
𝒙 − 𝟕.𝟔
𝟐.𝟗𝟔
𝑭(𝒙) = 𝑷(𝒂 ≤ 𝒃)
2 -1.8919 𝑃(−∞ ≤ 2) = 0.0292 4 -1.2162 𝑃(2 ≤ 4) = 0.0827 6 -0.5405 𝑃(4 ≤ 6) = 0.1824 8 0.1351 𝑃(6 ≤ 8) = 0.2593 10 0.8108 𝑃(8 ≤ 10) = 0.2375 12 1.4865 𝑃(10 ≤ 12) = 0.1401 14 2.1622 𝑃(12 ≤ ∞) = 0.0685
b) Realizamos la tabla siguiente para obtener el estimador 𝑴𝑫:
Intervalo Mc 𝑭𝑶𝒊 𝑷𝑶𝒊 =
𝑭𝑶𝒊𝒏
𝑷𝑶𝑨𝒊 𝑷𝑬𝑨𝒊 = 𝑷(𝒂 ≤ 𝒃) 𝑴𝑫
= |𝑷𝑬𝑨𝒊 − ´𝑷𝑶𝑨𝒊|
0-2 1 2 0.0416 0.0416 0.0292 0.0124
2-4 3 5 0.1041 0.1458 0.1119 0.0338
4-6 5 8 0.1875 0.3333 0.2944 0.0389
6-8 7 14 0.2708 0.6041 0.5537 0.0504
8-10 9 11 0.2083 0.8125 0.7912 0.0212
10-12 11 6 0.1458 0.9583 0.9314 0.0269
12-14 13 2 0.0416 1 1 0
∑𝑻𝒐𝒕𝒂𝒍
= 𝒏 =
48 𝑴𝑫 = 0.0504
Por lo tanto, hemos obtenido el valor del coeficiente estadístico de prueba :
𝑴𝑫 = 𝟎.𝟎𝟓𝟎𝟒 c) Comparamos el valor de 𝑴𝑫 con el valor que corresponde con el número
de 𝒏 = 𝟒𝟗 datos en la tabla de la prueba de bondad de ajuste de Kolmogrov-Smirnov , el cual es 𝟎. 𝟏𝟗𝟐𝟐; entonces, nos vamos a la tabla para corroborar que se trata del valor propuesto por la tabla de Kolmogrov-Smirnov.
Con un nivel de significancia de 𝜶 = 𝟎. 𝟎𝟓, el valor es
𝑴𝑫 = 𝟎.𝟎𝟓𝟎𝟒 < 𝟎. 𝟏𝟗𝟎𝟐𝟖
Por lo tanto, la hipótesis no se rechaza
La Gráfica con Geogebra nos indica una distribución Normal.
6)
Datos.
Intervalo Frecuencia observada
(FO)
0 – 2 7 2 – 4 8
4 – 6 7 6 – 8 6
8 – 10 6 10 – 12 7
12 – 14 8
Modelo propuesto: 0, 14Uniforme
Definimos la función de densidad por medio de:
𝒇(𝒙|𝟎, 𝟏𝟒) =𝟏
𝟏𝟒, 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
a) Vamos a realizar el cálculo de las frecuencias observadas y las frecuencias esperadas para cada uno de los intervalos; obtenemos su diferencia en valor absoluto para determinar la diferencia máxima.
Tabla para encontrar el estimador MD.
Intervalo 𝑭𝑶𝒊 𝑷𝑶𝒊 =𝑭𝑶𝒊𝒏
𝑷𝑶𝑨𝒊 𝑷𝑬𝑨𝒊 = 𝑭(𝑷(𝒂 ≤ 𝒃))
=𝟏
𝟏𝟒(𝑷(𝒂 ≤ 𝒃))
|𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊|
0 – 2 7 0.1428 0.1428 0.14286 0.0000
2 – 4 8 0.1632 0.3061 0.28571 0.0204
4 – 6 7 0.1428 0.4489 0.42857 0.0204
6 – 8 6 0.1224 0.5714 0.57143 0.0000
8 – 10 6 0.1224 0.6938 0.71429 0.0204
10– 12 7 0.1428 0.8367 0.85714 0.0204
12– 14 8 0.1632 1.0000 1.00000 0.0000
∑𝑻𝒐𝒕𝒂𝒍
= 𝒏
49 𝑴𝑫 = 0.0204
b) Comparamos el estimador 𝑴𝑫 = 𝟎. 𝟎𝟐𝟎𝟒 con el valor correspondiente
de la tabla de Kolmogorov-Smirnov para un nivel de confianza de 𝟎. 𝟎𝟓 % y la ∑𝑭𝑶 = 𝒏 = 𝟒𝟗, el cual es 𝟎. 𝟏𝟗𝟎𝟐𝟖, entonces:
𝑴𝑫 = 𝟎. 𝟎𝟐𝟎𝟒𝟏 < 𝟎. 𝟏𝟗𝟎𝟐𝟖, Vemos que la distribución uniforme propuesta es adecuada. Nos vamos a la tabla de Kolmogorov-Smirnov, por tanto, la hipótesis no se rechaza.
Vemos que la gráfica en Geogebra, nos dá una distribución uniforme.
7)
Datos:
Día
De
ma
nd
a d
e v
ivie
nd
as
49484746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Demanda de viviendas por día
Modelo propuesto: 4.35, 10.88Normal
Vemos al graficar, que la propuesta no es la correcta, dado que se trata de una distribución exponencial.
Intervalos Mc FO F(x) FE ((FO*FE)^2)/FE
0-2 1 7 0.171 8.38 0.23
2-4 3 8 0.240 11.76 1.20
4-6 5 7 0.260 12.74 2.59
6-8 7 6 0.149 7.31 0.23
8-10 9 6 0.068 3.31 2.18
10-12 11 7 0.080 3.92 2.42
12-14 13 8 0.030 1.47 29.01
SUMAS 49 1 48.89 37.86
C= 37.86
En esta tabla de prueba de bondad y ajuste Chi cuadrada, tenemos que: 𝑪 = 𝟑𝟕. 𝟖𝟔, 𝑿(𝟔,𝟎.𝟎𝟓)
𝟐 = 𝟏𝟐. 𝟓𝟗𝟐 → 𝑪 ≤ 𝑿𝟐 , entonces, la propuesta no es correcta.
K Intervalos Mc FO PO POA PE PEA |PEA-POA|
1 0 2 1 2 0.04 0.04 0.171 0.171 0.1301836
2 2 4 3 5 0.1 0.14 0.240 0.411 0.2681428
3 4 6 5 9 0.18 0.33 0.260 0.671 0.3444693
4 6 8 7 13 0.27 0.59 0.149 0.8201 0.2282632
5 8 10 9 10 0.2 0.80 0.068 0.8877 0.0917816
6 10 12 11 7 0.14 0.94 0.080 0.9677 0.0289244
7 12 14 13 2 0.04 0.98 0.030 0.9977 0.0181081
0.98 0.9977
MD= 0.344
En esta tabla de la prueba de Kolmogorov- Smirnov, no podemos refutar que la propuesta es correcta, vemos que MD≤K-S por lo tanto la propuesta es correcta.
𝑴𝑫 = 𝟎.𝟑𝟒𝟒 ≤ 𝟎. 𝟏𝟗𝟎𝟐𝟖 8)
Datos:
Modelo propuesto: 0, 14Uniforme
Para concluir este bloque de ejercicios, haré el siguiente de forma desglosada:
Hora
Ta
za
s d
e t
é v
en
did
as
4746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Tazas de té vendidas por hora
a) Considerar la frecuencia observada (FOi) para cada uno de los intervalos generados para efectuar la propuesta del comportamiento de los datos.
Intervalo Frecuencia observada (FO)
0 – 2 7 2 – 4 6
4 – 6 7 6 – 8 6
8 – 10 6 10– 12 7
12– 14 8
b) Establecer la probabilidad observada (POi) en cada intervalo, dividiendo su frecuencia observada entre el número de datos observados.
Intervalo Frecuencia observada (FO)
PO
0 – 2 7 0,1489
2 – 4 6 0,1277
4 – 6 7 0,1489
6 – 8 6 0,1277
8 – 10 6 0,1277
10– 12 7 0,1489
12– 14 8 0,1702
47
c) Calculamos la probabilidad observada acumulada (POAi)
Intervalo Frecuencia
observada (FO)
PO POA
0 – 2 7 0,1489 0,1489
2 – 4 6 0,1277 0,2766
4 – 6 7 0,1489 0,4255
6 – 8 6 0,1277 0,5532
8 – 10 6 0,1277 0,6809
10– 12 7 0,1489 0,8298
12– 14 8 0,1702 1,0000
47
d) Integrar la distribución de densidad de probabilidades propuesta, para obtener la probabilidad esperada (PEi) para cada intervalo de clase, siendo 𝒂 y 𝒃 , el limite inferior y superior del intervalo respectivamente.
𝒇(𝒙) =𝟏
𝟏𝟒 𝟎 ≤ 𝒙 ≤ 𝟏𝟒
𝑭(𝒙) = ∫𝟏
𝟏𝟒𝒅
𝒆𝒔
𝟎
𝒙 =𝒆𝒔
𝟏𝟒
Donde “es” es el extremo superior de cada intervalo de clase.
e) Se calcula la probabilidad esperada acumulada (PEAi) para los intervalos de clase.
Intervalo Frecuencia observada (FO)
PO POA PEA
0 – 2 19 0,3878 0,3878 0,0690
2 – 4 10 0,2041 0,5918 0,1420
4 – 6 8 0,1633 0,7551 0,2156
6 – 8 5 0,1020 0,8571 0,2867
8 – 10 4 0,0816 0,9388 0,3535
10– 12 2 0,0408 0,9796 0,4143
12– 14 1 0,0204 1,0000 0,4678
f) Determinar el valor absoluto de la diferencia PEAi - POAi en todos los
intervalos de clase y se considera la máxima diferencia MD, la cual será nuestro estimador.
Intervalo Frecuencia
observada (FO)
PO POA PEA abs(PEA-POA)
0 – 2 7 0,1489 0,1489 0,1429 0,0061
2 – 4 6 0,1277 0,2766 0,2857 0,0091
4 – 6 7 0,1489 0,4255 0,4286 0,0030
6 – 8 6 0,1277 0,5532 0,5714 0,0182
8 – 10 6 0,1277 0,6809 0,7143 0,0334
10– 12 7 0,1489 0,8298 0,8571 0,0274
12– 14 8 0,1702 1,0000 1,0000 0,0000
47 Max= 0,033434
Donde 𝑴𝑫 = 𝟎. 𝟎𝟑𝟑𝟒𝟑
g) Comparamos al estimador MD con el valor correspondiente a los n
datos observados a un nivel de significación de 1, de tal forma que si MD es menor o igual que el valor límite de la tabla, entonces no se puede rechazar la hipótesis del modelo que se propuso.
Y al comparar el valor 𝑴𝑫 =0.033434 con el valor en tabla del test de Kolmogorov – Smirnov, para 𝐮𝐧 𝐧𝐢𝐯𝐞𝐥 𝐝𝐞 𝐜𝐨𝐧𝐟𝐢𝐚𝐧𝐳𝐚 𝐝𝐞𝐥 𝟎. 𝟎𝟓% y n=47, el cual es 0.19420, tenemos:
𝟎. 𝟎𝟑𝟑𝟒𝟑𝟒 ≤ 𝟎. 𝟏𝟗𝟎𝟐𝟖
Por lo tanto, el modelo propuesto para estos datos es correcto.
Gráfica con geogebra:
Modelación de comportamiento de
procesos aleatorios.
Introducción.
El reciente desarrollo y evolución en las metodologías de simulación y la
gran disponibilidad de software a que tenemos acceso, hoy en día, han
originado que estas técnicas se hayan convertido en tan poco tiempo en una
de las herramientas de mayor utilidad en el análisis y modelación de sistemas,
razones, que le proporcionan gran ventaja, ya que se puede estudiar y
observar de manera detallada, el efecto de cambios internos y externos del
sistema, lo cual, puede conducir a un mejor entendimiento y a sugerir nuevas
estrategias que mejoren la operación y eficiencia del sistema; por mencionar
algunas áreas de aplicación, estas técnicas, se utilizan con gran frecuencia
para hacer evaluaciones del diseño en servicios públicos como hospitales,
oficinas de correos, telégrafos, casas de cambio, análisis de grandes equipos
de cómputo, análisis dentro de una fábrica u oficina, adiestramiento de
operadores en centrales carbo-eléctricas, termo-eléctricas, nucleo-eléctricas,
aviones, acondicionamiento de aire, producción de bienes, análisis financiero,
sistemas tácticos o de defensa militar, análisis del impacto ambiental, etc.
Sobre una población existe pues, especial interés en conocer su
comportamiento aleatorio, mismo que generalmente se obtiene con base en
una muestra y existen varias técnicas para conocer la distribución de una
muestra, una de estas técnicas es la prueba de bondad de ajuste. La mayoría
de estas pruebas se basan en la convergencia de la función de distribución
empírica de la muestra, a la función de distribución subyacente a la muestra.
o Explicación breve de los dos tipos de ajustes (Prueba de
bondad de ajuste Chi cuadrado y de Kolmogorov-
Smirnov.
PRUEBAS DE BONDAD DE AJUSTE.
Entre las pruebas que mencionaré brevemente, están la prueba ji-cuadrada y
la prueba de Kolmogórov-Smirnov.
Prueba de bondad de ajuste Ji-cuadrada.
Es la prueba más conocida de las pruebas estadísticas y es adecuada
para comprobar, distribuciones de tipo discreto, o lo que es lo mismo,
cuando las observaciones que se realizan, caen en clases determinadas;
viene siendo una función de distancia, ya que lo que hace es medir la
distancia entre la función de densidad de la variable empírica y la teórica. La
prueba Ji cuadrada hace uso de la distribución del mismo nombre para
probar la bondad del ajuste al comparar el estadístico de prueba Xo2 con el
valor en tablas de la mencionada distribución Ji cuadrada con v grados de
libertad y un nivel de significancia alfa.
Sea X una variable aleatoria discreta con valores x1, x2,......., xn Se
propone la hipótesis nula H0, de que la distribución de donde proviene la
muestra se comporta según un modelo teórico específico tal como la
uniforme, la exponencial, la normal, etc. Entonces FOi, representa el número
de veces que ocurre el valor xi mientras que FEi, es la frecuencia esperada
proporcionada por el modelo teórico propuesto. A menudo ocurre que
muchas de las frecuencias FEi, (y también las FOi) son muy pequeñas,
entonces, como regla práctica adoptamos el criterio de agrupar los valores
consecutivos de estas frecuencias esperadas hasta que su suma sea de al
menos cinco. La medida estadística de prueba para la hipótesis nula es
Se puede aplicar esta prueba a variables continuas agrupando
adecuadamente los valores en un número adecuado de subintervalos o
clases k. La regala empírica para seleccionar el número de clases es:
.
Prueba de Kolmogorov-Smirnov para una muestra.
La prueba de Kolmogorov-Smirnov, para una muestra se considera un
procedimiento de “bondad de ajuste”, es decir, permite medir el grado de
concordancia existente entre la distribución de un conjunto de datos y una
distribución teórica específica. Su objetivo es señalar si los datos provienen
de una población que tiene la distribución teórica especificada.
Mediante la prueba se compara la distribución acumulada de las
frecuencias teóricas con la distribución acumulada de las frecuencias
observadas; se encuentra el punto de divergencia máxima, y se determina
qué probabilidad existe de que una diferencia de esa magnitud se deba al
azar. En las tareas de investigación se pudo obtener un conjunto de
observaciones, en las cuales se supone que tienen una distribución normal,
binomial, de Poisson, etc. Para el caso, las frecuencias de las distribuciones
teóricas deben contrastar con las frecuencias observadas, a fin de conocer
cuál distribución se adecua mejor al modelo. El test de Kolmogorov_Smirnov
(test KS) puede usarse cuando F(x) no tiene saltos y se basa en la diferencia
entre F(x) y Fn(x) que van a medir la máxima desviación que existe entre las
mismas.
o Tabla con diferencias y similitudes.
Pruebas de bondad.
Diferencias.
Similitudes.
Chi cuadrado de
Pearson
Es una prueba de bondad de ajuste, que
permite averiguar si la distribución
empírica de una variable categórica, se
ajusta o no (se parece o no) a una
determinada distribución teórica(uniforme,
binomial, multinomial, etc) comparación
entre la frecuencia observada en un
intervalo de clase y la frecuencia esperada
en dicho intervalo.
Las pruebas de bondad de
ajuste tienen por objetivo
determinar si los datos se
ajustan a una determinada
distribución,
Kolmogorov-Smirnov Es una prueba de bondad de ajuste, que
sirve para contrastar la hipótesis nula de
que la distribución de una variable se ajusta
a una distribución teórica de probabilidad
que puede ser con tendencia a la normal, a
la de Poisson o exponencial; se trata de
encontrar la diferencia mayor entre las
probabilidades observadas acumuladas y
las probabilidades esperadas acumuladas y
es de tipo no paramétrico.
Nos permite, probar la
hipótesis de que una función de
distribución particular, ajusta
un conjunto de datos
observados, sin especificar una
prueba de hipótesis alternativa.
o Otros posibles ajuste que existen aparte de los vistos en clase.
Existen muchas pruebas de bondad de ajuste, que, a partir de la primera
prueba propuesta por Karl Pearson, fueron surgiendo otras, como la prueba
K de Kolmogórov-Smirnov, la prueba Shapiro-Wilk, entre las más conocidas
y debido al uso de las computadoras personales y el método de simulación
Bootstrap, se llegó a evitar los supuestos, que anteriormente se hacían al
estudiar un fenómeno, y considerarlo generalmente con distribución normal,
en el estudio de los fenómenos aleatorios; tenemos también, además de la
prueba binomial y prueba de rachas, el mencionado de Shapiro-Wilk, el
criterio de Información Akaike (AIC), el Criterio de Crámer-von Mises, Prueba
de Anderson-Darling.
Test de Shapiro–Wilk.
En estadística, el Test de Shapiro–Wilk se usa para contrastar la
normalidad de un conjunto de datos. Se plantea como hipótesis nula que
una muestra x1, ..., xn proviene de una población normalmente distribuida.
Fue publicado en 1965 por Samuel Shapiro y Martin Wilk. Se considera uno
de los test más potentes para el contraste de normalidad, sobre todo para
muestras pequeñas (n<30). El estadístico del test es:
donde
x(i) (con el subíndice i entre paréntesis) es el número que ocupa la i-
ésima posición en la muestra;
= (x1 + ... + xn) / n es la media muestral;
las variables ai se calculan2
donde
siendo m1, ..., mn son los valores medios del estadístico ordenado, de
variables aleatorias independientes e identicamente distribuidas,
muestreadas de distribuciones normales. V es la matriz de covarianzas
de ese estadístico de orden.
La hipótesis nula se rechazará si W es demasiado pequeño.
Criterio de Información de Akaike.
El criterio de información de Akaike (AIC) es una medida de la calidad
relativa de un modelo estadístico, para un conjunto dado de datos. Como
tal, el AIC proporciona un medio para la selección del modelo. AIC maneja
un trade-off entre la bondad de ajuste del modelo y la complejidad del
modelo. Se basa en la entropía de información: se ofrece una estimación
relativa de la información perdida cuando se utiliza un modelo determinado
para representar el proceso que genera los datos.
AIC no proporciona una prueba de un modelo en el sentido de probar
una hipótesis nula , es decir AIC puede decir nada acerca de la calidad del
modelo en un sentido absoluto. Si todos los modelos candidatos encajan
mal, AIC no dará ningún aviso de ello.
Criterio de Cramér-von Mises.
En estadística el criterio de Cramér-von Mises se emplea para juzgar
la bondad de una función de distribución acumulada comparada con
una función de distribución empírica , o para comparar dos
distribuciones empíricas. También se utiliza como parte de otros algoritmos,
tal como la estimación de la distancia mínima. Se define como:
Aplicandolo a una única muestra, es la distribución teórica y es la
empírica. Alternativamente las dos distribuciones pueden ser estimadas
empíricamente; esto se conoce como un caso de dos muestras.
Prueba de Anderson-Darling.
En estadística, la prueba de Anderson-Darling es una prueba no
paramétrica sobre si los datos de una muestra provienen de una distribución
específica. La fórmula para el estadístico A determina si los
datos vienen de una distribución con función
acumulativa
donde,
El estadístico de la prueba se puede entonces comparar contra las
distribuciones del estadístico de prueba (dependiendo que se utiliza) para
determinar el P-valor.
Resuelve lo siguiente.
1) Ingresa al siguiente enlace:
https://docs.google.com/spreadsheets/d/1RpDv2221OW3s2lO8KEq4RHBvK4zYaGeuDR7dOKzeL2k/edit?usp=sharing
Métodos para generar variables aleatorias para la función triangular.
https://docs.google.com/presentation/d/1ffGLK2jp48RWAcGVdbdS8D0qaWh9OhKEZv7UY173MQE/edit?usp=sharing
Analiza los datos dados en cada caso, y determina su comportamiento
probando tu propuesta a través de la prueba de Bondad de Ajuste 2 .
2) El administrador de una pequeña clínica realiza un gráfico de línea de
tiempo para representar el número de personas enfermas de hepatitis
que son atendidas por día, quedando de la siguiente manera.
Dia
Enfe
rmo
de
he
pa
titi
s
40393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Enfermos de hepatitis atendidos por día
¿Cuál es el modelo probabilístico que representa a las personas con
hepatitis atendidas por día en el periodo considerado?
Tabla del comportamiento de frecuencias.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 MC 𝑭𝑶 0 – 2 1 6
2 – 4 3 5
4 – 6 5 6
6 – 8 7 6
8 – 10 9 6
10– 12 11 5
12– 14 13 6
40
Podemos ver que se trata de una distribución uniforme por lo que podemos
usar la prueba de bondad de ajuste definida como:
𝝌𝜶,𝒅𝒇𝟐
Modelo propuesto: 𝑼𝒏𝒊𝒇𝒐𝒓𝒎𝒆(𝟎, 𝟏𝟒)
Obtenemos la función de densidad que se propone como una distribución
uniforme (𝑳𝑺 − 𝑳𝒊 = 𝟐) para cada uno de los intervalos definidos en la
tabla, por lo cual realizamos la integral correspondiente.
𝑓(𝑥|0,14) =1
14, 0 ≤ 𝑥 ≤ 14
𝐹(𝑥) = ∫1
14𝑑𝑥 = ∫
1
14𝑑𝑥 = [
1
14𝑥]0
22
0
𝐿𝑠
𝐿𝑖
= 0.14
Paso 1. En primer término, calculamos la frecuencia esperada para cada uno
de los intervalos (FEi), integrando la función de densidad propuesta, para
después multiplicarla por el número total de datos.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 (𝑭𝑶𝒊) 𝑭(𝒙) 𝑭𝑬𝒊 = 𝒏[𝑭(𝒙)] 0 – 2 𝑭𝑶𝟏 = 𝟔
∫𝟏
𝟏𝟒𝒅𝒙 = 𝟎. 𝟏𝟒𝟐𝟖𝟔
𝟐
𝟎
𝑭𝑬𝒊 = 𝟒𝟎[𝟎.𝟏𝟒𝟐𝟖𝟔]
= 𝟓.𝟕𝟏𝟒𝟒
2 – 4 𝐅𝐎𝟐 = 𝟓 𝟎.𝟏𝟒𝟐𝟖𝟔 𝟓. 𝟕𝟏𝟒𝟒 4 – 6 𝐅𝐎𝟑 = 𝟔 𝟎.𝟏𝟒𝟐𝟖𝟔 𝟓. 𝟕𝟏𝟒𝟒 6 – 8 𝐅𝐎𝟒 = 𝟔 𝟎.𝟏𝟒𝟐𝟖𝟔 𝟓. 𝟕𝟏𝟒𝟒
8 – 10 𝐅𝐎𝟓 = 𝟔 𝟎.𝟏𝟒𝟐𝟖𝟔 𝟓. 𝟕𝟏𝟒𝟒 10 – 12 𝐅𝐎𝟔 = 𝟓 𝟎.𝟏𝟒𝟐𝟖𝟔 𝟓. 𝟕𝟏𝟒𝟒 12 – 14 𝐅𝐎𝟕 = 𝟔 𝟎.𝟏𝟒𝟐𝟖𝟔 𝟓. 𝟕𝟏𝟒𝟒
40
Paso 2. Procedemos al cálculo del estimador C con los valores obtenidos y
m = 7
𝐶 =∑(𝐹𝐸𝑖 − 𝐹𝑂𝑖)
2
𝐹𝐸𝑖
7
𝑖=1
=(5.7144− 5)2
5.7144+(5.7144 − 6)2
5.7144+(5.7144 − 6)2
5.7144+(5.7144 − 6)2
5.7144+(5.7144 − 6)2
5.7144
+(5.7144 − 5)2
5.7144+(5.7144− 6)2
5.7144= 𝟎. 𝟐𝟒𝟗𝟗𝟗𝟓
Paso 3. Calculemos el valor de 𝜒2𝛼,𝑑𝑓
= 𝜒25%,6
Esto lo haremos mediante la tabla con grados de libertad 𝑑𝑓 = 7 − 1 = 6 y
con un nivel de significancia de 𝛼 = 0.05, con lo cual obtenemos el valor
crítico.
Tabla de Ji-cuadrada.
Comparando el valor de 𝐶 con el de 𝜒25%,6, se puede ver que
𝑪 < 𝝌𝟐𝟓%,𝟔
Esto es,
𝟎. 𝟐𝟒𝟗𝟗𝟗𝟓 < 𝟏𝟐. 𝟓𝟗𝟐
Como el valor de 𝜒2(6, 0.05) es mayor que 𝜒2 se considera que es un buen
ajuste con un modelo probabilístico uniforme propuesto, por lo tanto, el
modelo propuesto no puede refutarse y por tanto, puede considerarse
correcta.
Histograma de Frecuencias.
Gráfica de la función.
El modelo propuesto no puede refutarse y como
consecuencia, puede considerarse adecuado.
3) El encargado de mantenimiento de un negocio de renta de
computadoras muestra a través del siguiente gráfico el
0
0.02
0.04
0.06
0.08
0.1
0.12
0.14
0.16
0 – 2 2 – 4 4 – 6 6 – 8 8 – 10 10 – 12
12 – 14
Frecuencia Observada y Esperada
FO
FE
0.2501
12.592
0.2499
12.592
número de computadoras que presentan algún fallo en un día
durante 40 días.
¿En qué modelo probabilístico encaja mejor el comportamiento que
presentan las fallas de los equipos por día en el período
considerado?
Tabla del comportamiento de frecuencias.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝑭𝑶 0 – 2 7
2 – 4 8
4 – 6 7
6 – 8 7
8 – 10 6
10– 12 7
12– 14 7
49
Podemos ver que se trata de una distribución uniforme por lo que podemos
usar la prueba de bondad de ajuste definida como: 𝝌𝜶,𝒅𝒇𝟐
Modelo propuesto: 𝑼𝒏𝒊𝒇𝒐𝒓𝒎𝒆(𝟎, 𝟏𝟒)
Día
Co
mp
uta
do
ras c
on
fa
llo
49484746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Computadoras con fallo por día
Obtenemos la función de densidad que se propone como una distribución
uniforme (𝑳𝑺 − 𝑳𝒊 = 𝟐) para cada uno de los intervalos definidos en la
tabla, por lo cual realizamos la integral correspondiente.
𝑓(𝑥|0,14) =1
14, 0 ≤ 𝑥 ≤ 14
𝐹(𝑥) = ∫1
14𝑑𝑥 = ∫
1
14𝑑𝑥 = [
1
14𝑥]0
22
0
𝐿𝑠
𝐿𝑖
= 0.14
Paso 1. En primer término, calculamos la frecuencia esperada para cada uno
de los intervalos (FEi), integrando la función de densidad propuesta , para
después multiplicarla por el número total de datos.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 (𝑭𝑶) 𝑭(𝒙) 𝑭𝑬 = 𝟒𝟗[𝑭(𝒙)] 0 – 2 𝐅𝐎𝟏 = 𝟕
∫𝟏
𝟏𝟒𝒅𝒙 = 𝟎.𝟏𝟒𝟐𝟖𝟔
𝟐
𝟎
𝑭𝑬𝟏 = 𝟒𝟗[𝟎.𝟏𝟒𝟐𝟖𝟔] = 𝟕.𝟎𝟎𝟎𝟏𝟒
2 – 4 𝐅𝐎𝟐 = 𝟖 𝟎. 𝟏𝟒𝟐𝟖𝟔 𝟕. 𝟎𝟎𝟎𝟏𝟒 4 – 6 𝐅𝐎𝟑 = 𝟕 𝟎. 𝟏𝟒𝟐𝟖𝟔 𝟕. 𝟎𝟎𝟎𝟏𝟒 6 – 8 𝐅𝐎𝟒 = 𝟕 𝟎. 𝟏𝟒𝟐𝟖𝟔 𝟕. 𝟎𝟎𝟎𝟏𝟒
8 – 10 𝐅𝐎𝟓 = 𝟔 𝟎. 𝟏𝟒𝟐𝟖𝟔 𝟕. 𝟎𝟎𝟎𝟏𝟒 10 – 12 𝐅𝐎𝟔 = 𝟕 𝟎. 𝟏𝟒𝟐𝟖𝟔 𝟕. 𝟎𝟎𝟎𝟏𝟒 12 – 14 𝐅𝐎𝟕 = 𝟕 𝟎. 𝟏𝟒𝟐𝟖𝟔 𝟕. 𝟎𝟎𝟎𝟏𝟒
40
Paso 2. Determinemos el estimador C con los valores obtenidos y m = 7
𝐶 =∑(𝐹𝐸𝑖 − 𝐹𝑂𝑖)
2
𝐹𝐸𝑖
7
𝑖=1
=(7.00014 − 7)2
7.00014+(7.00014 − 8)2
7.00014+(7.00014 − 7)2
7.00014+(7.00014 − 7)2
7.00014
+(7.00014 − 6)2
7.00014+(7.00014 − 7)2
7.00014+(7.00014 − 7)2
7.00014= 𝟎. 𝟐𝟖𝟓𝟕𝟎𝟖
Por lo tanto, éste es el valor de nuestro estadístico de prueba que ahora
debemos comparar con un valor de la tabla de probabilidades de Chi-
cuadrada.
Paso 3. Calculemos el valor de 𝜒2𝛼,𝑑𝑓 = 𝜒25%,6
Esto lo haremos mediante la tabla con grados de libertad 𝑑𝑓 = 7 − 1 = 6 y
con un nivel de significancia de 𝛼 = 0.05, con lo cual obtenemos el valor
crítico.
Tabla de Ji-cuadrada,
Comparando el valor de 𝐶 con el de 𝜒25%,6, se puede ver que:
𝑪 < 𝝌𝟐𝟓%,𝟔
Es decir,
𝟎. 𝟐𝟖𝟓𝟕𝟎𝟖 < 𝟏𝟐. 𝟓𝟗𝟐
Como el valor de 𝜒2(6, 0.05) es mayor que 𝜒2 se considera que es un buen
ajuste con un modelo probabilístico uniforme propuesto, por lo tanto, el
modelo propuesto no puede refutarse y por tanto, puede considerarse
correcta.
Histograma de Frecuencias.
012345678
0 – 2 2 – 4 4 – 6 6 – 8 8 – 10 10 – 12
12 – 14
Frecuencia Observada y Esperada
FO
FE
4) El siguiente gráfico muestra el número de ejercicios que
realizan un alumno de una pequeña universidad por día, con la
finalidad de repasar los contenidos de la materia de cálculo
diferencial e integral.
¿Qué modelo probabilístico representa al número de ejercicios
realizado por el alumno por día en el periodo considerado?
Tabla del comportamiento de frecuencias y marca de clases para cada
uno de los intervalos.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 Mc 𝑭𝑶𝒊 0 – 5 2.5 4
5 – 10 7.5 15
10 – 15 12.5 26
15 – 20 17.5 13
Día
Eje
rcic
ios r
ea
liza
do
s
61605958575655545352515049484746454443424140393837363534333231302928272625242322212019181716151413121110987654321
25
20
15
10
5
0
Ejercicios realizados por un alumno en un período de 61 días
0.2858
12.592
20 – 25 22.5 3
61
Paso 1. En primer término, calculamos la frecuencia esperada para cada uno
de los intervalos (FEi), integrando la función de densidad propuesta , para
después multiplicarla por el número total de datos.
Se puede apreciar que la distribución de frecuencias tiene una distribución
normal. Entonces tenemos que la función densidad es la siguiente:
𝒇(𝒙) =𝟏
𝝈√𝟐𝝅𝒆−
𝟏
𝟐(𝒙−𝝁
𝝈)𝟐
Calculamos la media:
𝝁 =∑ 𝒙𝒊𝒇𝒊𝒏𝒊=𝟏
∑ 𝒇𝒊𝒏𝒊=𝟏
=𝟐. 𝟓 ∗ 𝟒 + 𝟕. 𝟓 ∗ 𝟏𝟓 + 𝟏𝟐. 𝟓 ∗ 𝟐𝟔 + 𝟏𝟕. 𝟓 ∗ 𝟏𝟑 + 𝟐𝟐. 𝟓 ∗ 𝟑
𝟔𝟏= 𝟏𝟐. 𝟏𝟕𝟐𝟏
Calculamos la varianza:
𝝈 = √∑ 𝒇𝒊(𝒙𝒊 − 𝝁)𝟐𝒏𝒊=𝟏
∑ 𝒇𝒊𝒏𝒊=𝟏
=(2.5 − 12.1721)2 ∗ 4 + (7.5 − 12.1721)2 ∗ 15 + (12.5 − 12.1721)2 ∗ 26 + (17.5 − 12.1721)2 ∗ 13 + (22.5 − 12.1721)2 ∗ 3
61
𝝈𝟐 = 𝟐𝟐. 𝟒𝟕𝟒𝟖
𝝈 = √𝟐𝟐. 𝟒𝟕𝟒𝟖 = 𝟒. 𝟕𝟒𝟎𝟕
Entonces se propone el modelo: 𝑵𝒐𝒓𝒎𝒂𝒍(𝟏𝟐. 𝟏𝟕𝟐𝟏, 𝟐𝟐. 𝟒𝟕𝟒𝟖)
Calculamos la función de densidad, apoyándonos en wolframalpha,
obtenemos las integrales Luego dividiendo el área que define la campana
de Gauss con los parámetros mencionados 𝜇 = 12.17 y 𝜎 = 4.77 y además
tomando como 𝑥 el límite superior para cada intervalo para la obtención de
las probabilidades, tenemos:
𝑭(𝒙) =𝟏
𝟒. 𝟕𝟒𝟎𝟕√𝟐𝝅∫ 𝒆−
𝟏
𝟐(𝒙−𝟏𝟐.𝟏𝟕𝟐𝟏
𝟒.𝟕𝟒𝟎𝟕)𝟐𝒃
𝒂
Con 𝑎 como límite inferior y 𝑏 como límite superior del intervalo.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 (𝑭𝑶) 𝑭(𝒙) 𝑭𝑬 = 𝟔𝟏[𝑭(𝒙)] 0 – 5 4 0.052499 3.20243
5 – 10 15 0.258898 15.79277
10 – 15 26 0.419758 25.60523
15 – 20 13 0.223751 13.64881
20 – 25 3 0.039213 2.39199
61
Tabla para el cálculo del estimador 𝝌𝟐
Paso 2. Determinemos el estimador C con los valores obtenidos y m =5
𝐶 =∑(𝐹𝐸𝑖 − 𝐹𝑂𝑖)
2
𝐹𝐸𝑖
7
𝑖=1
=(3.20243 − 4)2
3.202439+(15.79277 − 15)2
15.792778+(25.60523 − 26)2
25.605238
+(13.64881 − 13)2
13.648811+(2.39199 − 3)2
2.391993= 𝟎. 𝟒𝟐𝟗𝟗𝟎
Paso 3. Calculemos el valor de 𝜒2𝛼,𝑑𝑓 = 𝜒25%,4
Esto lo haremos mediante la tabla con grados de libertad 𝑑𝑓 = 5 − 1 = 4 y
con un nivel de significancia de 𝛼 = 0.05, con lo cual obtenemos el valor
crítico.
Tabla de Ji -cuadrada.
𝟎. 𝟒𝟐𝟗𝟗𝟎𝟏 < 9,488
Como el valor de 𝜒2(4, 0.05) es mayor que 𝜒2 se considera que es un buen
ajuste con un modelo probabilístico uniforme propuesto, por lo tanto, el
modelo propuesto 𝑵𝒐𝒓𝒎𝒂𝒍(𝟏𝟐. 𝟏𝟕𝟐𝟏, 𝟐𝟐. 𝟒𝟕𝟒𝟖)no puede refutarse y por
tanto, puede considerarse correcto.
Histograma de Frecuencias.
Gráfica de la función de densidad de probabilidad.
Como el valor de 𝜒2(4, 0.05) es mayor que 𝜒2 se considera que es un buen
ajuste con un modelo probabilístico normal propuesto, por tanto,
concluimos que esta hipótesis no se puede rechazarse y el modelo
propuesto es correcto.
0
5
10
15
20
25
30
0 – 5 5 – 10 10 – 15 15 – 20 20 – 25
Frecuencia Observada y Esperada
FO
FE
Analiza los datos dados en cada caso, y determina su comportamiento
probando tu propuesta a través de la prueba de Bondad de Ajuste de
Kolmogorov - Smirnov.
5) En una determinada escuela se reporta el número de
inasistencias promedio por día que presenta un grupo de
alumnos, quedando plasmada en el siguiente gráfico.
¿Cuál es el modelo probabilístico que muestra el número de alumnos
que no asisten a la escuela por día en el periodo considerado?
Tabla del comportamiento de frecuencias.
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 Mc 𝐹𝑂 0 – 2 1 1
2 – 4 3 6
4 – 6 5 7
6 – 8 7 14
8 – 10 9 11
10– 12 11 6
12– 14 13 2
47
Día
Alu
mn
os f
alt
ista
s p
rom
ed
io
4746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Alumnos faltistas promedio por día
Con esto se puede ver que se trata de una distribución normal y vamos a
corroborarlo por medio de la prueba de bondad de Kolmogrov-Smirnov. Al
contar con la frecuencia observada en cada intervalo, podemos calcular la
media 𝝁 , la varianza 𝝈𝟐 y además su desviación estándar 𝝈, usando la
fórmula de los datos agrupados para intervalos:
Calculamos la media 𝝁:
𝝁 =∑ 𝑴𝒄𝒊𝒇𝒊𝒏𝒊=𝟏
𝒏=
=1 ∗ 1 + 3 ∗ 6 + 5 ∗ 7 + 7 ∗ 14 + 9 ∗ 11 + 11 ∗ 6 + 13 ∗ 2
47= 𝟕. 𝟐𝟗𝟕
Calculamos la varianza 𝝈𝟐:
𝝈𝟐 =∑ 𝒇𝒊(𝑴𝒄𝒊 − 𝝁)
𝟐𝒏𝒊=𝟏
𝒏=
𝝈𝟐 = 𝟏𝟏. 𝟎𝟒𝟖𝟔𝟑𝟖
=
(1 − 7.297)2 ∗ 1 + (3 − 7.297)2 ∗ 6 + (5 − 7.297)2 ∗ 7 + (7 − 7.297)2 ∗ 14 + (11 − 7.297)2 ∗ 11 + (11 − 7.297)2 ∗ 6 + (13 − 7.297)2 ∗ 3
47= 11.048638
Desviación estándar:
𝝈 = √𝟏𝟏. 𝟎𝟒𝟖𝟔𝟑𝟖 = 𝟑. 𝟑𝟐
Modelo propuesto: 𝑵𝒐𝒓𝒎𝒂𝒍(𝟕. 𝟐𝟗, 𝟏𝟏. 𝟎𝟒𝟖𝟔𝟑𝟖)
Luego dividiendo el área que define la campana de Gauss con los
parámetros mencionados, 𝝁 = 𝟕. 𝟐𝟗 y 𝝈 = 𝟑. 𝟑𝟐 y, tomando como 𝒙 el
límite superior para cada intervalo para la obtención de las probabilidades,
entonces construimos la siguiente:
Obtenemos la función de densidad.
𝑭(𝒙) =𝟏
𝟑. 𝟑𝟐𝟑𝟗√𝟐𝝅∫ 𝒆−
𝟏
𝟐(𝒙−𝟕.𝟐𝟗𝟕
𝟑.𝟑𝟐𝟑𝟗)𝟐𝒆𝒔
𝒐
Donde “es” es el extremo superior de cada intervalo de clase.
Se calcula la probabilidad esperada acumulada 𝑷𝑬𝑨𝒊 para los intervalos de
clase. (con software Mathematica) y se determina el valor absoluto de la
diferencia 𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊 en todos los intervalos de clase y se considera la
máxima diferencia MD, la cual será nuestro estimador.
Tabla para la obtención del 𝑴𝑫
Intervalo 𝒆𝒔(𝒂 ≤ 𝒃) 𝑭𝑶𝒊 𝑷𝑶𝑰 =
𝑭𝑶𝑰𝒏
𝑷𝑶𝑨𝒊 𝑷𝑬𝑨𝒊
= 𝑷(𝒆𝒔(𝒂≤ 𝒃))
𝑴𝑫= |𝑷𝑬𝑨𝒊− 𝑷𝑶𝑨𝒊
0-2 2 1 0.0213 0.0213 0.0414 0.0202
2-4 4 6 0.1277 0.1489 0.1466 0.0024
4-6 6 7 0.1489 0.2979 0.3341 0.0362
6-8 8 14 0.2979 0.5957 0.5697 0.0261
8-10 10 11 0.2340 0.8298 0.7779 0.0519
10-12 12 6 0.1277 0.9574 0.9074 0.0501
12-14 14 2 0.0426 1,0000 0.9641 0.0359
𝒏 = ∑ = 47 𝑴𝑫 = 0.0519
Donde
𝑴𝑫 = 𝟎. 𝟎𝟓𝟏𝟗𝟎𝟗𝟐𝟑
Comparamos al estimador MD con el valor correspondiente a los n datos
observados a un nivel de significación de 0.05, de tal forma que si MD es
menor o igual que el valor límite de la tabla, entonces no podremos
rechazar nuestra hipótesis con relación a que nuestra información histórica
encaja en el modelo probabilístico que hayamos propuesto.
Comparando el valor 𝑴𝑫 = 𝟎. 𝟎𝟓𝟏𝟗𝟎𝟗𝟐𝟑 con el valor en tabla del test de
Kolmogorov – Smirnov, con un nivel de significancia 1 − 95% = 0.05%, y n
=47, el cual es 0.1942, tenemos:
𝟎. 𝟎𝟓𝟏𝟗𝟎𝟗𝟐𝟑 ≤ 𝟎. 𝟏𝟗𝟒𝟐
Histograma de la función de densidad de probabilidad.
Por lo tanto el modelo propuesto 𝑵𝒐𝒓𝒎𝒂𝒍(𝟕. 𝟐𝟗𝟕, 𝟏𝟏, 𝟎𝟒𝟖𝟔𝟑𝟖) para la
prueba Kolmogorov-Smirnov no se rechaza la distribución Normal.
6) En una oficina se realiza el análisis de errores ortográficos que
presentan un grupo de capturistas por día, mostrándose en la
siguiente gráfica.
Determina el modelo probabilístico que presenta el número de
errores ortográficos por día en el periodo considerado.
Tabla del comportamiento de frecuencias.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 Mc 𝑭𝑶 0 – 2 1 19
2 – 4 3 12
4 – 6 5 7
6 – 8 7 5
8 – 10 9 3
10– 12 11 2
12– 14 13 1
49
Podemos ver que la distribución de frecuencias tiene una distribución
exponencial, aunque debemos corroborarlo con la prueba de Kolmogorov-
Smirnov. Tenemos que n=49 y la frecuencia observada 𝐹𝑂𝑖 en cada
intervalo , el objetivo es calcular el estimador 𝑀𝐷 = |𝑃𝐸𝐴𝑖 − 𝑃𝑂𝐴𝑖|, y para
esto, realizamos los cálculos siguientes:
Obtenemos las Marcas de clase: 𝟏, 𝟑, 𝟓, 𝟕, 𝟗, 𝟏𝟏, 𝟏𝟑
Calculamos la media:
Día
Err
ore
s o
rto
grá
fico
s
49484746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Errores ortográficos por día
𝝁 =∑ 𝑴𝒄𝒊𝒇𝒊𝒏𝒊=𝟏
𝒏=𝟏 ∗ 𝟏𝟗 + 𝟑 ∗ 𝟏𝟐 + 𝟓 ∗ 𝟕 + 𝟕 ∗ 𝟓 + 𝟗 ∗ 𝟑 + 𝟏𝟏 ∗ 𝟐 + 𝟏𝟑 ∗ 𝟏
𝟒𝟗=
= 𝟏𝟖𝟕/𝟒𝟗 = 𝟑. 𝟖𝟏𝟔𝟑
Obtenemos el parámetro 𝝀 para poder calcular las probabilidades.
𝝁 =𝟏
𝝀
𝝀 =𝟏
𝝁=
𝟏
𝟑. 𝟖𝟏𝟔𝟑= 𝟎. 𝟐𝟔𝟐𝟎
Se propone el modelo: 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍(𝟎. 𝟐𝟔𝟐𝟎
Calculamos entonces, la función de densidad de probabilidad, para
cada intervalo, por medio de:
𝑭𝑬𝒊 = 𝑭(𝒙) = ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙𝑳𝒔
𝑳𝒊
𝒇(𝒙) = 𝝀𝒆−𝝀𝒙
𝑭(𝒙) = ∫ 𝟎. 𝟐𝟔𝟐𝒆−𝟎.𝟐𝟔𝟐𝟎𝒙𝒆𝒔
𝟎
Siendo 𝒆𝒔, el extremo superior de cada intervalo de clase.
Tabla de probabilidades:
Intervalo 𝑷(𝒂 ≤ 𝒙 ≤ 𝒃) = 𝑭(𝒙)
0-2 0.40
2-4 0.24
4-6 0.14
6-8 0.08
8-10 0.05
10-12 0.02
12-𝟏𝟒 0.04
Calculamos la probabilidad observada y la probabilidad esperada
acumulada (PEAi) para cada uno de los intervalos, luego, el valor absoluto
de la diferencia 𝑃𝐸𝐴𝑖 − 𝑃𝑂𝐴𝑖 y obtenemos la máxima diferencia MD, que
corresponde al estimador.
Tabla de 𝑴𝑫
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝒆𝒔(𝒂
≤ 𝒃) (𝑭𝑶𝒊) 𝑷𝑶𝒊=
𝐹𝑂𝐼
𝑛 𝑷𝑶𝑨𝒊 𝑷𝑬𝑨𝒊
= 𝑃(𝑒𝑠(𝑎 ≤ 𝑏)) 𝑴𝑫 = 𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊
0 – 2 2 19 0,3878 0,3878 0,4079 0,0201
2 – 4 4 12 0,2449 0,6326 0,6494 0,0168
4 – 6 6 7 0,1429 0,7755 0,7924 0,0169
6 – 8 8 5 0,1020 0,8775 0,8771 0,0004
8 – 10 10 3 0,0612 0,9387 0,9272 0,0115
10 – 12 12 2 0,0408 0,9795 0,9569 0,0226
12 – 14 14 1 0,0204 1,0000 0,9745 0,0255
𝒏 = ∑ = 49 𝑴𝑫 = 0,0255
𝑴𝑫 = 𝟎.𝟎𝟐𝟓𝟓
Realizamos la comparación 𝑴𝑫 con el valor correspondiente a los 𝑛 datos
observados con un nivel de significancia de 𝛼 = 0.05 de tal forma que si
𝑴𝑫 es menor o igual que el valor límite de la tabla, entonces no podemos
rechazar la hipótesis con relación a que nuestra información histórica encaja
en el modelo probabilístico propuesto; entonces buscamos el valor para
𝑛 = 49 en la tabla de Kolmogorov-Smirnov y vemos que:
𝟎. 𝟎𝟐𝟓𝟓 ≤ 𝟎. 𝟏𝟗𝟎𝟐𝟖
Por lo tanto el modelo propuesto no se puede rechazar.
Histograma de la 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍 (𝟎. 𝟐𝟔𝟐𝟎)
7) Un investigador aplica una encuesta a un grupo de personas
para saber el número de horas promedio que ven televisión
por día, obteniendo los resultados que muestra la gráfica.
Establece el modelo probabilístico que presenta el número de horas
promedio que pasan las personas del grupo analizado frente al
televisor, por día en el período considerado.
Tabla del comportamiento de frecuencias.
Día
Ho
ras q
ue
ve
n T
V e
n p
rom
ed
io
4746454443424140393837363534333231302928272625242322212019181716151413121110987654321
14
12
10
8
6
4
2
0
Horas que un grupo de personas ve TV en promedio por día
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 Mc 𝑭𝑶 0 – 2 1 18
2 – 4 3 9
4 – 6 5 7
6 – 8 7 6
8 – 10 9 4
10– 12 11 1
12– 14 13 2
47
Se propone el modelo: 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍(𝟎. 𝟐𝟒𝟏)
Podemos ver que la distribución de frecuencias tiene una distribución
exponencial, aunque debemos corroborarlo con la prueba de Kolmogorov-
Smirnov. Tenemos que n=47 y la frecuencia observada 𝐹𝑂𝑖 en cada
intervalo , el objetivo es calcular el estimador 𝑀𝐷 = |𝑃𝐸𝐴𝑖 − 𝑃𝑂𝐴𝑖|, y para
esto, realizamos los cálculos siguientes:
Obtenemos las Marcas de clase: 𝟏, 𝟑, 𝟓, 𝟕, 𝟗, 𝟏𝟏, 𝟏𝟑
Calculamos la media:
𝝁 =∑ 𝑴𝒄𝒊𝒇𝒊𝒏𝒊=𝟏
𝒏=1 ∗ 18 + 3 ∗ 9 + 5 ∗ 7 + 7 ∗ 6 + 9 ∗ 4 + 11 ∗ 1 + 13 ∗ 2
47=
=𝟏𝟗𝟓
𝟒𝟕= 𝟒. 𝟏𝟒𝟖
Obtenemos el parámetro 𝝀 para poder calcular las probabilidades.
𝝁 =𝟏
𝝀
𝝀 =𝟏
𝝁=
𝟏
𝟒. 𝟏𝟒𝟖= 𝟎. 𝟐𝟒𝟏
Calculamos entonces, la función de densidad de probabilidad para
cada intervalo, por medio de:
𝑭𝑬𝒊 = 𝑭(𝒙) = ∫ 𝝀𝒆−𝝀𝒙𝒅𝒙𝑳𝒔
𝑳𝒊
𝒇(𝒙) = 𝝀𝒆−𝝀𝒙
𝑭𝑬𝒊 = 𝑭(𝒙) = ∫ 𝟎. 𝟐𝟒𝟏𝒆−𝟎.𝟐𝟒𝟏𝒙𝒆𝒔
𝟎
Siendo 𝒆𝒔, el extremo superior de cada intervalo de clase.
Tabla de probabilidades.
Intervalo 𝑷(𝒂 ≤ 𝒙 ≤ 𝒃) = 𝑭(𝒙)
0-2 0.38
2-4 0.23
4-6 0.14
6-8 0.09
8-10 0.05
10-12 0.03
12-𝟏𝟒 0.05
Calculamos la probabilidad observada y la probabilidad esperada
acumulada (𝑃𝐸𝐴𝑖) para cada uno de los intervalos, luego, el valor absoluto
de la diferencia 𝑃𝐸𝐴𝑖 − 𝑃𝑂𝐴𝑖 y obtenemos la máxima diferencia MD, que
corresponde al estimador.
Tabla de 𝑴𝑫
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 𝒆𝒔(𝒂≤ 𝒃)
𝑭𝑶𝒊 𝑷𝑶𝑰 =
𝑭𝑶𝑰𝒏
𝑷𝑶𝑨𝒊 𝑷𝑬𝑨
= 𝑷(𝒆𝒔(𝒂≤ 𝒃))
𝑴𝑫= 𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊
0 – 2 2 18 0,3830 0,3878 0,3825 0,0053
2 – 4 4 9 0,1915 0,5744 0,6187 0,0443
4 – 6 6 7 0,1489 0,7234 0,7645 0,0411
6 – 8 8 6 0,1277 0,8775 0,8546 0,0229
8 – 10 10 4 0,0851 0.9361 0,9102 0,0259
10– 12 12 1 0,0213 0, 9574 0,9445 0,0129
12– 14 14 2 0,0426 1,0000 0,9658 0,0342
𝒏 = ∑ = 47 𝑴𝑫 = 0,0443
𝑴𝑫 = 𝟎. 𝟎𝟒𝟒𝟑
Realizamos la comparación 𝑴𝑫 con el valor correspondiente a los 𝑛 datos
observados con un nivel de significancia de 𝛼 = 0.05 de tal forma que si
𝑴𝑫 es menor o igual que el valor límite de la tabla, entonces no podemos
rechazar la hipótesis con relación a que nuestra información histórica encaja
en el modelo probabilístico propuesto; entonces buscamos el valor para
𝑛 = 47 en la tabla de Kolmogorov-Smirnov y vemos que:
𝟎, 𝟎𝟒𝟒𝟑 ≤ 𝟎. 𝟏𝟗𝟒𝟐
Por lo tanto, concluimos que el modelo propuesto no se puede
rechazar.
Histograma de la función de densidad 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍 (𝟎. 𝟐𝟒𝟏)
CORRECCIÓN. 8) En una empresa se elige un lote y se revisa el número de
artículos defectuosos, teniendo los siguientes resultados:
Para el ejercicio 8, considera el tipo de problema, tu planteas que es normal sin
embargo la normal te puede dar valores reales, esto sería poco sensato cuando
estamos hablando de la variable aleatoria representa artículos. Los datos son
discretos por tanto enfócate a una distribución discreta y no continua.
13 12
14
10
16
8
11
20
17
13
16
12
14 13
10 11
10
12 12 11 11
10
16
11 12
9
12 12 12 11
14
16 16
11
9
11
13 13
7
12
0
5
10
15
20
0 5 10 15 20 25 30 35 40
Número de Artículos Defectuosos en diferentes Lotes
Determina cuál es el modelo probabilístico que se ajusta a los datos,
ajusta:
Realiza el análisis con la prueba de Bondad de Ajuste 2 .
No. Artículos defectuosos
Frecuencia
7 1
8 1
9 2
10 4
11 8
12 9
13 5
14 3
15 0
16 5
17 1
18 0
19 0
20 1
Tabla del comportamiento de frecuencias.
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 Mc 𝑭𝑶𝒊 0 – 5 2.5 0
5 – 10 7.5 8
10 – 15 12.5 25
15 – 20 17.5 7
40
De acuerdo a los datos proporcionados, consideraremos una distribución
discreta. Por tanto, calculemos primero la media de los datos:
𝝁
=𝟕(𝟏) + 𝟖(𝟏) + 𝟗(𝟐) + 𝟏𝟎(𝟒) + 𝟏𝟏(𝟖) + 𝟏𝟐(𝟗) + 𝟏𝟑(𝟓) + 𝟏𝟒(𝟑) + 𝟏𝟔(𝟓) + 𝟏𝟕(𝟏) + 𝟐𝟎(𝟏)
𝟒𝟎= 𝟏𝟐. 𝟖𝟐𝟓
Se propone el modelo: 𝑷𝒐𝒊𝒔𝒔𝒐𝒏(𝟏𝟐. 𝟖𝟐𝟓)
La función de densidad es:
𝒇(𝒙) =𝝀𝒙𝒆−𝝀
𝒙!
Obtenemos las probabilidades:
𝑬𝒋: 𝑷(𝑿 = 𝟕) =(𝟏𝟐. 𝟖𝟐𝟓)𝟕𝒆−𝟏𝟐.𝟖𝟐𝟓
𝟕!= 𝟎. 𝟎𝟑𝟎𝟒𝟖
= Por medio de wolframalpha, obtenemos las demás probabilidades:
𝑷(𝑿 = 𝟕) = 𝟎. 𝟎𝟑𝟎𝟒𝟖
𝑷(𝑿 = 𝟖) = 𝟎. 𝟎𝟒𝟖𝟖𝟖
𝑷(𝑿 = 𝟗) = 𝟎. 𝟎𝟔𝟗𝟔𝟓
𝑷(𝑿 = 𝟏𝟎) = 𝟎. 𝟎𝟖𝟗𝟑𝟑
𝑷(𝑿 = 𝟏𝟏) = 𝟎. 𝟏𝟎𝟒𝟏𝟓
𝑷(𝑿 = 𝟏𝟐) = 𝟎. 𝟏𝟏𝟏𝟑𝟏
𝑷(𝑿 = 𝟏𝟑) = 𝟎. 𝟏𝟎𝟗𝟖𝟏
𝑷(𝑿 = 𝟏𝟒) = 𝟎. 𝟏𝟎𝟎𝟓𝟗
𝑷(𝑿 = 𝟏𝟓) = 𝟎. 𝟎𝟖𝟔𝟎𝟏
𝑷(𝑿 = 𝟏𝟔) = 𝟎. 𝟎𝟔𝟖𝟗𝟒
𝑷(𝑿 = 𝟏𝟕) = 𝟎. 𝟎𝟓𝟐𝟎𝟏
𝑷(𝑿 = 𝟏𝟖) = 𝟎. 𝟎𝟑𝟕𝟎𝟔
𝑷(𝑿 = 𝟏𝟗) = 𝟎. 𝟎𝟐𝟓𝟎𝟏
𝑷(𝑿 = 𝟐𝟎) = 𝟎. 𝟎𝟏𝟔𝟎𝟒
Obtenemos las frecuencias esperadas para cada uno de los datos, y los ponemos en la siguiente tabla:
No. Artículos
defectuosos
𝑭𝑶 𝑭(𝒙) 𝑭𝑬 𝑭𝑬 − 𝑭𝑶 (𝑭𝑬 − 𝑭𝑶)𝟐 (𝑭𝑬 − 𝑭𝑶)𝟐
𝑭𝑬
7 1 0.03048908 1.21956328 0.21956328 0.04820804 0.03952893
8 1 0.04887781 1.95511239 0.95511239 0.91223968 0.46659194
9 2 0.06965088 2.78603515 0.78603515 0.61785126 0.22176722
10 4 0.08932725 3.57309009 -0.42690991
0.18225207 0.05100685
11 8 0.10414746 4.16589821 -3.83410179
14.7003365 3.52873156
12 9 0.11130759 4.45230372 -4.54769628
20.6815415 4.64513268
13 5 0.10980922 4.39236886 -0.60763114
0.3692156 0.08405842
14 3 0.10059309 4.02372361 1.02372361 1.04801004 0.26045776
15 0 0.08600709 3.44028369 3.44028369 11.8355519 3.44028369
16 5 0.06894006 2.7576024 -2.2423976 5.02834702 1.82344889
17 1 0.05200919 2.08036769 1.08036769 1.16719434 0.56105195
18 0 0.03705655 1.48226198 1.48226198 2.19710057 1.48226198
19 0 0.02501317 1.00052684 1.00052684 1.00105395 1.00052684
20 1 0.0160397 0.64158783 -0.35841217
0.12845928 0.20022088
17.80506959
Obtenemos los grados de libertad con 𝑲 – 𝒎 − 𝟏 = 𝟏𝟒 − 𝟏 − 𝟏 = 𝟏𝟐 y
para un nivel de significancia del 5%, empleamos 𝝌𝒅𝒇,𝜶𝟐:
𝝌𝟎.𝟎𝟓,𝟏𝟐𝟐 = 𝟐𝟏. 𝟎𝟐𝟔
Y de aquí que 17.80506959< 𝟐𝟏. 𝟎𝟐𝟔 por lo que no se rechaza la hipótesis
de que los datos siguen una distribución Poisson.
Para la prueba de K-S, debemos considerar la probabilidad esperada y la esperada acumulada así como la probabilidad observada acumulada.
No. Artículos
defectuosos
𝑭𝑶 𝑷𝑬 𝑷𝑶 𝑷𝑶𝑨 𝑷𝑬𝑨 |𝑷𝑬𝑨−𝑷𝑶𝑨|
7 1 0.03048908 0.025 0.025 0.03048908 0.00548908
8 1 0.04887781 0.025 0.05 0.07936689 0.02936689
9 2 0.06965088 0.05 0.1 0.14901777 0.04901777
10 4 0.08932725 0.1 0.2 0.23834502 0.03834502
11 8 0.10414746 0.2 0.4 0.34249248 0.05750752
12 9 0.11130759 0.225 0.625 0.45380007 0.17119993
13 5 0.10980922 0.125 0.75 0.56360929 0.18639071
14 3 0.10059309 0.075 0.825 0.66420238 0.16079762
15 0 0.08600709 0 0.825 0.75020948 0.07479052
16 5 0.06894006 0.125 0.95 0.81914954 0.13085046
17 1 0.05200919 0.025 0.975 0.87115873 0.10384127
18 0 0.03705655 0 0.975 0.90821528 0.06678472
19 0 0.02501317 0 0.975 0.93322845 0.04177155
20 1 0.0160397 0.025 1 0.94926814 0.05073186
Como la máxima diferencia es 𝑀𝐷 = 0.18639071, comparamos en las tablas de Kolmogorov-Smirnov con un nivel de significancia del 5% y para n = 40, se tiene que:
0.18639071 < 0.26803
Histograma de Frecuencias.
Por lo tanto, no se rechaza la hipótesis de que los datos siguen una distribución Poisson.
CORRECCIÓN. 9) Se hizo una encuesta a 50 familias y se anotó el número de
hijos que tuvieron antes de que naciera el primer hombre.
Teniendo los siguientes resultados:
* Para el 9 es la misma situación, la variable es entera, entonces no puedes pensar que es una
distribución exponencial, por otro lado es necesario conocer las distribuciones ya que algunas se
ajustan mejor a cierto tipo de problemas, generalmente la exponencial se asocia tiempos entre
llegadas para valores reales, pero éstos son discretos.
3 0 0 0 1 0 0 1 1 0
0 0 0 2 1 0 4 5 6 1
0 0 3 2 0 3 3 2 0 2
3 1 1 1 0 2 0 0 3 0
0 4 5 0 0 0 1 1 0 0
Determina cuál es el modelo probabilístico que se ajusta a los datos,
ajusta:
Realiza el análisis con la prueba de Bondad de Ajuste 2 .
Tabla del comportamiento de frecuencias
𝑫𝒂𝒕𝒐𝒔 𝑭𝑶 0 24
1 10
2 5
3 6
4 2
5 2
6 1
50
De acuerdo a los datos proporcionados, tenemos que la variable es
𝒙 = 𝟎, 𝟏, 𝟐, … ,por lo cual, proponemos una distribución discreta.
Cálculo de la media:
𝝁 =𝟎(𝟐𝟒) + 𝟏(𝟏𝟎) + 𝟐(𝟓) + 𝟑(𝟔) + 𝟒(𝟐) + 𝟓(𝟐) + 𝟔(𝟏)
𝟓𝟎= 𝟏. 𝟐𝟒
Entonces, usaremos la siguiente fórmula:
𝝁 =𝟏−𝒑
𝒑
Despejamos 𝑝 y obtenemos:
𝒑 =𝟏
𝟏 + 𝝁=
𝟏
𝟏 + 𝟏. 𝟐𝟒= 𝟎. 𝟒𝟒𝟔𝟒𝟐𝟖
Entonces se propone el modelo: con distribución Geométrica.
Obtenemos la función de distribución:
𝑷(𝑿 = 𝒙) = (𝟏 − 𝒑)𝒌𝒑, 𝒌 = 𝟎, 𝟏, 𝟐, …
Por medio de esta fórmula, podemos medir la cantidad de fallos antes del primer
éxito, que en este caso, es tener un hijo varón.
Obtenemos las probabilidades, apoyándonos por medio del software
wolframalpha y obtenemos la siguiente tabla:
𝑬𝒋: 𝑷(𝑿 = 𝟎) = (𝟏 − 𝟎. 𝟒𝟒𝟔𝟒)𝟎(𝟎. 𝟒𝟒𝟔𝟒) = 𝟎. 𝟒𝟒𝟔𝟒
𝑷(𝑿 = 𝟎) = 𝟎. 𝟒𝟒𝟔𝟒
𝑷(𝑿 = 𝟏) = 𝟎. 𝟐𝟒𝟕𝟏
𝑷(𝑿 = 𝟐) = 𝟎. 𝟏𝟑𝟔𝟖
𝑷(𝑿 = 𝟑) = 𝟎. 𝟎𝟕𝟓𝟕
𝑷(𝑿 = 𝟒) = 𝟎. 𝟎𝟒𝟏𝟗
𝑷(𝑿 = 𝟓) = 𝟎. 𝟎𝟐𝟑𝟐
𝑷(𝑿 = 𝟔) = 𝟎. 𝟎𝟏𝟐𝟖
Tabla de frecuencias.
No. De Hijos
𝑭𝑶 𝑭(𝒙) 𝑭𝑬 𝑭𝑬 − 𝑭𝑶 (𝑭𝑬− 𝑭𝑶)𝟐
(𝑭𝑬 − 𝑭𝑶)𝟐
𝑭𝑬
0 24 0.4464 22.32 -1.68 2.8224 0.12645
1 10 0.2471 12.355 2.355 5.5460 0.44888
2 5 0.1368 6.84 1.84 3.3856 0.49497
3 6 0.0757 3.785 -2.215 4.9062 0.8177 4 2 0.0419 2.095 0.095 0.0090 0.0043
5 2 0.0232 1.16 -0.84 0.7056 0.6083
6 1 0.0128 0.64 -0.36 0.1296 0.2025
C=2.7031
Obtenemos los grados de libertad 𝒅𝒇 = 𝟕 − 𝟏 − 𝟏 = 𝟓, y para un nivel de
significancia del 5%, empleamos 𝝌𝒅𝒇,𝜶𝟐:
𝝌𝟎.𝟎𝟓,𝟓𝟐 = 𝟏𝟏. 𝟎𝟕𝟎
Y de aquí se sigue que, 𝟐. 𝟕𝟎𝟑𝟏 < 𝟏𝟏. 𝟎𝟕𝟎, por lo cual no se rechaza la
hipótesis de que los datos siguen una distribución Geométrica.
Para la prueba de K-S, debemos considerar la probabilidad esperada y la esperada acumulada así como la probabilidad observada acumulada; obtenemos la siguiente tabla:
No. De Hijos 𝑭𝑶 𝑷𝑶𝒊 𝑷𝑶𝑨𝒊 𝑷𝑬 𝑷𝑬𝑨𝒊 |𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊|
0 24 0.48 0.48 0.4464 0.4464 0.0336
1 10 0.2 0.68 0.2471 0.6935 0.0135 2 5 0.1 0.78 0.1368 0.8303 0.0503
3 6 0.12 0.90 0.0757 0.906 0.006
4 2 0.04 0.94 0.0419 0.9479 0.0079
5 2 0.04 0.98 0.0232 0.9711 0.0089 6 1 0.02 1 0.0128 0.9839 0.0161
Como la máxima diferencia es 𝑀𝐷 = 0.0503, comparamos en las tablas para un
nivel de confianza de 0.05% y n = 47 datos, se tiene que;
𝟎. 𝟎𝟓𝟎𝟑 < 𝟎. 𝟏𝟖𝟖𝟒𝟏
Por lo tanto, no se rechaza la hipótesis del modelo probabilístico propuesto.
Histograma de frecuencias.
La conclusión que se tiene es que al comparar ambas pruebas, podemos ver que
la gráfica de los datos sigue una distribución Geométrica.
10) Realiza el análisis con la prueba de Bondad de Ajuste de
Kolmogorov – Smirnov
Tabla del comportamiento de frecuencias.
𝑫𝒂𝒕𝒐𝒔 𝑭𝑶 0 24
1 10
2 5
3 6
4 2
5 2
6 1
50
Se puede apreciar que la distribución de frecuencias tiene una distribución
exponencial.
Calculamos la media
𝝁 =∑ 𝑴𝒄𝒇𝒊𝒏𝒊=𝟏
∑ 𝒇𝒊𝒏𝒊=𝟏
=𝟎 ∗ 𝟐𝟒 + 𝟏 ∗ 𝟏𝟎 + 𝟐 ∗ 𝟓 + 𝟑 ∗ 𝟔 + 𝟒 ∗ 𝟐 + 𝟓 ∗ 𝟐 + 𝟔 ∗ 𝟏
𝟓𝟎= 𝟏. 𝟐𝟒
Para la función exponencial, obtenemos el parámetro 𝝀.
𝝁 =𝟏
𝝀
𝝀 =𝟏
𝝁=
𝟏
𝟏. 𝟐𝟒= 𝟎. 𝟖𝟎𝟔
Se propone el modelo: 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍(𝟎. 𝟖𝟎𝟔)
Obtenemos la función de densidad.
𝒇(𝒙) = 𝝀𝒆−𝝀𝒙
𝑭(𝒙) = ∫ 𝟎. 𝟖𝟎𝟔𝒆−𝟎.𝟖𝟎𝟔𝒙𝒆𝒔
𝟎
Con 𝒆𝒔 como el extremo superior de cada intervalo de clase.
Calculamos la probabilidad observada y la probabilidad esperada
acumulada (𝑷𝑬𝑨𝒊) para cada uno de los intervalos, luego, el valor absoluto
de la diferencia 𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊 y obtenemos la máxima diferencia MD, que
corresponde al estimador.
Tabla de 𝑴𝑫
𝑰𝒏𝒕𝒆𝒓𝒗𝒂𝒍𝒐 (𝑭𝑶) 𝑷𝑶𝒊 𝑷𝑶𝑨𝒊 𝑷𝑬𝑨𝒊 𝑷𝑬𝑨𝒊 − 𝑷𝑶𝑨𝒊 0 24 0,48 0.48 0.4825 0.0025
1 10 0,2 0.68 0.6187 0.0613
2 5 0,1 0.78 0.7645 0.0155
3 6 0,12 0.9 0.8546 0.0454
4 2 0,04 0.94 0.9102 0.0298
5 2 0,04 0.98 0.9445 0.0355
6 1 0,02 1.00 0.9658 0.0342
50 𝑴𝑫 = 0.0613
𝑴𝑫 = 𝟎. 𝟎𝟔𝟏𝟑 Realizamos la comparación 𝑴𝑫 con el valor correspondiente a los 𝑛 datos
observados con un nivel de significancia de 𝛼 = 0.05 de tal forma que si
𝑴𝑫 es menor o igual que el valor límite de la tabla, entonces no podemos
rechazar la hipótesis con relación a que nuestra información histórica encaja
en el modelo probabilístico propuesto; entonces buscamos el valor para
𝑛 = 49 en la tabla de Kolmogorov-Smirnov con un nivel de significancia del
0.05%, y n , el cual es 0.19028, entonces vemos que:
𝟎. 𝟎𝟔𝟏𝟑 ≤ 𝟎. 𝟏𝟖𝟖𝟒𝟏
Por lo tanto el modelo propuesto no se rechaza.
Gráfica de la función de densidad 𝑬𝒙𝒑𝒐𝒏𝒆𝒏𝒄𝒊𝒂𝒍(𝟎. 𝟖𝟎𝟔)
Compara resultados.
Se puede apreciar que el ajuste de dio como correcto con la prueba de
Kolmogorov – Smirnov, pero no así con la prueba de bondad de ajuste de
Chi cuadrado.
Conclusiones generales del trabajo
En relación a este trabajo realizado, puedo remarcar la importancia
que implica el saber realizar una prueba de bondad de ajuste, que sabemos,
se trata de un procedimiento estadístico, que nos permite en dado
momento, probar la hipótesis de que una función de distribución particular,
ajusta un conjunto de datos observados, sin especificar una prueba de
hipótesis alternativa. Vimos pues, con la prueba de Ji cuadrada, cómo se
pueden hacer las comparaciones entre la distribución de frecuencias
observadas (Fo) de una variable cualitativa (o cuantitativa) y la distribución
de frecuencias esperadas (Fe), lo cual, nos servirá de gran manera, para
determinar si existen diferencias que puedan ser significativas y poder
concluir si la propuesta es la que puede ser la idónea o no.
En cuanto a las pruebas de bondad de Kolmogorov Smirnov, también fué
intereante conocer, que se trata de una prueba que nos va a permitir
establecer si las muestras se ajustan al modelo probabilístico, y esto lo
podemos realizar, si encontramos la diferencia mayor entre las
probabilidades observadas acumuladas y las probabilidades esperadas
acumuladas.
Unidad 1. Actividad a Cargo del Facilitador.
Introducción.
Distribución Poisson.
Notación: 𝑋
La Distribución Poisson (Siméon Denis Poisson), resulta ser una
generalización de la distribución binomial; se define una variable
aleatoria X, que representa el número de éxitos independientes que ocurren
para intervalos de medida específicos ( tiempos, lugares, espacios) , además
con una probabilidad de ocurrencia pequeña, se usa como aproximación a la
binomial cuando el tamaño de muestra es grande y la proporción de éxitos es
pequeña. Los intervalos de medida pueden referirse a tiempo( segundo,
minutos, hora, día, semana), áreas (segmento de línea, pulgada cuadrada,
centímetro cuadrado), volumen( litro, galón, onza).Como ejemplos se puede
citar:
Número de llamadas telefónicas que ingresan a un conmutador por minuto.
Número de interrupciones en servicios de energía en intervalos de un día.
Número de accidentes automovilísticos en un cruce específico durante cierto
período.
Distribución Binomial.
Notación:
Es una de las distribuciones de probabilidad más útiles, pues se usa en control
de calidad, producción, investigación; tiene que ver con el experimento aleatorio
que produce en cada ensayo o prueba uno de dos resultados posibles mutuamente
excluyentes: ocurrencia de un criterio o característica específico (llamado éxito) y
no ocurrencia de éste (llamado fracaso). Los términos o calificativos de "éxito y
fracaso" son solo etiquetas y su interpretación puede no corresponder con el
resultado positivo o negativo de un experimento en la realidad.
Resuelve la siguiente aplicación: Se tienen los datos de los accidentes en carreteras de los últimos 50 meses:
a) Elabora el histograma de Frecuencia.
b) Encuentra la media y varianza.
Accidentes en una carretera del país.
Por lo que se aprecia en la gráfica, se nos muestra que los datos
son enteros, por lo cual, consideraremos que se trata de datos
discretos, entonces, podemos proponer una distribución
Poisson, para lo cual iniciamos, realizamos los siguientes
cálculos.
Cálculo de la media y de la varianza.
𝝁 =
1(1)+2(2)+3(2)+4(2)+5(7)+6(11)+7(6)+8(8)+9(3)+
+10(3)+11(2)+12(1)+13(0)+14(1)+15(1)
50= 6.92
𝝈𝟐 =
1(1)+4(2)+9(2)+16(2)+25(7)+36(11)+49(6)+64(8)++81(3)+100(3)+121(2)+144(1)+169(0)+196(1)+225(1)
50−
6.92 = 48
Donde 𝝁 es la media y 𝝈 es la desviación estándar.
c) Establece dos propuestas de modelos de probabilidad y realiza
para cada propuesta:
Primera propuesta:
Se propone el Modelo Poisson (6.92 )
d) El ajuste de los datos utilizando la prueba de bondad de ajuste 2.
Necesitamos calcular la Función de densidad y lo hacemos mediante la
siguiente fórmula, para obtener cada una de las probabilidades,
entonces, tenemos:
𝒇(𝒙) =𝝀𝒙𝒆−𝝀
𝒙!, 𝜆 = 𝜇 = 6.92
𝑃(𝑋 = 1) =(6.92)1𝑒−6.92
1!= 0.00683578
𝑃(𝑋 = 2) = 0.02365181
𝑃(𝑋 = 3) = 0.05455684
𝑃(𝑋 = 4) = 0.09438334
𝑃(𝑋 = 5) = 0.13062654
𝑃(𝑋 = 6) = 0.15065594
𝑃(𝑋 = 7) = 0.14893416
𝑃(𝑋 = 8) = 0.12882805
𝑃(𝑋 = 9) = 0.09905445
𝑃(𝑋 = 10) = 0.06854568
𝑃(𝑋 = 11) = 0.04312146
𝑃(𝑋 = 12) = 0.02486671
𝑃(𝑋 = 13) = 0.01323674
𝑃(𝑋 = 14) = 0.00654273
𝑃(𝑋 = 15) = 0.00301838
Al multiplicar estas probabilidades por 50 (número de datos), obtenemos las frecuencias esperadas, lo cual integramos en la siguiente tabla de frecuencias.
TABLA DE FRECUENCIAS.
Núm.
Accidentes 𝑭𝑶 𝑭(𝒙) 𝑭𝑬 𝑭𝑬− 𝑭𝑶 (𝑭𝑬 − 𝑭𝑶)𝟐 (𝑭𝑬 − 𝑭𝑶)𝟐
𝑭𝑬
1 1 0.00683578 0.34178916 -0.65821084 0.43324151 1.2675695
2 2 0.02365181 1.18259049 -0.81740951 0.6681583 0.5649955
3 2 0.05455684 2.72784207 0.72784207 0.52975407 0.1942027
4 2 0.09438334 4.71916678 2.71916678 7.39386796 1.5667744
5 7 0.13062654 6.53132682 -0.46867318 0.21965455 0.0336301
6 11 0.15065594 7.53279693 -3.46720307 12.0214971 1.5958876
7 6 0.14893416 7.44670782 1.44670782 2.09296353 0.2810589
8 8 0.12882805 6.44140227 -1.55859773 2.42922689 0.3771274
9 3 0.09905445 4.95272263 1.95272263 3.81312568 0.7699051
10 3 0.06854568 3.42728406 0.42728406 0.18257167 0.0532708
11 2 0.04312146 2.15607325 0.15607325 0.02435886 0.0112978
12 1 0.02486671 1.24333557 0.24333557 0.0592122 0.0476237
13 0 0.01323674 0.66183709 0.66183709 0.43802833 0.6618371
14 1 0.00654273 0.32713662 -0.67286338 0.45274513 1.3839635
15 1 0.00301838 0.15091903 -0.84908097 0.7209385 4.7769891 C=13.586132
Los grados de libertad son 𝑲 – 𝒎 − 𝟏 = 𝟏𝟓 − 𝟏 − 𝟏 = 𝟏𝟑, con un nivel de
significancia del 5% , tenemos que
𝝌𝟎.𝟎𝟓,𝟏𝟑𝟐 = 𝟐𝟐. 𝟑𝟔𝟐
Y como 13.586132 < 22.362, no se rechaza la hipótesis de que los datos siguen una distribución Poisson.
e) El ajuste de los datos utilizando la prueba de Bondad de Ajuste de
Kolmogorov – Smirnov.
Ahora, para la prueba K – S consideramos la probabilidad observada acumulada y la probabilidad esperada acumulada, cuyos cálculos integramos en la siguiente tabla:
TABLA DE PROBABILIDADES K-S
Núm. Accidentes
𝑭𝑶 𝑷𝑬 𝑷𝑶 𝑷𝑶𝑨 𝑷𝑬𝑨 |𝑷𝑬𝑨− 𝑷𝑶𝑨|
1 1 0.00683578 0.02 0.02 0.00683578 0.01316422 2 2 0.02365181 0.04 0.06 0.03048759 0.02951241 3 2 0.05455684 0.04 0.1 0.08504443 0.01495557 4 2 0.09438334 0.04 0.14 0.17942777 0.03942777 5 7 0.13062654 0.14 0.28 0.31005431 0.03005431 6 11 0.15065594 0.22 0.5 0.46071024 0.03928976 7 6 0.14893416 0.12 0.62 0.6096444 0.0103556 8 8 0.12882805 0.16 0.78 0.73847245 0.04152755 9 3 0.09905445 0.06 0.84 0.8375269 0.0024731
10 3 0.06854568 0.06 0.9 0.90607258 0.00607258 11 2 0.04312146 0.04 0.94 0.94919405 0.00919405 12 1 0.02486671 0.02 0.96 0.97406076 0.01406076 13 0 0.01323674 0 0.96 0.9872975 0.0272975 14 1 0.00654273 0.02 0.98 0.99384023 0.01384023 15 1 0.00301838 0.02 1 0.99685861 0.00314139
Como la máxima diferencia es 𝑴𝑫 = 𝟎. 𝟎𝟒𝟏𝟓𝟐𝟕𝟔, comparando en tablas para
un nivel de significancia del 5% y para n = 50, tenemos que:
0.0415276 < 0.18841
por lo que no se rechaza la hipótesis de que los datos siguen una distribución
Poisson.
Gráfica de la probabilidad esperada:
Por lo tanto el modelo que se propuso 𝑷𝒐𝒊𝒔𝒔𝒐𝒏 (𝟔. 𝟗𝟐) no puede refutarse y
por lo tanto, puede considerarse adecuado.
Segunda propuesta:
Se propone el Modelo Binomial.
En esta distribución, empezamos por agrupar los datos en intervalos, entonces:
√𝟓𝟎 = 𝟕. 𝟎𝟕 ≈ 𝟕 intervalos.
Intervalo Frecuencia
1-3 3 3-5 4 5-7 18 7-9 14
9-11 6 11-13 3 13-15 2
Histograma de Frecuencias.
a) Calculamos la media y la varianza.
Medía= 𝜇 = 6.92 Varianza: 𝜎2 = 48
Desviación estándar 𝜎 = 6.92
Como nota, para calcular la frecuencia esperada se puede utilizar la distribución normal estándar y estandarizar la propuesta, suponiendo un intervalo [𝑥1, 𝑥2] , entonces se sustituirán x, por 𝑥1, para obtenerse un 𝑧1, y se obtendrá un 𝑧2 al sustituir x por 𝑥2 [𝑧1, 𝑧2], y de aquí se busca en la tabla de la normal para ir encontrando el valor de 𝑧1.
𝒛 =𝒙 − 𝝁
𝝈
𝑥 𝑧
𝑃(𝑧) 𝑃(𝑧𝑛 − 𝑧𝑛−1)
1 -0.828828829 0.2061 0.0954 3 -0.528528529 0.3015 0.1075 5 -0.228228228 0.409 0.1189 7 0.072072072 0.5279 0.1164
9 0.372372372 0.6443 0.1043 11 0.672672673 0.7486 0.0854 13 0.972972973 0.834 0.0657
15 1.273273273 0.8997
b) El ajuste de los datos utilizando la prueba de bondad de ajuste 2. Para obtener las frecuencias esperadas, multiplicamos los resultados obtenidos por 50, cuyos resultados integramos en la siguiente tabla:
TABLA DE FRECUENCIAS.
𝐹𝐸 = 𝑛𝑃(𝑧𝑛 − 𝑧𝑛−1) 𝐹𝑂 𝐹𝐸 − 𝐹𝑂 (𝐹𝐸 − 𝐹𝑂)2 (𝐹𝐸 − 𝐹𝑂)2
𝐹𝐸
4.77 5 -0.23 0.0529 0.01109014
5.375 9 -3.625 13.14063 2.4447683
5.945 18 -12.059 145.4194 24.460790
5.82 14 -8.18 66.9124 11.496975
5.215 6 0.789 0.62252 0.1193710
4.27 3 1.27 1.6129 0.3777728
3.285 2 1.285 1.651225 0.50265602
C=39.416338
Luego calculamos con la tabla 𝜒𝑑𝑓,𝛼2 con 𝛼 = 0.05 y al estimarse dos tenemos
que los grados de libertad son: 𝒅𝒇 = 𝒌 −𝒎− 𝟏 = 𝟕 − 𝟐 − 𝟏 = 𝟒.
𝝌𝟎.𝟎𝟓,𝟒𝟐 = 𝟗. 𝟒𝟖𝟖
Por los resultados vemos que:
𝟑𝟗. 𝟒𝟏𝟔𝟑𝟑𝟖 > 𝟗. 𝟒𝟖𝟖
Por lo tanto, se rechaza la hipótesis de que los datos siguen una distribución
binomial normal.
c) El ajuste de los datos utilizando la prueba de Bondad de Ajuste de
Kolmogorov – Smirnov.
Calculamos las probabilidades acumuladas observadas y esperadas,
para realizar la prueba K-S, por facilidad, nos apoyamos con Geogebra; al
realizamos la comparación , y vemos que la máxima diferencia es
𝑴𝑫 = 𝟎. 𝟒𝟎𝟏𝟖, con un nivel de significancia del 5 % y para n = 50 datos,
se tiene que 0.4018 > 0.18841 y por tanto se rechaza la hipótesis del
modelo probabilístico propuesto.
Gráfica de probabilidad esperada.
CONCLUSIÓN.
Estas dos propuestas las propuse, por la razón de que se nos están dando datos reales, el conteo de ocurrencias es aleatorio y al considerar los datos como discretos, podemos utilizar la distribución de Poisson, pues en ésta, los criterios que se siguen es que, el número de éxitos que ocurren por unidad de tiempo ocurren al azar y cada intervalo de tiempo suele ser independiente de otro intervalo dado ( recordando que el proceso de Poisson no tiene memoria), además, la probabilidad de que más de un resultado ocurra en un intervalo es muy cercana a cero, por lo cual, pudimos apreciar que para este modelo no se rechazaron las pruebas de hipótesis y los datos siguen esa distribución, lo cual no ocurre con la distribución binomial, aunque muchas veces, esta distribución tiende a converger a la distribución de Poisson , cuando el parámetro n tiende a infinito y el parámetro p, tiende a ser cero; por lo cual, concluyo que el Modelo de Poisson es el adecuado para esta aplicación.
AUTORREFLEXIÓN I.
1. Ejemplo. Un laboratorio aplica una encuesta para conocer el número de
productos farmacéuticos defectuosos por día, en los Laboratorios Yamuni,
en un periodo de 47 dias.
2. En el siguiente enlace elabora un resumen de tu aplicación y coloca
DOS diapositivas con tu resumen:
https://docs.google.com/presentation/d/1sgUnqT_3cdTT1WZ6GGy3rcsRFEOqrwa6qX
-Vq7k2S38/edit?usp=sharing
3. Responde las siguientes preguntas:
a. ¿Cuál es la utilidad de esta unidad en mi vida cotidiana?
Sinceramente, estoy gratamente sorprendida de la enorme relevancia que
tiene conocer este tipo de Modelos, los cuales podemos asociar casi con
cualquier tipo de fenómeno que se nos presente, como lo pudimos
constatar en cada uno de los ejercicios propuestos en las actividades y en la
evidencia de aprendizaje; creo que resulta de gran utilidad tanto en la vida
cotidiana, como en el plano profesional, pues creo que el conocimiento y
dominio de esta materia constituye un gran apoyo y seguramente la
podremos aplicar al llevar a cabo nuestro proyecto profesional, y en
cualquier área que pretendamos realizarlo, ya sea, si se trata de algún
proyecto industrial, de tipo financiero, logístico, administrativo, matemático,
físico, etc. por lo que ratifico, que es muy importante contar con esta
habilidad, de conocer, no sólo sobre los tipos de distribuciones presentadas,
esto es, cuando debamos representar el comportamiento de valores
aleatorios, sino también, el saber comparar los resultados, para saber si
nuestro modelo propuesto, se ajusta bien o no, a las observaciones
realizadas, como lo aprendimos en las pruebas de bondad de ajuste Ji-
cuadrado y la prueba de Kolmogorov-Smirnov.
.
b. ¿Qué me falta para mejorar mi aprendizaje de esta unidad?
Lo que siento que hace falta para mejorar mi aprendizaje, es continuar
desarrollando este tipo de ejercicios e implementarlos en el programa R o
Minitab, ya que considero, complementa mucho lo aprendido, aunque ello
conlleva dedicarle muchas horas más en el aprendizaje de la programación,
que por hoy, me es muy difícil por cuestiones de tiempo y trabajo, pero que
en mis tiempos libres, me empeñaré en conseguirlo; en cuanto al contenido
nuclear, es cuestión de seguir retroalimentándose cuando surjan dudas y
seguir dedicándole toda nuestra atención, para absorber todos los demás
conocimientos que son muchos y nos quedan por aprender.
c. ¿Qué hago qué me facilita mi aprendizaje?
Considero que el sentido de la responsabilidad, el compromiso conmigo
misma por tratar de aprender cada día y aunque las cosas parezcan difíciles
o imposibles, tratar de ir despejando las lagunas que se nos forman,
mediante el estudio y la preparación para cada cosa que me proponga.
UNIDAD 2.TEORÍA DE COLAS. Actividad 1. Modelos de colas.
INTRODUCCIÓN.
El estudio de líneas de espera, llamado teoría de colas, es una de las
técnicas de análisis cuantitativo más importante y que se utiliza con mucha
frecuencia, ya que proporciona tanto una base teórica del tipo de servicio
que podemos esperar de un determinado recurso, como la forma en la
cual dicho recurso puede ser diseñado para proporcionar un
determinado grado de servicio a sus clientes.
Las mayoría de los problemas de líneas de espera, se centran en la
cuestión de encontrar el nivel ideal de servicio que debería proporcionar
una empresa; los supermercados deben decidir cuántas cajas registradoras
tener abiertas, las estaciones de gasolina, tienen que decidir cuántas
bombas de servicio abrir y cuántos empleados asignar al turnos, las plantas
de manufactura, deben determinar el número óptimo de mecánicos que
tienen que cubrir cada turno, para reparar las máquinas que se
descomponen, los bancos deben decidir cuántas ventanillas o cajas
mantener funcionando para atender a los clientes, durante los diversos
horarios del día. Cuando una organización en verdad, tiene el control, por
lo general, su objetivo es encontrar, un punto medio entre los dos extremos.
Por un lado, una organización puede tener un gran número de personal y
ofrecer muchas instalaciones de servicio, tales factores, suelen dar como
resultado, un excelente servicio al cliente y que rara vez, hay más de una o
dos personas en una cola.
La teoría de colas es así, el estudio matemático del comportamiento de
líneas de espera y se presenta cuando los “clientes” llegan a un “lugar”
demandando un servicio a un “servidor”, el cual tiene una cierta capacidad
de atención. Si el servidor no está disponible inmediatamente y el cliente
decide esperar, entonces se forma la línea de espera. Los modelos sirven
para encontrar un buen compromiso entre costes del sistema y los tiempos
promedio de la línea de espera para un sistema dado. A continuación se
muestra un estudio de la teoría de las colas, su clasificación, características
y ejemplos de aplicación.
Realiza un mapa conceptual para cada uno de los siguientes modelos de
colas; muestra al menos dos ejemplos de la vida real para cada uno de ellos.
Ingresa al foro y preséntalos a tus compañeros(as). Revisa los mapas de tres
de ellos y, si es posible, enriquece su trabajo, explicando tus propuestas.
1) MODELO MARKOVIANO (M/M/C) (D/N/F).
Caracterizados por la interrupción de entradas al sistema cuando este
llega a un cierto estado y cuyo impedimento para entrar puede tener causas
atribuibles al sistema como la falta de espacio, o bien a los clientes como en el
caso, por ejemplo, de que todos los clientes potenciales se encuentren dentro
del sistema y no exista la posibilidad de que llegue otro cliente. En todos los
casos, los sistemas que pueden ser representados mediante un modelo de
capacidad finita se resuelven mediante la aplicación directa de las ecuaciones
generales, gracias al hecho de que es posible evaluar numéricamente el
promedio ponderado de la longitud promedio de la fila o la longitud promedio
de clientes en el sistema.
Ejemplo de Modelos (M/M/c) (d/N/f)
1. Dos compañías de taxis atienden a una comunidad. Cada empresa posee 2
taxis y se sabe que ambas compañías comparten el mercado casi
Modelo Markoviano
(M/M/c)(d/N/f)
La distribución de probabilidades del
tiempo entre llegadas es potencial
a=M
La distribución de probabilidades del tiempo de servicio
es exponencial
b=M
c= Es el número de servidores (finito)
d= Es el orden de atención a los
clientes
(finito)
e= Es el número máximo de clientes
que soporta el sistema (finito)
f=Es el número de clientes
potenciales del sistema en líneas de espera (finito)
igualmente, las llamadas llegan a cada compañía a una tasa de 8 por hora,
el tiempo promedio de viaje es de 12 minutos las llamadas llegan de
acuerdo con una distribución de Poisson y el tiempo de viaje es
exponencial. Recientemente las 2 compañías fueron compradas por un
inversionista para proporcionar un servicio más rápido a los clientes. Si no
es posible comprar más taxis y se pretende reducir el tiempo de espera, lo
que se consigue cuando la oficina despachadora informe a los clientes
nuevos, de un potencial retraso excesivo una vez que la lista llega a 6,
investigue la factibilidad de que ese consejo sea seguido (consolidar o no).
2. Una sala de espera tiene capacidad para 3 personas, las personas arriban al
sistema de acuerdo con una tasa de 8 por hora con distribución Poisson y
son atendidas por una recepcionista en 10 minutos con distribución
Exponencial. Si alguien llega , y el sistema está lleno se retira sin entrar.
2) MODELO MARKOVIANO (M/M/C) (D/∞/∞).
A diferencia de los modelos anteriores, la solución para estos casos hace
necesaria la utilización de series geométricas ya que la distribución de
probabilidad de estado estable no tiene límite superior en cuanto a la
capacidad del sistema. En este modelo la tasa promedio de entrada sea
estrictamente inferior a la capacidad promedio de servicio.
Ejemplo de Modelos (M/M/c) (d/ ∞/ ∞)
1. En un cinema de la ciudad, con dos servidores, con tiempo entre
llegadas que sigue una distribución exponencial y tiempo de atención
exponencial con n servidores, orden de servicio al cliente 2, infinitos
clientes que soportan el sistema y clientes potenciales del sistema de
línea en espera. Si uno llega al sistema y se encuentra con que todos los
servidores están ocupados, se forma en una fila común hasta ser
atendido bajo el criterio FCFS.
2. La llegada de barcos al muelle de un puerto, sigue una distribución
Poisson con una tasa promedio de 20 barcos/semana. El muelle cuenta
con 3 espacios para las labores de descarga y en cada espacio hay una
grúa, con la cual es posible realizar las labores de descarga en 1 día con
distribución exponencial. Si un barco llega y los espacios están
ocupados, espera en mar abierto hasta que llegue su turno de descarga.
Modelo Markoviano
(M/M/c)(d/∞/∞)
La distribución de probabilidades del
tiempo entre llegadas es potencial
a=M
La distribución de probabilidades del tiempo de servicio
es exponencial
b=M
c= Es el número de servidores
(finito)
d= Es el orden de atención a los
clientes
(finito)
e= Núm. máximo de clientes que
soporta el sistema (infinito)
f=Núm. de clientes potenciales del
sistema en línea de espera
(infinito)
Considerando semanas de 7 días se determinará el tiempo promedio de
espera de un barco desde que llega al puerto hasta que empieza a ser
descargado.
3) MODELO NO MARKOVIANO (M/G/1) (D/∞/∞).
En este modelo utiliza el análisis de líneas de espera por medio de cadenas de
Markov y desemboca en la obtención de la fórmula conocida como la
ecuación de Pollaczek-Khintchine:
Ejemplo de Modelos (M/G/1) : (d/ ∞/ ∞)
1. En un sistema de colas con dos servidores las llegadas siguen una
distribución Poisson con media de 20 usuarios por hora, mientras que el
tiempo de servicio es en promedio de 5 minutos por cliente ;si un
cliente llega al sistema y se encuentra con que todos los servidores
Modelo No Markoviano
(M/G/1)(d/∞/∞)
Existen tiempos de
llegada exponenciales
con tasa media λ.
a=M Tiempo de
servicio independiente e idénticamente
distribuido, cualquier clase.
b=G
S=Cuenta con s servidores que atienden a un
núm. ilimitado de clientes
potenciales en orden
determinado, con media E(t) y Var
V(t) d= Es el orden de atención a
los clientes
(finito)
e= Núm. máximo de clientes que soporta el
sistema (infinito)
f=Núm. de clientes
potenciales del sistema en
línea de espera
(infinito)
están ocupados, se forma en una fila común hasta ser atendido bajo el
criterio FCFS.
2. Un lava coches recibe 6 autos por hora según una distribución
exponencial. El empleado lava el carro que va llegando y se estaciona
en la estación de servicio. El lavacoches lava un carro en 10 minutos de
manera constante.
4) MODELO NO MARKOVIANO (M/G/S) (D/∞/∞).
Para este modelo se considera un conjunto de S servidores atendiendo a un
número ilimitado de clientes potenciales; no existe limitación sobre la
capacidad del sistema por lo que es preciso mantener p < 1 para lograr el
estado estable. Las llegadas siguen una distribución de probabilidad Poisson
mientras que el servicio es de tipo general con media E(f) y variancia V(t). Las
fórmulas para este modelo son:
Modelo No Markoviano
(M/G/S)(d/∞/∞)
Existen tiempos de
llegada exponenciales
a=M Tiempo de servicio
independiente e idénticamente distribuido,
cualquier clase.
b=G
S= Número de servidores
(finito)
d= Es el orden de
atención a los clientes
(finito)
e= Núm. máximo de clientes que soporta el sistema
(infinito)
f=Núm. de clientes
potenciales del sistema en línea de
espera
(infinito)
Ejemplo de Modelos (M/G/S) : (d/ ∞/ ∞)
1. En una fábrica hay dos personas encargadas de colocar un sello de
cierta marca a los artículos que ahí se fabrican. Las llegadas de los
artículos ocurren con media de 20 por hora siguiendo una distribución
de Poisson mientras que las personas ponen los sellos de uno por uno
de manera constante según van entrando los artículos al sistema.
2. En un supermercado tienen siempre 3 cajas abiertas durante 10 horas de
trabajo al día. En promedio se atienden a 5 clientes por hora y el
servicio en promedio es de 5 minutos por cliente con una varianza de
llegada por cliente de 0.02. La persona que llega primero es atendida
primero y puede decidir entre las 3 cajas abiertas.
5) MODELO NO MARKOVIANO (G/G/1) (D/∞/∞).
Para este modelo, se tiene un servidor y no hay un límite superior en cuanto al
número de clientes potenciales, así como tampoco sobre la capacidad del
sistema. Dadas estas condiciones el estado estable se conserva si y sólo si p <
1. El tiempo entre llegadas y el tiempo de servicio son distribuciones
generales con media E(f) y varianza V(t). Las fórmulas siguientes se usan
ampliamente para la modelación de sistemas conectados en red, teniendo en
cuenta que el manejo de la variabilidad y la conectividad entre cada elemento
de la red se debe realizar.
Ejemplo de Modelos (G/G/1) : (d/ ∞/ ∞)
1. El tiempo entre llegadas de clientes a una oficina de Hacienda con un
asesor sigue una distribución normal, donde se sigue que la asesoría
dura aproximadamente 20 minutos con una desviación estándar de 0.2
horas.
2. En un despacho de contadores, hay sólo un contador que recibe a
clientes según una distribución Erlang de parámetros 𝜇 = 0.5 y
𝑘 = 0.2. El contador atiende a cada cliente en un promedio de 2 horas
con desviación estándar de 0.5 horas y atiende al que llega primero.
Modelo No Markoviano
(G/G/1)(d/∞/∞)
Tiempo entre llegadas son distribuciones generales con media
E(t) y Var V(t)
a=G Tiempo de servicio, son distribuciones generales.
b=G
c= Cuenta con un servidor.
(finito)
d= Es el orden de
atención a los clientes
(finito)
e= Núm. máximo de clientes que soporta el sistema
(infinito)
f=Núm. de clientes
potenciales del sistema en línea de
espera
(infinito)
Modelo (𝑴/𝑮/𝟏)(𝒅 / ∞ / ∞)
𝑴: descripción del proceso de llegada Distribución de poisson.
Número de clientes potenciales
𝑮: Distribución del tiempo de servicio Cualquier tipo de distribución.
Independiente
𝟏: una sola cola o fila.
𝒅: orden de atención de los clientes. FCFS: primeras entradas, primeros servicios
LCFS: últimas entradas, primeros servicios
SIRO: elección aleatoria de servicio
PR: servicio por prioridades
GD: Orden general
∞: número máximo de clientes que soporta el sistema.
cantidad infinita en la fila y siendo atendidos
∞: número de clientes potenciales del sistema de líneas de espera infinita
Modelo (𝑴/𝑮/𝑺)(𝒅 / ∞ / ∞)
𝑴: descripción del proceso de llegada Distribución de poisson
Número de clientes potenciales
𝑮: Distribución del tiempo de servicio Cualquier tipo de distribución.
Independiente
𝑺: Cantidad de servidores numero de cola o fila.
𝒅: orden de atención de los clientes. FCFS: primeras entradas, primeros servicios
LCFS: últimas entradas, primeros servicios
SIRO: elección aleatoria de servicio
PR: servicio por prioridades
GD: Orden general
∞: número máximo de clientes que soporta el sistema.
cantidad infinita en la fila y siendo atendidos: 𝝆<𝟏 ∞: número de clientes potenciales del sistema de líneas de espera infinita
Modelo (𝑮/𝑮/𝟏)(𝒅 / ∞ / ∞)
𝑮: descripción del proceso de llegada Distribución Erlang
Número de clientes potenciales
𝑮: Distribución del tiempo de servicio Cualquier tipo de distribución.
Independiente
𝟏: una sola cola o fila.
𝒅: orden de atención de los clientes. FCFS: primeras entradas, primeros servicios
LCFS: últimas entradas, primeros servicios
SIRO: elección aleatoria de servicio
PR: servicio por prioridades
GD: Orden general
∞: c número máximo de clientes que soporta el sistema.
6) MODELOS MARKOVIANOS PRESENTADOS EN LA UNIDAD.
Distribución
tiemposde
llegada
Distribución
tiempo de
servicio
Servidore
s
Orden de
atención
Capacidad
del sistema
Número de
clientes
potenciales
MARKO
VIANOS
(M/M/c)(d/N/f) Exponencial Exponencial X número Cualquiera
de los
estudiados
finito Finito.
(M/M/c)(d/∞/∞) Exponencial Exponencial X número Cualquiera
de los
estudiados
ilimitado Infinito
NO
MARKO
VIANOS
(M/G/1)(d/∞/∞) Exponencial General Sólo 1 Cualquiera
de los
estudiados
ilimitado Infinito
(M/G/S)(d/∞/∞) Exponencial General S
servidore
s
Cualquiera
de los
estudiados
ilimitado Infinito
(G/G/1)(d/∞/∞) General General Sólo 1 Cualquiera
de los
estudiados
ilimitado Infinito
CONCLUSIONES.
Con esta actividad, basada en la clasificación de los Modelos de Kendall-
Lee, podemos observar que la teoría de colas, viene siendo un instrumento
que aporta las soluciones para encontrar el punto preciso donde no exista
lentitud en el servicio que se presta y que además, es una herramienta que
utiliza fórmulas analíticas, limitadas por suposiciones matemáticas cuya
finalidad es contribuir, con datos importantes o con la información esencial, a
que nos ayuden en la toma de decisiones, cuando existe información que se
puede ver alterada por distintos factores, y es ahí donde las características de
la línea de espera son vitales.
Analiza cada uno de los siguientes casos y clasifícalos según Kendall-Lee,
además especifica si se trata de modelos markovianos o no. Explica en cada caso
tu respuesta.
Sistemas de colas formados en…
cantidad infinita en la fila y siendo atendidos: 𝝆<𝟏 ∞: número de clientes potenciales del sistema de líneas de espera infinita
1)Un banco con tiempo entre llegadas con distribución Poisson y tiempo de
servicio con distribución exponencial.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es de Poisson o Exponencial, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La Distribución de tiempo de servicio es
exponencial por lo tanto:
𝐛 = 𝐌
El número de servidores en el sistema. El número corresponde a la cantidad de
cajas que atienden, por tanto:
𝐜 = 𝐟𝐢𝐧𝐢𝐭𝐨
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, por tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de clientes en el
sistema
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales.
𝐟 = ∞
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝐜)(𝐅𝐂𝐅𝐒/∞/∞)
2) Un centro comercial con tiempo entre llegadas con distribución exponencial y
tiempo de atención constante.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es de Poisson o Exponencial, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La Distribución de tiempo de servicio es
de tipo constante o determinista, por lo
tanto:
𝐛 = 𝐃
El número de servidores en el sistema. El número corresponde a la cantidad de
cajas que brindan atención al público,
por lo tanto:
𝐜 = 𝐟𝐢𝐧𝐢𝐭𝐨
La orden de atención a los clientes Es de orden general, no importa cuando
llegan, sino cuando se atienden, por
tanto:
𝐝 = 𝐎𝐆
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de clientes.
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema.
𝐟 = ∞
Como tenemos que la distribución del tiempo de servicio es constante.
Por lo tanto, se trata de un Modelo No Markoviano de la forma:
(𝐌/𝐃/𝐜) (𝐎𝐆/∞/∞).
3) Un servidor de Internet con tiempo entre llegadas con distribución Poisson y
tiempo de servicio constante.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del La distribución de tiempo de entradas
tiempo entre llegadas. es de Poisson o Exponencial, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio
es de tipo constante o determinista, por
lo tanto:
𝐛 = 𝐃
El número de servidores en el sistema. El número de servidores en el sistema,
es finito, por tanto:
𝐜 = 𝟏
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, por tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de los servidores.
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por tanto:
𝐟 = ∞
Al tener una distribución de tiempo de servicio, constante o determinista.
Por lo tanto, se trata de un Modelo No Markoviano de la forma:
(𝐌/𝐃/𝐜) (𝐅𝐂𝐅𝐒/∞/∞).
4) Un cibercafé con 20 máquinas disponibles con tiempo entre llegadas con
distribución exponencial y distribución de probabilidad del tiempo de servicio
exponencial.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del La distribución de tiempo de entradas
tiempo entre llegadas. es de Poisson o Exponencial, por lo
tanto, tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio es
exponencial , por lo tanto:
𝐛 = 𝐌
El número de servidores en el sistema. El número de servidores en el sistema,
son las 20 máquinas disponibles en el
cibercafé, por lo tanto:
𝐜 = 𝟐𝟎
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, por lo
tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de clientes que se
pueden atender en el cibercafé.
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por lo tanto:
𝐟 = ∞
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝟐𝟎)(𝐅𝐂𝐅𝐒/∞/∞)
5) Un lavado de autos con cinco estaciones de servicio y tiempo entre llegadas
con distribución Poisson si el tiempo de servicio sigue una distribución
constante.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del La distribución de tiempo de entradas
tiempo entre llegadas. es de Poisson o Exponencial, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio es
de tipo constante o determinista, por lo
tanto:
𝐛 = 𝐃
El número de servidores en el sistema. El número de servidores en el sistema,
son las 5 estaciones de servicio para
lavar los autos.
𝐜 = 𝟓
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, por tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de autos que los
clientes llevan al lavado, por tanto:
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por lo tanto:
𝐟 = ∞
Al tener una distribución de tiempo de servicio, constante o determinista.
Por lo tanto, se trata de un Modelo No Markoviano de la forma:
(𝐌/𝐂/𝟓)(𝐅𝐂𝐅𝐒/∞/∞)
6) Un consultorio médico en el que se atiende sólo a 10 personas por día, por un
médico, y tiempo entre llegadas con distribución Poisson y tiempo de servicio
con cualquier tipo de distribución.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es de Poisson o Exponencial, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución del tiempo de servicio,
es de cualquier tipo, por tanto:
𝐛 = 𝐆
El número de servidores en el sistema. El número de servidores en el sistema,
es atendido por un solo médico, por
tanto:
𝐜 = 𝟏
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, por tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es 10,
debido a que la capacidad de atención,
son de 10 pacientes por día, por tanto:
𝐞 = 𝟏𝟎
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por lo tanto:
𝐟 = ∞
Al tener una distribución de tiempo de servicio, constante o determinista.
Por lo tanto, se trata de un Modelo No Markoviano de la forma:
(𝐌/𝐆/𝟏)(𝐅𝐂𝐅𝐒/𝟏𝟎/∞)
7) El tráfico vehicular en una avenida con tres carriles en un solo sentido y
tiempo entre llegadas con distribución exponencial, además tiempo de
servicio con cualquier tipo de distribución.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del La distribución de tiempo de entradas
tiempo entre llegadas. es de Poisson o Exponencial, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución del tiempo de servicio,
es de cualquier tipo, por tanto:
𝐛 = 𝐆
El número de servidores en el sistema. El número de servidores en el sistema,
son los 3 carriles en un solo sentido,
por lo tanto:
𝐜 = 𝟑
La orden de atención a los clientes Es de orden general, pues puede variar,
si uno de los autos ingresa al otro carril
por alguna otra entrada a la avenida.
𝐝 = 𝐎𝐆
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, debido a que no se hace
mención de la capacidad máxima de
autos que circulan, por tanto:
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales que pueden circular por la
avenida, por lo tanto:
𝐟 = ∞
Al tener una distribución de tiempo de servicio, de cualquier tipo.
Por lo tanto, se trata de un Modelo No Markoviano de la forma:
(𝐌/𝐆/𝟑)(𝐎𝐆/∞/∞)
8) A un sistema en el que se atienden según el orden primeras entradas-
primeros servicios, ingresan 12 clientes por hora con un proceso Poisson.
Cuenta con cuatro servidores que realizan la prestación del servicio de
acuerdo con una distribución exponencial con media de 20 minutos por
transacción. Debido a sus pequeñas instalaciones y al corto horario de
servicio, éstas sólo aceptan un máximo de 200 clientes, los cuales, al ingresar,
forman una fila común si encuentran todos los servidores ocupados.
Asimismo, tienen un total 380 clientes potenciales.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es de Poisson o Exponencial de 12
clientes que ingresan por hora, por lo
tanto tenemos que el parámetro es:
𝐚 = 𝐌.
La distribución del tiempo de servicio La Distribución de tiempo de servicio es
exponencial por lo tanto:
𝐛 = 𝐌
El número de servidores en el sistema. El número de servidores en el sistema,
se refiere a los 4 servidores que realizan
la prestación, por tanto:
𝐜 = 𝟒
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, por tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número de clientes que se aceptan
como máximo son 200, por lo tanto:
𝐞 = 𝟐𝟎𝟎
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad de clientes potenciales del
sistema en línea de espera es 380, por
lo tanto:
𝐟 = 𝟑𝟖𝟎
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝟒)(𝐅𝐂𝐅𝐒/𝟐𝟎𝟎/𝟑𝟖𝟎)
9) Un sistema en el que se atienden, según un orden aleatorio, ingresan 21
clientes por hora con un proceso Poisson. Cuenta con seis servidores que
realizan la prestación del servicio de acuerdo con una distribución
exponencial con media de 28 minutos por transacción. El sistema referido
acepta infinito número de clientes, los cuales al ingresar forman una fila
común si encuentran a todos los servidores ocupados. Asimismo, hay un
número infinito de clientes potenciales.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es Poisson o Exponencial de 21 clientes
que ingresan por hora, por lo tanto
tenemos que el parámetro es: 𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio es
exponencial de 28 minutos por
transacción, por lo tanto:
𝐛 = 𝐌
El número de servidores en el sistema. El número de servidores en el sistema,
son 6, que realizan la prestación del
servicio, por tanto:
𝐜 = 𝟔
La orden de atención a los clientes El orden es aleatorio, por tanto:
𝐝 = 𝐒𝐈𝐑𝐎
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de clientes que se
pueden atender en el cibercafé
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por lo tanto:
𝐟 = ∞
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝟔)(𝐅𝐂𝐅𝐒/∞/∞)
10) Una sala de urgencias de un hospital recibe a 17 pacientes por hora con una
distribución exponencial y los ingresa a hospitalización según la gravedad de
la situación. Si cuenta con una recepcionista que brinda el servicio inicial en
un promedio de cuatro pacientes con una distribución exponencial con media
de 15 minutos por transacción. El número de personas que ingresa al referido
nosocomio no se puede limitar, y el número de clientes potenciales se puede
considerar infinito. Si algún paciente llega y encuentra que las recepcionistas
se encuentran ocupadas, debe hacer cola para esperar atención.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es Poisson con 17 pacientes que
ingresan por hora, por lo tanto tenemos
que el parámetro es: 𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio es
exponencial de 15 minutos por
transacción, por lo tanto:
𝐛 = 𝐌
El número de servidores en el sistema. El número de servidores es 1, ya que
sólo hay una recepcionista que atiende,
por lo tanto: 𝐜 = 𝟏
La orden de atención a los clientes La orden de atención a los clientes
consiste en dar prioridad según la
gravedad del paciente, por tanto:
𝐝 = 𝐏𝐑
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se niega el
servicio a quien lo necesite, por lo
tanto: 𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por lo tanto:
𝐟 = ∞
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝟏) (𝐏𝐑/∞/∞).
11) Un aeropuerto de mantenimiento cuenta con una capacidad para 15 aviones y
recibe ingresos de 25 aviones por hora con un proceso exponencial. Cuenta
con cinco mecánicos que brindan el servicio con una distribución exponencial
con promedio de 45 minutos por aeronave. Si todos los servidores se
encuentran ocupados, los aviones deben aterrizar en el sitio de espera, siendo
atendidos según el orden de llegada. Asimismo, si las instalaciones rebasan su
capacidad, ya no se aceptan más clientes.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es Exponencial de 25 aviones por hora,
por lo tanto tenemos: 𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio es
exponencial con promedio de 45 min.
por aeronave, por lo tanto: 𝐛 = 𝐌
El número de servidores en el sistema. El número de servidores en el sistema,
son los 5 mecánicos que brindan el
servicio, por lo tanto: 𝐜 = 𝟓
La orden de atención a los clientes El orden corresponde a primeras
entradas, primeros servicios, aunque si
hay línea de espera, los aviones deben
estacionarse y esperar su turno, por
tanto: 𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema en el
área de mantenimiento son 15 aviones,
por tanto: 𝐞 = 𝟏𝟓
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad de clientes potenciales del
sistema de la línea de espera es 25, por
lo tanto: 𝐟 = ∞
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝟓) (𝐅𝐂𝐅𝐒/𝟏𝟓/𝟐𝟓).
12) A un determinado banco llegan los clientes de acuerdo con un proceso
Poisson con media de seis por minuto. Asimismo cuenta con siete cajeros
para brindar la atención éstos, quienes, si llegan y encuentran a todos los
servidores ocupados, se forman en una fila común. El tiempo de servicio se
comporta como una distribución exponencial con media de 1.5 minutos por
cliente. El orden de atención es FCFS.
Sistema de colas según Kendall-Lee.
La distribución de probabilidad del
tiempo entre llegadas.
La distribución de tiempo de entradas
es Poisson o Exponencial de 6 clientes
que ingresan por minuto, por lo tanto
tenemos que el parámetro es: 𝐚 = 𝐌.
La distribución del tiempo de servicio La distribución de tiempo de servicio es
exponencial con media de 1.5 minutos
por cliente, por lo tanto: 𝐛 = 𝐌
El número de servidores en el sistema. El número de servidores en el sistema,
son 6 cajeros, que brindan atención al
público, por tanto: 𝐜 = 𝟔
La orden de atención a los clientes La orden de atención a los clientes:
Notamos que es FCFS : a razón de que
si todas las cajeros están ocupados se
forman en fila común y conforme
lleguen serán atendidos, por lo tanto:
𝐝 = 𝐅𝐂𝐅𝐒
La capacidad máxima de clientes en el
sistema
El número que soporta el sistema es
infinito, dado que no se menciona la
capacidad máxima de clientes que se
pueden atender en el cibercafé es:
𝐞 = ∞
La cantidad de clientes potenciales del
sistema de la línea de espera
La cantidad es infinita, dado que no se
menciona la cantidad de clientes
potenciales del sistema, por lo tanto:
𝐟 = ∞
Cuando los clientes ingresan al sistema y encuentran todos los servidores
ocupados, se forman en una fila común.
Por lo tanto, se trata de un Modelo Markoviano de la forma:
(𝐌/𝐌/𝟔)(𝐅𝐂𝐅𝐒/∞/∞)
EVIDENCIA DE APRENDIZAJE. Aplicación de un modelo de colas para solución
de problemas.
Introducción.
El estudio de la teoría de colas, es una de las técnicas del análisis
cuantitativo, la cual es ampliamente utilizada en los sucesos de la vida
diaria, y que incluye a todas las personas quienes formamos parte de la
vida activa y acostumbramos a realizar varias acciones como ir a una
estación de gasolina a cargar combustible, ir a un supermercado a surtir
despensa, a realizar depósitos en el banco o sacar dinero del cajero
automático, pagar teléfono, luz, agua, hacer fila para comprar boletos de
autobuses o incluso cuando tratamos de salir de algún estacionamiento,
mientras se levanta la pluma, al insertar el ticket y avanzar.
El estudio de las líneas de espera, tiene tres componentes básicos de un
proceso de colas, que vienen siendo las llegadas, las instalaciones de
servicio y la línea de espera real y en sí, la mayor parte de los problemas
de dichas líneas de espera , se enfocan en tratar de dar un buen nivel de
servicio, que debe de proporcionar la empresa a la cual acudimos, es
decir, si vamos a la estación de gasolina, la empresa debe decidir cuáles
bombas de servicio estarán disponibles al cliente, cuántos empleados
estarán cubriendo el turno, etc. es decir, estos son factores que pueden dar
como resultado un excelente servicio al cliente o pueden causar
insatisfacción , lo cual ocasiona que el cliente abandone la fila.
En esta evidencia, resolveremos algunos de esos problemas,
basándonos en la identificación de modelos que desarrolló D.G. Kendall,
que ha sido muy aceptada para especificar el patrón de llegadas, la
distribución del tiempo de servicio, el número de servicios abiertos, la
capacidad máxima de clientes que soporta el sistema y la cantidad de
clientes potenciales del sistema de líneas de espera, todo empleando dicha
notación de Kendall y algunas ecuaciones de colas, que nos ayudan a
describir las características de operación más importantes del sistema de
servicio.
Un número entero positivo N (el número de clientes es infinito)
ELEMENTOS BÁSICOS DE LA TEORÍA DE
COLAS
Qué es?
Un proceso estocástico en el cual la variable aleatoria es el número de transacciones en el sistema en un
momento dado.
PROCESO BÁSICO DE COLAS.
Los clientes que requieren un servicio se generan en una fase de entrada. Estos clientes entran al sistema y se
unen a una cola.
FUENTE DE ENTRADA O POBLACIÓN POTENCIAL
Es un conjunto de individuos (no necesariamente seres vivos) que pueden llegar a
solicitar el servicio en cuestión. Podemos
considerarla finita o infinita.
T
CLIENTE:
Es todo individuo de la población potencial que
solicita servicio. Suponiendo que los
tiempos de llegada de clientes consecutivos son 0 < t1< t2<..., será importante conocer el
patrón de probabilidad según
el cual la fuente de entrada genera clientes.
CAPACIDAD DE LA COLA
Es el máximo número de clientes que pueden
estar haciendo cola (antes de comenzar a
ser servidos). De nuevo, puede
suponerse finita o infinita.
DISCIPLINA DE LA COLA
Es el modo en el que los clientes son seleccionados para ser
servidos. Las disciplinas más habituales son:
FCFS (first come first served): según la cual se atiende primero al cliente que antes haya llegado.
LCFS (last come first served) o pila: que consiste en atender
primero al cliente
SIRO (service in random order), que selecciona a los clientes de
forma aleatoria.
MECANISMO DE SERVICIO
Es el procedimiento por el cual se dá servicio a los clientes que
lo solicitan. Para determinar totalmente el mecanismo de servicio debemos conocer el
número de servidores de dicho mecanismo (si dicho número
fuese aleatorio, la distribución de probabilidad del mismo) y
la distribución de probabilidad del tiempo que le lleva a
cada servidor dar un servicio.
La Cola
Propiamente dicha, es el conjunto de clientes que hacen espera, es decir los
clientes que ya han solicitado el servicio pero que aún no han pasado al mecanismo de servicio.
El Sistema de la Cola
Es el conjunto formado por la cola y
el mecanismo de servicio, junto con la disciplina de la cola,
que es lo que nos indica el criterio de
qué cliente de la cola elegir para pasar al
mecanismo de servicio
MODELOS MARKOVIANOS MODELOS NO MARKOVIANOS. DEFINICIÓN (M/M/c)(FCFS/∞/∞)
(M/M/c)(d/N/f)
(M/G/1)(FCFS/∞/∞)
(M/G/S)(FCFS/∞/∞)
(G/G/1)(FCFS/∞/∞)
CARACTERÍSTICAS
BÁSICAS.
Distribución probabilística de tiempo entre llegadas exponencial .(a) Comportamiento probabilístico de tiempo de servicio exp. (b). Numero de servidores (c) Orden de atención a los clientes FCFS(d) No. máximo de clientes que soporta el sistema es Infinito.(e) No. de clientes potenciales del sistema es infinito. (f)
Distribución probabilística de tiempo entre llegadas exponencial .(a) Comportamiento probabilístico de tiempo de servicio exp. (b). Numero de servidores (c) Orden de atención a los clientes FCFS(d) No. máximo de clientes que soporta el sistema es finito.(e) No. de clientes potenciales del sistema es finito pero no vacío.(f)
Distribución probabilística de tiempo entre llegadas exponencial.(a) Comportamiento probabilístico de tiempo de servicio, cualquier tipo de distribución(b). Numero de servidores (c) Orden de atención a los clientes LCFS(d) No. máximo de clientes que soporta el sistema es infinito.(e) No. de clientes potenciales del sistema es infinito.(f)
Comportamiento probabilístico del tiempo entre llegadas exponencial.(a) Comportamiento probabilístico de tiempo de servicio, cualquier tipo de distribución(b). Numero de servidores: S servidores (c) Orden de atención a los clientes FCFS(d) No. máximo de clientes que soporta el sistema es infinito.(e) No. de clientes potenciales del sistema es infinito.(f)
Comportamiento probabilístico del tiempo entre llegadas cualquier tipo de distribución.(a) Comportamiento probabilístico de tiempo de servicio, cualquier tipo de distribución(b). Numero de servidores : 1 servidor ( c ) Orden de atención a los clientes LCFS(d) No. máximo de clientes que soporta el sistema es infinito.(e) No. de clientes potenciales del sistema es infinito.(f)
FÓRMULAS
BÁSICAS.
Si conocemos la desviación estándar y la media de la distribución de los tiempos de servicio, puede obtenerse fórmula para el valor
de Lq a partir de la siguiente ecuación.
Si utilizamos Lq podemos determinar el valor de L, por medio de la siguiente ecuación:
Al igual que las características de operación de los modelos M / M / 1 y M / S / 1, podemos calcular el tiempo esperado en el sistema de
líneas de espera (W), y el tiempo que se invierte antes de ser atendido (Wq), esto lo podemos realizar por medio de las siguientes
ecuaciones:
En este caso se puede conocer el número de unidades que están esperando a ser atendidas (Lq), a través de la siguiente
ecuación:
Todas las demás características de
operación pueden determinarse a partir de este valor. Podemos determinar el valor de L, por medio de la siguiente ecuación:
Al igual que las características de operación de los modelos M / M / 1 y M / S / 1, podemos
calcular el tiempo esperado en el sistema de líneas de espera (W), y el tiempo que se invierte antes de ser atendido (Wq), esto lo
podemos realizar por medio de las siguientes ecuaciones:
MODELACIÓN ESTOCÁSTICA.
CUATRO CONFIGURACIONES BÁSICAS DEL SISTEMA DE
COLAS.
MODELACIÓN ESTOCÁSTICA.
Resuelve lo siguiente:
1) Ingresa al siguiente enlace:
https://docs.google.com/spreadsheets/d/1uuCfU5DF_sY87EyuegrFsaQD
70XYmRY2_J6APuGnJKY/edit?usp=sharing
Elige un concepto y coloca tu nombre.
NÚMERO PROMEDIO DE CLIENTES EN LA FILA.
En el siguiente enlace desarrolla UNA diapositiva explicando el
concepto puedes explicar con un ejemplo:
https://docs.google.com/presentation/d/1jkDmEkET2IsXEnjtqQrhnaaKt
YA4SHJ5P1bRDznlkmk/edit?usp=sharing
MODELACIÓN ESTOCÁSTICA.
Analiza cada una de las situaciones proporcionadas y realiza lo que se
solicita en cada caso.
2) Banco que ofrece servicio en su automóvil. Un promedio de 9
automóviles por hora llegan a un cajero con un solo servidor que
proporciona servicio sin que uno descienda del automóvil. Suponga
que el tiempo de servicio promedio por cada cliente es 5 minutos y
que tanto los tiempos entre llegadas y los tiempos de servicio son
exponencial.
Solución.
a. Haciendo uso de la clasificación Kendall- Lee clasifica el
problema.
En este sistema, la distribución de probabilidad del tiempo entre
llegadas se define como M exponencial, así como la distribución del
tiempo de servicio; se cuenta con 1 sólo servidor en el sistema, la orden
de atención obedece en atender primero al cliente que llega primero, es
decir, FCFS; la capacidad máxima de clientes en el sistema es 9 , la
cantidad de clientes potenciales del sistema de la línea de espera, es
infinito, dado que no se mencionan.
Por lo tanto, se trata de un Modelo Markoviano
(M/M/1)(FCFS/∞/∞).
Grafo del sistema.
𝟏 − 𝟗∆𝒕
Matriz de transición
…. 0 1 3 2
𝟏 − 𝟐𝟏∆𝒕
𝟏𝟐∆𝒕
𝝀𝟎 = 𝟒𝝀𝟎= 𝟒
𝟏𝟐∆𝒕
𝟏𝟐∆𝒕
𝟏𝟐∆𝒕
𝟗∆𝒕
𝟗∆𝒕
𝟗∆𝒕
𝟗∆𝒕
𝟏 − 𝟐𝟏∆𝒕
𝟏 − 𝟐𝟏∆𝒕
MODELACIÓN ESTOCÁSTICA.
b. ¿Cuál es la probabilidad de que el cajero esté ocioso?
Utilizamos las ecuaciones de colas de acuerdo al modelo propuesto, que
definen las características de operación de la cola.
Sean los datos:
λ = llegan 9 clientes o unidades por hora (60 minutos).
𝜇 = se atiende 1 cliente cada 5 minutos.
Cuando se determina la tasa de llegada λ y la tasa de servicio 𝜇, se debe
utilizar el mismo período, es decir, si λ es el número promedio de
llegadas por hora, entonces 𝜇 debe indicar el número promedio que
podría atenderse por hora.
Para obtener el porcentaje de tiempo ocioso, 𝑷𝟎, es decir, la probabilidad
de que nadie esté en el sistema o el cajero esté ocioso, utilizo la siguiente
fórmula:
𝑷𝟎 = 𝟏 −𝝀
𝝁
Se definen los siguientes datos:
𝝀 = 9𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
ℎ𝑜𝑟𝑎
𝐸(𝑡) = 5𝑚𝑖𝑛
𝑐𝑙𝑖𝑒𝑛𝑡𝑒
MODELACIÓN ESTOCÁSTICA.
Calculamos:
𝝁 =60
𝐸(𝑡)=60
𝑚𝑖𝑛
ℎ𝑟
5𝑚𝑖𝑛
𝑐𝑙𝑖𝑒𝑛𝑡𝑒
= 12𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
ℎ𝑟= 12𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
Sustituimos en la fórmula:
𝑷𝟎 = 1 −9
12=3
12≈ 𝟎. 𝟐𝟗
La probabilidad de que el cajero esté ocioso es del 29%.
c. ¿Cuál es el número promedio de automóviles que están en la
cola del cajero?
Primero se verifica que el sistema puede alcanzar un estado estable,
utilizando el criterio 𝝆 < 𝟏, para éste, se define e factor de utilización
del sistema (la letra griega Rho), esto significa la probabilidad de que se
esté utilizando la instalación de servicio, entonces:
𝝆 =𝝀
𝝁=
𝟗
𝟏𝟐≈ 𝟎. 𝟕𝟓 < 𝟏
Siendo μ =capacidad de servidor y λ̅ =tasa promedio de llegada.
Vemos que el sistema cumple y puede alcanzar un estado estable,
dado que 𝝆 < 𝟏; como E(t) es constante, entonces V(t) = 0.
El número promedio de clientes o unidades en el sistema, L, es decir,
el número en la fila más el número que se está atendiendo, lo
obtengo con la siguiente ecuación:
𝑳 =𝝀
𝝁−𝝀=
𝟗
𝟏𝟐−𝟗= 𝟑 clientes en el sistema
El número promedio de clientes en la cola 𝐋𝐪, lo obtenemos así:
MODELACIÓN ESTOCÁSTICA.
𝑳𝒒 =λ2
𝜇(μ − λ)=
(9)2
12(12 − 9)=81
36≈ 𝟐. 𝟐𝟓 𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔
El número promedio de clientes, que están en la cola del cajero es
de 7.
d. ¿Cuál es la cantidad promedio de tiempo que un cliente pasa
en el estacionamiento (incluyendo el tiempo de servicio)?
Para calcular la cantidad promedio de tiempo que un cliente pasa
en el sistema, lo hacemos por medio de la fórmula:
𝐖 =𝐖𝐪 + 𝐄(𝐭)
Siendo Wq, el tiempo promedio de espera en la cola, entonces
empleamos la siguiente fórmula:
𝐖𝐪 =λ
𝜇(μ − λ)=
9
12(12 − 9)=9 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
36𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
ℎ𝑟.
=1
4 hr. (60
min
hr) = 15 𝐦𝐢𝐧.
Por lo tanto:
𝐖 = 𝐖𝐪 + 𝐄(𝐭) = 𝟏𝟓 𝐦𝐢𝐧 + 𝟓 𝐦𝐢𝐧 = 𝟐𝟎 𝐦𝐢𝐧.
e. ¿Cuántos clientes atenderá en promedio el cajero por hora?
𝑳 =𝜆
(𝜇 − 𝜆)=
9
(12 − 9)= 𝟑 𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔.
El cajero atenderá en promedio a 3 clientes por hora.
f. ¿Cuántos clientes en promedio estarán en el estacionamiento?
𝑳𝒒 =λ2
𝜇(μ − λ)=
(9)2
12(12 − 9)=81
36≈ 𝟐. 𝟐𝟓
MODELACIÓN ESTOCÁSTICA.
Los clientes que en promedio estarán en el estacionamiento
son de 2 a 3 personas.
Agrego además, la probabilidad de que el número de clientes en
el
sistema sea mayor que k, Pn>k, la obtenemos así:
𝑷𝒏>𝒌 = (𝝀
𝝁)
𝒌+𝟏
= (9
12)9+1
= (9
12)10
= 0.056 ≈ 𝟓. 𝟔%
3-(CORRECCIÓN DEL GRAFO Y MATRIZ)
3) Un promedio de 40 automóviles por hora (los tiempos entre llegadas
siguen una distribución exponencial) está tentado a pasar por el
servicio para automovilistas del restaurante Hot Dog King. Si un
total de más de 4 autos están haciendo cola (incluso el auto al que
están atendiendo) un automóvil no entrará a la cola. Se requiere un
promedio de 4 minutos (distribución exponencial) para atender a un
automóvil.
Solución.
a) Haciendo uso de la clasificación Kendall-Lee clasificar el
problema.
En este sistema, la distribución de probabilidad del tiempo entre
llegadas se define como M exponencial, así como la distribución del
tiempo de servicio; se cuenta con 1 servidor en el sistema, que es el
autoservicio del restaurant que atiende a los automovilistas; la orden de
atención obedece en atender primero al cliente que llega primero, es decir,
FCFS; la capacidad máxima de clientes en el sistema es 4, ya que es el
número de automóviles que soporta el sistema y la cantidad de clientes
potenciales del sistema de la línea de espera, es infinito.
Por lo tanto Se trata de un Modelo Markoviano
(M/M/1)(FCFS//∞/∞).
MODELACIÓN ESTOCÁSTICA.
Sean los datos:
𝝀 = 40
𝑬(𝒕) = 𝟒𝒎𝒊𝒏𝒖𝒕𝒐𝒔
𝒄𝒍𝒊𝒆𝒏𝒕𝒆
𝝁 =60𝑚𝑖𝑛
ℎ𝑟
𝐸(𝑡)=60𝑚𝑖𝑛
ℎ𝑟
4𝑚𝑖𝑛
𝑐𝑙
= 𝟏𝟓𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔
𝒉𝒓
Verificamos que el sistema puede alcanzar un estado estable, utilizando
el criterio 𝝆 < 𝟏, para éste, se define el factor de utilización del sistema
(la letra griega Rho), esto significa la probabilidad de que se esté
utilizando la instalación de servicio, entonces:
𝝆 =𝝀
𝝁=
𝟒𝟎
𝟏𝟓=
𝟖
𝟑≈ 𝟐. 𝟔𝟔�̅� > 𝟏
Siendo μ =capacidad de servidor y λ̅ =tasa promedio de llegada.
Vemos que el sistema no cumple, de tal manera que no puede alcanzar
un estado estable, dado que 𝝆 > 𝟏, entonces, procedemos a realizar el grafo
y las matrices de transición.
Grafo del sistema:
𝟏𝟓∆𝒕 𝟏𝟓∆𝒕 𝟏𝟓∆𝒕 𝟏𝟓∆𝒕𝟒= 𝟒𝟎
𝟒𝟎∆𝒕
𝟏 − 𝟒𝟎∆𝒕
𝟒𝟎∆𝒕
𝟒𝟎∆𝒕
𝟒𝟎∆𝒕
𝟏 − 𝟓𝟓∆𝒕 𝟏 − 𝟓𝟓∆𝒕 𝟏 − 𝟓𝟓∆𝒕
0 1 2 3 …
MODELACIÓN ESTOCÁSTICA.
Matriz de transición.
0 0 1 2 3 4 5
0 1-40Δt 40Δt 0 0 0 …
1 15Δt 1-55Δt 40Δt 0 0 …
2 0 15Δt 1-55Δt 40Δt 0 …
3 0 0 15Δt 1-55Δt 40Δt …
4 0 0 0 15Δt 1-55Δt …
5 … … … … … …
b) ¿Cuál es la cantidad promedio de autos que están esperando
atención (No se incluye un vehículo al que están atendiendo)?
Esto es la cantidad promedio de clientes en la fila, es decir 𝐿𝑞 por lo
que primero observamos que 𝜆 = 40 y 𝜇 = 15 ya que si se atiende a
un auto en un promedio de 4 minutos, se atienden a 15 en una hora.
Luego el diagrama de transición sería:
Nuestro sistema de ecuaciones en relación de la matriz de
transiciones se propone así:
𝑃0 = (1 − 40∆𝑡)𝑃0 + (15∆𝑡)𝑃1
𝑃1 = (40∆𝑡)𝑃0 + (1 − 55∆𝑡)𝑃1 + (15∆𝑡)𝑃2
𝑃2 = (40∆𝑡)𝑃1 + (1 − 55∆𝑡)𝑃2 + (15∆𝑡)𝑃3
𝑃3 = (40∆𝑡)𝑃2 + (1 − 55∆𝑡)𝑃3 + (15∆𝑡)𝑃4
⋮
MODELACIÓN ESTOCÁSTICA.
1 = 𝑃0 + 𝑃1 + 𝑃2 +⋯
Resolviendo el sistema de ecuaciones para encontrar las
probabilidades de estado estable.
𝑷𝟏 =𝜆0𝜇1𝑃0 =
8
3𝑃0
𝑷𝟐 =𝜆0𝜆1𝜇1𝜇2
𝑃0 = (8
3)𝑃0
𝑷𝟑 =𝜆0𝜆1𝜆2𝜇1𝜇2𝜇3
𝑃0 = (8
3)2
𝑃0
⋮
𝑷𝒏 = (𝟖
𝟑) 𝒏𝑷𝟎
Calculamos 𝑷𝟎 y sustituimos los valores:
𝑷𝟎 = [1 +8
3+ (
8
3)2
+ (8
3)3
+⋯+ (8
3)𝑛
+⋯]
−1
=
= [1 + 𝜌 + 𝜌2 +⋯+ 𝜌𝑛 +⋯]−1 = [1 +1
1 − 𝜌]−1
= [1 +1
1 − 8/3]−1
=
= [1 +1
−5/3]−1
= (1 −3
5)−1
= (2
5)−1
=𝟓
𝟐= 𝟐. 𝟓
Al obtener este resultado nos dá indicativos de que el sistema no es
estable, pues la probabilidad es mayor que 1 ya que 𝜌 =𝜆
𝜇=
8
3=
2.6 > 1; vemos que el promedio de llegada de los autos es de 40 por
hora y siendo el tiempo de servicio promedio, de 15 por hora,
encontramos un sistema saturado, de tráfico pesado.
c) ¿Cuántos vehículos serán atendidos, en promedio, por hora?
MODELACIÓN ESTOCÁSTICA.
𝝁 =60
𝑚𝑖𝑛
ℎ𝑟
𝐸(𝑡)=60
𝑚𝑖𝑛
ℎ𝑟
4𝑚𝑖𝑛
𝑐𝑙
= 𝟏𝟓𝒄𝒍𝒊𝒆𝒏𝒕𝒆𝒔
𝒉𝒓
Por lo tanto, se atenderán 15 clientes por hora.
d) ¿Cuánto tiempo pasará en promedio un cliente en el restaurante?
En este caso, no se puede determinar, debido a la inestabilidad del sistema,
esto, debido a que tenemos una probabilidad mayor a 1 para 𝑃0 , por tanto,
no es posible calcular 𝐿 ni tampoco el tiempo promedio de espera en el
restaurante, 𝑊 =𝐿
𝜆.
4-(CORRECCIÓN GRAFO Y MATRIZ.)
4) Imagine un banco con dos cajeros. Un promedio de 75 clientes por
hora llegan al banco y esperan a una sola cola que se desocupe algún
cajero. El tiempo promedio que se requiere para atender a un cliente
es 1.5 minutos. Suponga que los tiempos entre llegadas y los tiempos
de servicio son exponenciales. Determinar:
Solución.
a) Haciendo uso de la clasificación Kendall-Lee clasificar el
problema.
En este sistema, la distribución de probabilidad del tiempo entre llegadas
se define como M exponencial, así como la distribución del tiempo de
servicio; se cuenta con 2 servidores en el sistema, que son los cajeros que
atienden a los clientes; la orden de atención obedece en atender primero
al cliente que llega primero, es decir, FCFS; la capacidad máxima de
clientes es infinito , la cantidad de clientes potenciales del sistema de la
línea de espera, es infinito, dado que no se mencionan.
Por lo tanto Se trata de un Modelo Markoviano
(M/M/2)(FCFS/∞/∞).
b) Número esperando de clientes presentes en el banco.
Definimos los datos:
MODELACIÓN ESTOCÁSTICA.
Calculamos 𝝀 , que es la frecuencia de llegadas de Poisson:
𝜆 = 75𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
ℎ𝑟.
𝐸(𝑡) = 1.5 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑐𝑙𝑖𝑒𝑛𝑡𝑒
Para encontrar a 𝝁 se define por medio de la siguiente relación:
𝜇 =60
𝑚𝑖𝑛
ℎ𝑟.
𝐸(𝑡)=
60𝑚𝑖𝑛
ℎ𝑟.
1.5𝑚𝑖𝑛
𝑐𝑙𝑖𝑒𝑛𝑡𝑒
= 40𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
ℎ𝑟.
Grafo (Diagrama de probabilidades)
Matriz de transición:
0 0 1 2 3 4
0 1-75Δt 75Δt 0 0 0
1 40 Δt 1-155Δt 75Δt 0 0
2 0 80 Δt 1-155Δt 75Δt 0
0 1 2 3 …
𝟕𝟓∆𝒕
𝟕𝟓∆𝒕
𝟕𝟓∆𝒕
𝟕𝟓∆𝒕
𝟕𝟓∆𝒕
𝟒𝟎∆𝒕 𝟖𝟎∆𝒕
𝟖𝟎∆𝒕
𝟖𝟎∆𝒕
𝟏− 𝟕𝟓∆𝒕 𝟏 − 𝟏𝟓𝟓∆𝒕 𝟏− 𝟏𝟓𝟓∆𝒕 𝟏 − 𝟏𝟓𝟓∆𝒕
MODELACIÓN ESTOCÁSTICA.
3 0 0 80 Δt 1-155Δt 75Δt
4 0 0 0 80Δt 1-155Δt
Nuestro sistema de ecuaciones en relación de la matriz de
probabilidades que se tiene es:
𝑷𝟎 = (1 − 75∆𝑡)𝑃0 + (40∆𝑡)𝑃1
𝑷𝟏 = (40∆𝑡)𝑃0 + (1 − 155∆𝑡)𝑃1 + (75∆𝑡)𝑃2
𝑷𝟐 = (80∆𝑡)𝑃1 + (1 − 155∆𝑡)𝑃2 + (75∆𝑡)𝑃3
⋮
𝟏 = 𝑷𝟎 + 𝑷𝟏 + 𝑷𝟐 +⋯
Para encontrar las probabilidades de estado estable.
𝑃1 =15
8𝑃0
𝑃2 = (15
8) (15
16)𝑃0
𝑃3 = (15
8)(15
16)
2
𝑃0
⋮
𝑃𝑛 = (15
8)(15
16)
𝑛−1
𝑃0
⋮
Verificamos que el sistema puede alcanzar un estado estable, utilizando
el criterio 𝝆 < 𝟏, para éste, se define el factor de utilización del sistema,
por medio de la fórmula:
𝜌 =𝜆
𝑆𝜇=
75
2(40)=
75
80=
15
16= 0.9375 < 1
Entonces podemos calcular 𝑃0 , utilizando las siguientes fórmulas
para el modelo propuesto.
𝑷𝟎 = (𝟏 +𝝀𝟎
𝝁𝟏[𝟏
𝟏−𝝆])−𝟏
MODELACIÓN ESTOCÁSTICA.
𝑃0 = [1 +15
8+15
8(15
16)
2
+⋯+15
8(15
16)
𝑛
+⋯]
−1
= [1 +15
8(𝜌 + 𝜌2 +⋯+ 𝜌𝑛 +⋯)]
−1
= [1 +15
8(
1
1 − 𝜌)]
−1
= [1 +15
8(16
1)]
−1
= (248
8)−1
=1
31= 𝟎. 𝟎𝟑𝟐𝟐𝟔
Entonces:
𝑃𝑛 = (15
8) (15
16)
𝑛−1
(0.03226) =15
8(1
31)𝜌𝑛−1 =
15
248𝜌𝑛−1
El número promedio de clientes en el sistema, lo obtenemos, al sustituir el
valor anterior en la siguiente fórmula:
𝑳 = 𝑳𝒒 + 𝑺𝝆
𝐿𝑞 =∑(𝑛 − 2) (15
248𝜌𝑛−1)
∞
𝑛=2
=15
248∑(𝑛 − 2)(𝜌𝑛−1)
∞
𝑛=2
Luego, tenemos que 𝑗 = 𝑛 − 2, entonces:
15
248∑(𝑛 − 2)(𝜌𝑛−1)
∞
𝑛=2
=15
248𝜌2∑𝑗𝜌𝑗−1
∞
𝑛=0
=15
248𝜌2∑𝐷𝜌𝜌
𝑗
∞
𝑛=0
=15
248𝜌2𝐷𝜌∑𝜌𝑗
∞
𝑛=0
=15
248𝜌2𝐷𝜌 (
1
1 − 𝜌) =
=15
248[
𝜌2
(1 − 𝜌)2] =
15
248[
225
256
(1 −15
16)2 ] =
15
248[
225
2561
256
] =15
248(225) = 𝟏𝟑. 𝟔𝟏
Por lo tanto:
𝑳 = 𝟏𝟑. 𝟔𝟏 + 𝟐(𝟏𝟑. 𝟔𝟏) = 𝟒𝟎. 𝟖𝟑 ≈ 𝟒𝟏 es el promedio de clientes en el
sistema.
c) Tiempo esperado que un cliente pasa en el banco.
MODELACIÓN ESTOCÁSTICA.
Para calcular el tiempo esperado que un cliente pasa en el sistema
(banco), utilizamos la siguiente fórmula:
𝑊 =𝐿
𝜆=40.83
75= 0.5444 ℎ𝑟 (60
𝑚𝑖𝑛
ℎ𝑟) = 32.6𝑚𝑖𝑛
Por lo tanto, el tiempo esperado que un cliente pasa en el banco, es
de aproximadamente media hora.
d) Fracción de tiempo que un cajero en particular está desocupado.
Considero que el tiempo que un cajero está desocupado, sería el
tiempo promedio cuando se atiende al único cliente, es decir, un
tiempo aproximado de 1.5 minutos.
5) Una fábrica de refrescos cuenta con un robot que llena de líquido
una botella en un tiempo aproximado de dos minutos de manera
constante. La entrada de botellas vacías sigue una distribución
Poisson con media de 20 piezas por hora.
Solución:
a) Clasifica este sistema según Kendall- Lee.
Según la clasificación Kendall-Lee para este sistema, la distribución de
probabilidad del tiempo entre llegadas, es M exponencial, mientras que
la distribución del tiempo de servicio es D constante; se cuenta con 1
sólo servidor en el sistema, que es el robot que está en la fábrica de
refrescos, la orden de atención obedece en atender primero al cliente que
va llegando, es decir, FCFS; la capacidad máxima de clientes en el
sistema, así como la cantidad de clientes potenciales del sistema de la
línea de espera, son infinitos, dado que no se mencionan.
MODELACIÓN ESTOCÁSTICA.
Por lo tanto se trata de un Modelo No Markoviano
(M/G/1)(FCFS/∞/∞).
b) Calcula 𝑳𝒒, 𝑳,𝑾𝒒 𝒚 𝑾 e interpreta estos resultados.
Utilizaremos las ecuaciones de colas de acuerdo a este modelo
propuesto, que definen las características de operación de la cola.
Sea los datos:
λ = tasa promedio de llegada de botellas vacías por hora.
𝜇 = capacidad del servidor en un un período .
λ = 20 botellas/hora
𝝁 =60
𝐸(𝑡)=60
𝑚𝑖𝑛
ℎ𝑟
2𝑚𝑖𝑛
𝑏𝑜𝑡𝑒𝑙𝑙𝑎
= 30𝑏𝑜𝑡𝑒𝑙𝑙𝑎𝑠/ℎ𝑜𝑟𝑎
𝐸(𝑡) = 2 𝑚𝑖𝑛/𝑏𝑜𝑡𝑒𝑙𝑙𝑎, 𝑉(𝑡) = 0
Se verifica que el sistema puede alcanzar un estado estable, utilizando
el criterio 𝝆 < 𝟏, para éste se define e factor de utilización del sistema
(la letra griega Rho), esto significa la probabilidad de que se esté
utilizando la instalación de servicio:
𝝆 =λ
𝜇=20
30≈ 𝟎. 𝟔𝟔𝟔𝟔 < 𝟏
Vemos que el sistema cumple y puede alcanzar un estado estable,
dado que 𝝆 < 𝟏 ; como E(t) es constante, entonces V(t) = 0 ,
procedemos a calcular 𝑳𝒒, 𝑳,𝑾𝒒 𝒚 𝑾.
El número promedio de botellas o unidades en el sistema L, se obtiene
con la siguiente ecuación:
𝑳 = 𝑳𝒒 + 𝝆
donde 𝐿𝑞 es el número promedio de botellas en la cola y 𝜌, la
utilización del servicio; 𝐿𝑞 lo obtenemos aplicando la fórmula de
Pollaczek-Khintchine.
MODELACIÓN ESTOCÁSTICA.
𝑳𝒒 =𝝀𝟐𝑽(𝒕) + 𝝆𝟐
𝟐(𝟏 − 𝝆)=(20)2(0) + (0.666)2
2(1 − 0.666)=0.4356
0.68= 𝟎. 𝟔𝟒𝟎
Por lo tanto el número promedio de botellas que se llenan es:
𝑳 = 𝑳𝒒 + 𝝆 = 𝟎. 𝟔𝟒𝟎 + 𝟎. 𝟔𝟔 = 𝟏. 𝟑 botellas en el sistema de colas.
Por último, calculamos el tiempo promedio de espera en la fila, por
medio de la fórmula:
𝐖 =𝑾𝒒 + 𝑬(𝒕) =𝐋𝐪
�̅�+ 𝑬(𝒕)
donde 𝑾𝒒 es el tiempo promedio de espera en la fila, utilizamos la
siguiente fórmula:
𝑾𝒒 =𝑳𝒒
�̅�=0.640
20= 𝟎. 𝟎𝟑𝟑𝟐 𝒉𝒐𝒓𝒂𝒔(
60𝑚𝑖𝑛
ℎ𝑟)
= 𝟏. 𝟗𝟗 𝒎𝒊𝒏. 𝒅𝒆 𝒆𝒔𝒑𝒆𝒓𝒂 𝒆𝒏 𝒇𝒊𝒍𝒂.
Por lo tanto, sustituyendo los datos en la fórmula de arriba, el tiempo
promedio de espera en la cola más el tiempo de espera es:
𝑾 = 𝑾𝒒 + 𝐄(𝐭) = 𝟏. 𝟗𝟗𝐦𝐢𝐧 + 𝟐 𝐦𝐢𝐧 ≈ 𝟒 𝐦𝐢𝐧.
6) El tiempo entre llegadas de clientes a una peluquería con un
peluquero sigue una distribución Erlang con parámetros = 𝟎. 𝟕 𝒚 𝒌 = 𝟎. 𝟑. El tiempo promedio de la atención es de 1 hora con
una desviación estándar de 𝟎. 𝟖 horas.
Solución.
MODELACIÓN ESTOCÁSTICA.
a) Clasifica este sistema según Kendall- Lee.
En este sistema, según la clasificación Kendall, la distribución de
probabilidad del tiempo entre llegadas sigue una distribución Erlang y
la distribución del tiempo de servicio se considera G constante; se cuenta
con 1 servidor en el sistema, que es el peluquero, la orden de atención
es FCFS, que consiste en atender primero al cliente que llega primero; la
capacidad máxima de clientes en el sistema así como la cantidad de
clientes potenciales del sistema de la línea de espera, son infinitos., dado
que no se mencionan.
Por lo tanto Se trata de un: Modelo No Markoviano
(G/G/1)(FCFS/∞/∞)
b) Determina el número promedio de clientes en la cola.
Definimos los datos:
= 0.7
𝑘 = 0.3
𝐸(𝑡) =1
0.7≈ 1.4285
ℎ𝑜𝑟𝑎
𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
V(t) =1
𝑘𝜇2=
1
(0.3)(0.7)2= 0.68027ℎ𝑜𝑟𝑎/𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
λ = 0.7 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠/ℎ𝑜𝑟𝑎
donde,
𝜇 = es la capacidad de servidor y
�̅� = es la tasa promedio de llegada.
Utilizaremos la siguiente fórmula propuesta para este modelo:
𝑪𝒂𝟐 =
𝑽(𝒂)
[𝑬(𝒂)]𝟐=0.68027
[1.4285]2≈ 3.33336 < 1
MODELACIÓN ESTOCÁSTICA.
Ahora, para el tiempo de servicio, utilizamos:
𝐶𝑠2 =
𝑉(𝑡)
[𝐸(𝑡)]2=0.49
[1]2≈ 0.49
𝐸(𝑡) =1
1≈ 1
ℎ𝑜𝑟𝑎
𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
V(t) =0.49
1≈ 0.49 ℎ𝑜𝑟𝑎/𝑐𝑙𝑖𝑒𝑛𝑡𝑒
= 0.83 𝑐𝑙𝑖𝑒𝑛𝑡𝑒/ℎ𝑜𝑟𝑎
𝑪𝒔𝟐 =
𝑽(𝒕)
[𝑬(𝒕)]𝟐=0.49
(1)2= 𝟎. 𝟒𝟗
Tenemos que verificar también, que el sistema puede alcanzar un
estado estable, utilizando el criterio 𝝆 < 𝟏, para éste se define e factor de
utilización del sistema (la letra griega Rho), esto significa la
probabilidad de que se esté utilizando la instalación de servicio:
𝝆 =�̅�
𝝁=
𝟎.𝟕
𝟎.𝟖𝟑= 𝟎. 𝟖𝟒𝟑𝟑𝟕 < 𝟏
Vemos que el sistema cumple y puede alcanzar un estado estable,
dado que 𝝆 < 𝟏 ; como E(t) es constante, entonces V(t) = 0 ,
procedemos a calcular 𝑳𝒒, 𝑳,𝑾𝒒 𝒚 𝑾.
c) Determina el tiempo promedio de espera en la fila.
Para conocer el número promedio de clientes que utilizan el servicio,
empleamos la siguiente fórmula propuesta para este modelo.
𝑳𝒒 =𝝆𝟐 (𝑪𝒂
𝟐 + 𝑪𝒔𝟐)
𝟐(𝟏 − 𝝆). 𝒆𝒙𝒑 [−
(𝟏 − 𝝆)(𝑪𝒂𝟐 − 𝟏)𝟐
(𝑪𝒂𝟐 + 𝟒𝑪𝒔
𝟐)] =
MODELACIÓN ESTOCÁSTICA.
=(0.84337)2 (3.33336 + 0.49)
2(1 − 0.84337). 𝑒𝑥𝑝 [−
(1 − 0.84337)(3.33336 − 1)2
(0.333336 + 4(0.49))] =
= (0.2129739)(1.45042) = 3.3
Por tanto, tenemos 3 clientes promedio en la fila.
𝑾𝒒 =𝐋𝐪
�̅�=3.3
0.7= 4.71 (
60𝑚𝑖𝑛
ℎ𝑟) ℎ𝑜𝑟𝑎𝑠 = 2.82ℎ𝑜𝑟𝑎𝑠.
Por lo tanto, el tiempo promedio de espera en la fila es de 3 horas.
CONCLUSIÓN PERSONAL.
Considero que los Modelos de filas de espera o Teoría de colas,
se han desarrollado mucho en los últimos años y se utilizan en el
análisis de sistemas de servicio; externando mi opinión, si todas estas
suposiciones que se formulan, son de alguna manera congruentes con
la situación que se está presentando en alguna empresa, creo que las
fórmulas, nos pueden ayudar a resolver algunos problemas de las
misma, o bien, para realizar un pronóstico del rendimiento de
cualquier sistema, que tenga que ver con el uso de servidores. De esta
manera, podemos tener una idea, del tiempo promedio de espera para
los clientes, determinación del número promedio de clientes que
están en el sistema, etc. lo cual redunda en un sistema de atención al
cliente más óptimo y por supuesto, a que las empresas se posicionen
de manera positiva dentro el mercado. Por muchas razones, más, creo
que es muy interesante continuar con el estudio de este interesante
curso.
ACTIVIDAD A CARGO DEL FACILITADOR 2.
En una sala de emergencias de un hospital, el Ingeniero administrador ha
concluido que los casos de emergencia llegan como un proceso Poisson,
pues los tiempos entre llegadas tienen una distribución exponencial.
MODELACIÓN ESTOCÁSTICA.
También llegó a la conclusión de que el tiempo que necesita el médico para
atender a los pacientes sigue una distribución exponencial. Los pacientes
llegan a una tasa promedio de 1 cada media hora. Un médico requiere de
20 minutos para atender al paciente. Si se usa una hora como unidad de
tiempo. Se debe decidir si se contrata a un médico o a dos.
Elabore una tabla donde compare los elementos más importantes
como se establece en el material desarrollado de las líneas de espera
si se elige un médico o dos.
Realice una conclusión del problema.
De acuerdo a la clasificación del Método de Kendall-Lee, tenemos:
En este problema, el tiempo entre las llegadas es exponencial, el tiempo
de servicio es exponencial, la disciplina de orden es el primero que llega,
primero que se le atiende, la capacidad del sistema es infinito, el potencial
de número de pacientes es infinito.
Por lo tanto, se trata de un modelo de Márkov:
(𝑴 ∕ 𝑴 ∕ 𝟏)(𝑭𝑪𝑭𝑺 ∕ ∞ ∕ ∞) Datos:
Tenemos:
𝜆 = 2 pacientes/hr
𝜇 = 3 pacientes/ hr.
Grafo del sistema.
𝟏 − 𝟐∆𝒕
Matriz de transición
…. 0 1 3 2
𝟏 − 𝟓∆𝒕
𝟑∆𝒕
𝝀𝟎 = 𝟒𝝀𝟎= 𝟒
𝟑∆𝒕
𝟑∆𝒕
𝟑∆𝒕
𝟐∆𝒕
𝟐∆𝒕
𝟐∆𝒕
𝟐∆𝒕
𝟏 − 𝟓∆𝒕
𝟏 − 𝟓∆𝒕
MODELACIÓN ESTOCÁSTICA.
Obtenemos el siguiente sistema:
𝑃0 = (1 − 2∆𝑡)𝑃0 + (3∆𝑡)𝑃1
𝑃1 = (2∆𝑡)𝑃0 + (1 − 2∆𝑡)𝑃1 + (3∆𝑡)𝑃2
𝑃2 = (2∆𝑡)𝑃1 + (1 − 2∆𝑡)𝑃2 + (3∆𝑡)𝑃3
⋮
1 = 𝑃0 + 𝑃1 + 𝑃2 +⋯
Resolviendo, tenemos que las probabilidades son:
𝑃1 =2
3𝑃0
𝑃2 = (2
3) 2𝑃0
𝑃3 = (2
3) 3𝑃0
⋮
𝑃𝑛 = (2
3) 𝑛𝑃0
⋮
Si tenemos que 𝜌 =2
3 , entonces, tenemos la siguiente ecuación:
MODELACIÓN ESTOCÁSTICA.
𝑃0 = (1 +2
3+ (
2
3)2
+⋯+ (2
3)𝑛
+⋯)
−1
=
= (1 + 𝜌 + 𝜌2 +⋯+ 𝜌𝑛 +⋯)−1 =
= (1 +1
1 − 𝜌)−1
=1
4
A partir de aquí, se tiene que:
𝑃𝑛 = 𝜌𝑛𝑃0 =1
4𝜌𝑛
Luego para obtener 𝐿𝑞 , utilizamos la siguiente fórmula, para obtener el
número promedio de pacientes en la fila.
𝑳𝒒 = ∑(𝒏 − 𝟏)(𝟏
𝟒) 𝝆𝒏
∞
𝒏=𝟏
=𝟏
𝟒∑(𝒏 − 𝟏)𝝆𝒏∞
𝒏=𝟏
, 𝒅𝒐𝒏𝒅𝒆 𝒋 = 𝒏 − 𝟏
1
4∑(𝑛 − 1)𝜌𝑛∞
𝑛=1
=1
4∑𝑗𝜌𝑗+1∞
𝑗=0
=1
4𝜌2∑𝑗𝜌𝑗−1
∞
𝑗=0
=1
4𝜌2∑𝐷𝜌𝜌
𝑗
∞
𝑗=0
=1
4𝜌2𝐷𝜌 (
1
1 − 𝜌) =
1
= 4(
𝜌2
(1 − 𝜌)2) =
1
4(
4
91
9
) = 1
Obtenemos el número promedio de pacientes en el sistema por medio de:
𝑳 = 𝑳𝒒 + 𝑺𝝆 = 𝟏 +𝟐
𝟑=𝟓
𝟑
Y por tanto, el tiempo promedio de espera en el sistema será:
𝑾 =𝑳
𝝀=
𝟓
𝟑
𝟐=𝟓
𝟔(𝒉𝒐𝒓𝒂) (
60𝑚𝑖𝑛
ℎ𝑜𝑟𝑎) = 𝟓𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔.
MODELACIÓN ESTOCÁSTICA.
Para obtener el tiempo promedio de espera en la fila usamos:
𝑾𝒒 =𝑳𝒒
𝝀=𝟏
𝟐 𝒉𝒐𝒓𝒂 = 𝟑𝟎 𝒎𝒊𝒏𝒖𝒕𝒐𝒔.
Podemos ver que las distribuciones son exponenciales, entonces
utilizamos las siguientes fórmulas, pero antes, obtenemos la media y
varianza del tiempo de servicio, así como las correspondientes para el
tiempo entre llegadas.
Cálculo de la Media y Varianza del tiempo del servicio:
𝑬(𝒕) =𝟏
𝝁=
𝟏
𝟑
𝑽(𝒕) =𝟏
𝝁𝟐=𝟏
𝟗
Cálculo de la media y varianza del tiempo entre llegadas.
𝑬(𝒂) =𝟏
𝝀=𝟏
𝟐
𝑽(𝒂) =𝟏
𝝀𝟐=𝟏
𝟒
Sustituimos los valores obtenidos en las fórmulas del coeficiente cuadrado
(tiempo de llegadas)
𝑪𝒂𝟐 =
𝑽(𝒂)
[𝑬(𝒂)]𝟐=𝟏/𝟒
𝟏/𝟒= 𝟏
Ahora, para el tiempo de servicio:
𝑪𝑺𝟐 =
𝑽(𝒕)
[𝑬(𝒕)]𝟐=
𝟏
𝟗𝟏
𝟗
= 𝟏
Por lo tanto:
𝑪𝒑𝟐 = 𝑪𝒂
𝟐(𝟏 − 𝝆𝟐) + 𝑪𝑺𝟐𝝆𝟐 = 𝟏 (
𝟏
𝟗) + 𝟏 (
𝟒
𝟗) =
𝟓
𝟗
MODELACIÓN ESTOCÁSTICA.
Resultado que nos indica el coeficiente cuadrado de variación del tiempo
entre salidas del sistema.
De manera análoga, realizamos lo mismo, pero considerando 2 servidores ,
por tanto, tenemos un Modelo de Márkov:
(𝑴 ∕ 𝑴 ∕ 𝟐)(𝑭𝑪𝑭𝑺 ∕ ∞ ∕ ∞)
Grafo del sistema.
𝟏 − 𝟐∆𝒕
Matriz de transición
Obtenemos el siguiente sistema:
𝑃0 = (1 − 2∆𝑡)𝑃0 + (3∆𝑡)𝑃1
…. 0 1 3 2
𝟏 − 𝟖∆𝒕
𝟑∆𝒕
𝝀𝟎 = 𝟒𝝀𝟎= 𝟒
𝟔∆𝒕
𝟔∆𝒕
𝟔∆𝒕
𝟐∆𝒕
𝟐∆𝒕
𝟐∆𝒕
𝟐∆𝒕
𝟏 − 𝟖∆𝒕
𝟏 − 𝟖∆𝒕
MODELACIÓN ESTOCÁSTICA.
𝑃1 = (2∆𝑡)𝑃0 + (1 − 8∆𝑡)𝑃1 + (6∆𝑡)𝑃2
𝑃2 = (2∆𝑡)𝑃1 + (1 − 8∆𝑡)𝑃2 + (6∆𝑡)𝑃3
⋮
1 = 𝑃0 + 𝑃1 + 𝑃2 +⋯
Cuyas soluciones serían:
𝑃1 =2
3𝑃0
𝑃2 = (2
3) (2
6) 𝑃0
𝑃3 = (2
3) (2
6)2
𝑃0
⋮
𝑃𝑛 = (2
3) (2
6)𝑛−1
𝑃0
⋮
Si tenemos que 𝜌 =𝜆
𝑆𝜇=
2
2(3)=
2
6=
1
3 entonces:
𝑃0 = (1 +2
3+2
3(1
3)2
+⋯+2
3(1
3)𝑛
+⋯)
−1
= (1 +2
3(𝜌 + 𝜌2 +⋯+ 𝜌𝑛 +⋯))
−1
= (1 +2
3(
1
1 − 𝜌))
−1
= (1 +2
3(2
2/3))
−1
= (3)−1 =1
3
Luego:
𝑃𝑛 =2
3𝜌𝑛−1𝑃0 =
2
9𝜌𝑛−1
MODELACIÓN ESTOCÁSTICA.
Luego para obtener 𝐿𝑞 , utilizamos la siguiente fórmula, para obtener el
número promedio de pacientes en la fila.
𝑳𝒒 = ∑(𝒏 − 𝟐) (𝟐
𝟗)𝝆𝒏−𝟏 =
∞
𝒏=𝟐
=2
9∑ (𝑛 − 2)𝜌𝑛−1 𝑝𝑎𝑟𝑎 𝑗 = 𝑛 − 2∞𝑛=2
2
9∑(𝑛 − 2)(𝜌𝑛−1)
∞
𝑛=2
=2
9𝜌2∑𝑗𝜌𝑗−1
∞
𝑛=0
=2
9𝜌2∑𝐷𝜌𝜌
𝑗
∞
𝑛=0
=2
9𝜌2𝐷𝜌∑𝜌𝑗
∞
𝑛=0
=
2
9𝜌2𝐷𝜌 (
1
1 − 𝜌) =
2
9(
𝜌2
(1 − 𝜌)2) =
2
9(
1
94
9
) =2
36=1
18
Obtenemos el número promedio de pacientes en el sistema:
𝑳 = 𝑳𝒒 + 𝑺𝝆 =1
18+ 2 (
1
3) =
𝟏𝟑
𝟏𝟖
Ahora, el tiempo promedio de espera en el sistema será:
𝑾 =𝑳
𝝀=
𝟏𝟑
𝟏𝟖
𝟐=𝟏𝟑
𝟑𝟔= 𝟎. 𝟑𝟔𝟏𝟏𝒉𝒓(
60 𝑚𝑖𝑛
ℎ𝑜𝑟𝑎) = 𝟐𝟏. 𝟔𝟔 𝒎𝒊𝒏𝒖𝒕𝒐𝒔.
Calculamos el tiempo promedio de espera en la fila es:
𝑾𝒒 =𝑳𝒒
𝝀=
𝟏
𝟏𝟖
𝟐=𝟏
𝟑𝟔= 𝟎. 𝟎𝟐𝟕�̅� (
60 𝑚𝑖𝑛
ℎ𝑜𝑟𝑎) = 𝟏. 𝟔𝟔 𝒎𝒊𝒏𝒖𝒕𝒐𝒔.
Al tener distribuciones son exponenciales, procedemos a obtener la media
y varianza tanto para el tiempo de servicio, como para el tiempo entre
llegadas.
Cálculo de la Media y Varianza para el tiempo de servicio.
MODELACIÓN ESTOCÁSTICA.
𝐸(𝑡) =1
𝜇=1
3
𝑉(𝑡) =1
𝜇2=1
9
Cálculo de la Media y Varianza para el tiempo entre llegadas.
𝐸(𝑎) =1
𝜆=1
2
𝑉(𝑎) =1
𝜆2=1
4
Luego, obtenemos el coeficiente cuadrado de variación para cada uno de
los anteriores, resulta:
𝑪𝒂𝟐 =
𝑽(𝒂)
[𝑬(𝒂)]𝟐=𝟏/𝟒
𝟏/𝟒= 𝟏
𝑪𝑺𝟐 =
𝑽(𝒕)
[𝑬(𝒕)]𝟐=
𝟏
𝟗𝟏
𝟗
= 𝟏
Sustituyendo valores en la fórmula para obtener el coef. cuadrado de
variación entre salidas del sistema, tenemos:
𝐶𝑝2 = 𝐶𝑎
2(1 − 𝜌2) + 𝐶𝑆2𝜌2 = 1(
8
9) + 1 (
8
9) = 1.777̅
TABLA COMPARATIVA.
Elementos
calculados
𝝆 𝑷𝟎 𝑷𝒏 𝑳 𝑳𝒒 𝑾 𝑾𝒒 𝑪𝒂𝟐 𝑪𝑺
𝟐 𝑪𝒑𝟐
(M/M/1)(fcfs/∞/∞) 2/3 1/4 𝟏
𝟒𝝆𝒏
5/3 1 0.8333 0.5 1 1 0.555
(M/M/2)(fcfs/∞/∞) 1/3 1/3 𝟐
𝟗𝝆𝒏−𝟏
13/18 1/18 0.3611 0.0277 1 1 1.777
MODELACIÓN ESTOCÁSTICA.
CONCLUSIÓN. En este problema se analizó la situación de si es mejor tener contratado un
solo médico, o tener dos; de acuerdo a los resultados obtenidos, la
probabilidad de contar con más pacientes en el sistema es relativamente
baja, además de contarse con un sistema ocioso y cuya utilización del
sistema no está siendo óptima; en lo particular, me inclino a pensar que
siempre es mejor tener dos médicos atendiendo, que uno solo, debido a que
según estimaciones realizadas, en cuanto a la probabilidad de que el paciente
deba esperar, sí está siendo alta, del 66%, lo que significa perder un poco de
tiempo, sobretodo si se ha realizado una cita para llegar a una hora, y se
desea dicha atención en cuanto se presente a ella; otra situación que se
presenta, es la de la permanencia en la cola por más de 40 minutos y de 1 en
el sistema, lo cual siempre resulta un inconveniente, pues no se tenía
pensado estar tanto tiempo esperando, razón por la cual, opino que es
necesario contar con dos médicos, para ofrecer un mejor servicio en dicha
área del hospital, de este modo, en cuanto llegue el paciente a su cita, pasarlo
al médico que está disponible y brindarle la atención; esto aclaro, en cuanto
a lo personal, pero si se refiere a costos, no conviene la contratación de 2
médicos, pues vemos que a veces el sistema está ocioso y casi no hay
pacientes.
AUTORREFLEXIÓN 2.
1. Busca datos de un fenómeno de líneas de espera:
a. Plantea el problema
b. Establece los datos relacionados a tu problema.
c. Ajusta y verifica a qué distribución se ajusta la llegada y el o
los servicios.
d. Utilizando la notación de Kendall- Lee establece el tipo de
línea de espera considera si es markoviana.
e. Utilizando la información encuentra:
i. Utilización promedio del servicio
ii. Tasa promedio de llegadas
iii. Número promedio de clientes en el sistema de
colas
iv. Número promedio de clientes en la cola
v. Tiempo promedio de espera en el sistema
vi. Tiempo promedio de espera en la fila
MODELACIÓN ESTOCÁSTICA.
vii. Establece si el sistema se estabiliza.
f. Conclusiones del trabajo
2. En el siguiente enlace elabora un resumen de tu aplicación y coloca
Tres diapositivas con tu resumen:
https://docs.google.com/presentation/d/1ZPp0XlOk5WcIvYijMBLLbS0DW
SvuPdlf_cCsYQeUeZw/edit?usp=sharing
MODELACIÓN ESTOCÁSTICA.
MODELACIÓN ESTOCÁSTICA.
3. Responde las siguientes preguntas:
a. ¿Cuál es la utilidad de esta unidad en mi vida cotidiana?
Según lo aprendido en esta unidad, encuentro que la utilización
de las teorías de colas se ha convertido , hoy en día, en una
herramienta imprescindible, mediante la cual, podemos auxiliarnos,
cuando se trate de querer evaluar y de mejorar los servicios en
cualquier ámbito o área en que nos desenvolvamos. Creo, que la
reducción del tiempo de espera, en la mayoría de los casos, resulta
benéfico, pues se convierte en un factor importante para reducir los
costos del tiempo de espera, sobre todo para las empresas, que
siempre están buscando la manera, de poder hacer que sus
negocios, de algún u otro modo, proporcionen un buen servicio al
cliente y se vayan acreditando, lo cual conduce, a ganar más
clientela.
Como ejemplo, puedo citar, cuando voy al médico, allí, en el
consultorio, puedo observar las consabidas revistas, mientras
aguardamos nuestro turno de entrar, en los bancos, se han instalado
pantallas, mientras las personas hacemos fila, y llegamos a la caja
para ser atendidos, etc. todas estas cuestiones se realizan, para
mantener ocupado al cliente y mejorar las condiciones de la espera
también, aunque hay otras también, como las que estudiamos en los
problemas propuestos en la evidencia de aprendizaje, que se basan
más bien en la idea de conocer el nivel ideal que una empresa puede
proporcionar, es decir, cuántas cajas debería tener abiertas un súper
o una gasolinera, cuántas ventanillas o cajeros deben funcionar en
un banco, todo para satisfacer al cliente.
b. ¿Qué debo mejorar en esta unidad sobre mi aprendizaje?
Considero que hay un aspecto muy importante que voy a
tratar de mejorar, el cual se refiere a darle más celeridad y
continuar con la exploración de programas como excel, con el
objeto de darle mayor claridad a las presentaciones y además, creo
que me ayudaría también el poder practicar y aprender sobre el
manejo de otro software, esto también, con el fin, de que me ayude
MODELACIÓN ESTOCÁSTICA.
a desarrollar de manera más expedita los contenidos o cada tema
de la unidad, que seguramente , estaremos aplicando en algún
curso posterior y en nuestro trabajo.
c. ¿Cómo están relacionadas esta unidad con la anterior?
Uno de los objetivos indicados para esta unidad, consistió en
poder aplicar los procesos estocásticos para poder modelar y
resolver problemas relativos a la teoría de colas, mediante la
utilización de las famosas ecuaciones de cola y la relación que
encuentro, precisamente, con la unidad anterior, fué también, la
aplicación de los procesos estocásticos, pero utilizando otras
metodologías, como las pruebas de bondad de ajuste, para modelar
dichos problemas, mediante la recopilación de datos y conocer por
medio de los mismos, su comportamiento probabilístico, de
acuerdo a una determinada distribución de probabilidades. Otra
cosa, en la que encuentro gran relación, es que en ambas
unidades, se refieren a comportamientos aleatorios y caen dentro
de los campos de las finanzas, la administración, la física, la
química, la economía, la vida diaria, etc.
MODELACIÓN ESTOCÁSTICA.
UNIDAD 3.GENERACIÓN DE
NÚMEROS PSEUDOALEATORIOS. ACTIVIDAD 1. GENERACIÓN DE NÚMEROS PSEUDOALEATORIOS
Foro.
Buenas tardes, compañeros y docente del foro, les dejo mi aportación.
GRUPO 1.Determina cinco números pseudo-aleatorios entre cero y uno, en cada
caso, usando la semilla indicada y el método congruencial. Utilizando la misma
semilla y el método de cuadrados medios determina cinco números. (En total
debes tener 10 números para este ejercicio).
1) Semilla: 55.
2) Semilla: 49.
3) Semilla: 65.
4) Semilla: 89.
5) Semilla: 94.
6) Semilla: 41.
7) Semilla: 46.
8) Semilla: 78.
Por medio de Excel, obtuve las siguientes tablas:
MODELACIÓN ESTOCÁSTICA.
Metodo de Congruencia
55
180
88
900
N
4840 5020 520 0.664112
45760 45940 40 0.051086
3520 3700 100 0.127714
8800 8980 880 1.123883
77440 77620 220 0.280971
49
180
88
900
N
4312 4492 892 1.139208
78496 78676 376 0.480204
33088 33268 868 1.108557
76384 76564 64 0.081737
5632 5812 412 0.526181
65
180
88
900
N
5720 5900 500 0.638570
44000 44180 80 0.102171
7040 7220 20 0.025543
1760 1940 140 0.178799
12320 12500 800 1.021711
89
180
88
900
N
7832 8012 812 1.037037
71456 71636 536 0.684547
47168 47348 548 0.699872
48224 48404 704 0.899106
61952 62132 32 0.040868
94
180
88
900
N
8272 8452 352 0.449553
30976 31156 556 0.710089
48928 49108 508 0.648787
44704 44884 784 1.001277
68992 69172 772 0.985951
𝑟0 =𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =𝑎 =
c=
𝑚=
𝑟0 =𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =𝑎 =
c=
𝑚=
𝑟0 =
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =𝑎 =
c=
𝑚=
𝑟0 =𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =𝑎 =
c=
𝑚=
0.0000000.2000000.4000000.6000000.8000001.0000001.200000
520 40 100 880 220
5020 45940 3700 8980 77620
4840 45760 3520 8800 77440
N
N
0.0000000.2000000.4000000.6000000.8000001.0000001.200000
892 376 868 64 412
4492 78676 33268 76564 5812
4312 78496 33088 76384 5632
N
N
0.0000000.2000000.4000000.6000000.8000001.0000001.200000
500 80 20 140 800
5900 44180 7220 1940 12500
5720 44000 7040 1760 12320
N
N
0.0000000.2000000.4000000.6000000.8000001.0000001.200000
812 536 548 704 32
8012 71636 47348 48404 62132
7832 71456 47168 48224 61952
N
N
0.0000000.2000000.4000000.6000000.8000001.0000001.200000
352 556 508 784 772
8452 31156 49108 44884 69172
8272 30976 48928 44704 68992
N
N
N
MODELACIÓN ESTOCÁSTICA.
Metodo de cuadrados medios
N es el número aleatorio
41
1681
180
88
900
N
147928 148108 148 0.189017
248788 248829 69 0.088123
115989 116030 110 0.140485
184910 184951 91 0.116220
152971 153012 12 0.015326
46
2116
180
88
900
N
186208 186388 88 0.112388
147928 147969 9 0.011494
15129 15170 50 0.063857
84050 84091 31 0.039591
52111 52152 132 0.168582
78
6084
180
88
900
N
535392 535572 72 0.091954
121032 121073 113 0.144317
189953 189994 94 0.120051
158014 158055 15 0.019157
25215 25256 56 0.071520
55
3025
180
88
900
N
266200 266380 160 0.204342
268960 269001 81 0.103448
136161 136202 122 0.155811
205082 205123 103 0.131545
173143 173184 24 0.030651
49
2401
180
88
900
N
211288 211468 148 0.189017
248788 248829 69 0.088123
115989 116030 110 0.140485
184910 184951 91 0.116220
152971 153012 12 0.015326
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
0.000000
0.050000
0.100000
0.150000
0.200000
148 69 110 91 12
148108 248829 116030 184951 153012
147928 248788 115989 184910 152971
N
N
0.000000
0.050000
0.100000
0.150000
0.200000
88 9 50 31 132
186388 147969 15170 84091 52152
186208 147928 15129 84050 52111
N
N
0.0000000.0200000.0400000.0600000.0800000.1000000.1200000.1400000.160000
72 113 94 15 56
535572 121073 189994 158055 25256
535392 121032 189953 158014 25215
N
N
0.000000
0.050000
0.100000
0.150000
0.200000
0.250000
160 81 122 103 24
266380 269001 136202 205123 173184
266200 268960 136161 205082 173143
N
N
0.000000
0.050000
0.100000
0.150000
0.200000
148 69 110 91 12
211468 248829 116030 184951 153012
211288 248788 115989 184910 152971
N
N
MODELACIÓN ESTOCÁSTICA.
GRUPO 2. Determina tres números pseudo-aleatorios entre cero y uno, usando
la semilla que creas conveniente y tu método preferido a través de cuatro
procesos diferentes.
17) Determina tres números pseudo-aleatorios entre cero y uno usando la
semilla que creas conveniente y el método congruencia, diferente a las
semillas de los grupos 1.
41
870
88
900
N
3608 4478 878 1.121328
77264 77444 44 0.056194
3872 4052 452 0.577267
46
306
88
900
N
4048 4354 754 0.962963
66352 66532 832 1.062580
73216 73396 496 0.633461
78
406
88
900
N
6864 7270 70 0.089400
6160 6340 40 0.051086
3520 3700 100 0.127714
𝑟5 =
𝑟0 =
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑟0 =
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =𝑟5 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
0.0000000.5000001.0000001.500000
878 44 452
4478 77444 4052
3608 77264 3872
N
N
0.000000
0.500000
1.000000
1.500000
754 832 496
4354 66532 73396
4048 66352 73216
N
N
0.000000
0.050000
0.100000
0.150000
70 40 100
7270 6340 3700
6864 6160 3520
N
N
MODELACIÓN ESTOCÁSTICA.
18) Determina tres números pseudoaleatorios entre cero y uno usando la
misma semilla que la empleada en el ejercicio 17 y el método de cuadrados
medios, diferente a las semillas de los grupos.
41
1681
214
88
900
N
147928 148142 2 0.002554
3362 3403 163 0.208174
274003 274044 84 0.107280
141204 141245 125 0.159642
67
4489
214
88
900
N
395032 395246 146 0.186462
245426 245467 127 0.162197
213487 213528 48 0.061303
80688 80729 89 0.113665
70
4900
214
88
900
N
431200 431414 134 0.171137
225254 225295 115 0.146871
193315 193356 36 0.045977
60516 60557 77 0.098340
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
𝑟0=
𝑟02=𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
𝑎 =
c=
𝑚=
𝑎 =
c=
𝑚=
𝑟1 =
𝑟2 =
𝑟3 =
𝑟4 =
c𝑟𝑖 𝑎+ 𝑐𝑟𝑖 𝑎 + 𝑐𝑟𝑖 mod m
c=
𝑚=
MODELACIÓN ESTOCÁSTICA.
Semilla: 25.
Primero el cuadrado de la semilla
𝑟1 = 252 = 625 =0 .0625
Así, si el número central se considera 625 se le agrega un cero a la izquierda y se
eleva al cuadrado.
𝑟2 = 6252 =390625 =0 .9062
Se hace lo mismo con el resultado de 𝑟2 para obtener 𝑟3
𝑟3 = 90622 =82119844 =0.1198
A) Con la semilla 4500 y aplicando el método de los cuadrados medios
encuentra 40 números pseudoaleatorios entre cero y uno.
Iniciamos con la obtención del cuadrado del número semilla, 4500.
Semilla: 4500.
Primero el cuadrado de la semilla
𝑟1 = 45002 = 20250000 .2500
𝑟2 = 25002 = 6250000 = .5000
𝑟3 = 50002 = 25000000 =.0000
¿Qué problema encontraste?
El problema que encontré en este método, es que el algoritmo degenera hacia
cero y la iteración se corta, ocasionando que no se puedan obtener más números
pseudoaleatorios.
MODELACIÓN ESTOCÁSTICA.
B) Con la semilla 99 y aplicando el método congruencial encuentra 40
números pseudoaleatorios entre cero y uno.
Semilla: 99.
Ejecutamos con base a la regla del método congruencial:
1 2 3
0.25
0.5
0
Diagrama de dispersión
MODELACIÓN ESTOCÁSTICA.
𝑟𝑖+1= (a +c𝑟𝑖) mod m
Donde
𝑟𝑖 = 99
a=544
c=19
m=920
n r a c m Columna1 a+cr residuo m-1 Nal
1 99 544 19 920 2425 585 919 0.63656148
2 585 544 19 920 11659 619 919 0.67355822
3 619 544 19 920 12305 345 919 0.37540805
4 345 544 19 920 7099 659 919 0.71708379
5 659 544 19 920 13065 185 919 0.20130577
6 185 544 19 920 4059 379 919 0.41240479
7 379 544 19 920 7745 385 919 0.41893362
8 385 544 19 920 7859 499 919 0.5429815
9 499 544 19 920 10025 825 919 0.89771491
10 825 544 19 920 16219 579 919 0.63003264
11 579 544 19 920 11545 505 919 0.54951034
12 505 544 19 920 10139 19 919 0.02067465
13 19 544 19 920 905 905 919 0.98476605
14 905 544 19 920 17739 259 919 0.28182807
15 259 544 19 920 5465 865 919 0.94124048
16 865 544 19 920 16979 419 919 0.45593036
17 419 544 19 920 8505 225 919 0.24483134
18 225 544 19 920 4819 219 919 0.2383025
19 219 544 19 920 4705 105 919 0.11425462
20 105 544 19 920 2539 699 919 0.76060936
21 699 544 19 920 13825 25 919 0.02720348
22 25 544 19 920 1019 99 919 0.10772579
23 99 544 19 920 2425 585 919 0.63656148
24 585 544 19 920 11659 619 919 0.67355822
25 619 544 19 920 12305 345 919 0.37540805
26 345 544 19 920 7099 659 919 0.71708379
27 659 544 19 920 13065 185 919 0.20130577
28 185 544 19 920 4059 379 919 0.41240479
29 379 544 19 920 7745 385 919 0.41893362
30 385 544 19 920 7859 499 919 0.5429815
31 499 544 19 920 10025 825 919 0.89771491
32 825 544 19 920 16219 579 919 0.63003264
33 579 544 19 920 11545 505 919 0.54951034
34 505 544 19 920 10139 19 919 0.02067465
35 19 544 19 920 905 905 919 0.98476605
36 905 544 19 920 17739 259 919 0.28182807
37 259 544 19 920 5465 865 919 0.94124048
38 865 544 19 920 16979 419 919 0.45593036
39 419 544 19 920 8505 225 919 0.24483134
40 225 544 19 920 4819 219 919 0.2383025
MODELACIÓN ESTOCÁSTICA.
PRUEBA DE BONDAD DE AJUSTE. MÉTODO CHI-CUADRADA.
Probaremos con la hipótesis dada de una distribución uniforme, según la gráfica
obtenida.
int FO F0/40 fx(0/.99) FE
1 0.02-0.16 5 0.125 0.010101 0.06464 2 0.16-0.3 8 0.2 0.010101 0.06464 3 0.3-0.43 6 0.15 0.010101 0.06464 4 0.43-0.57 6 0.15 0.010101 0.06464 5 0.57-0.71 6 0.15 0.010101 0.06464
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 10 20 30 40 50
Diagrama de dispersión
0.636561480.6735582150.3754080520.7170837870.2013057670.4124047880.4189336240.5429815020.8977149080.6300326440.5495103370.0206746460.984766050.2818280740.9412404790.4559303590.2448313380.2383025030.1142546250.7606093580.0272034820.1077257890.636561480.6735582150.3754080520.7170837870.2013057670.4124047880.4189336240.5429815020.8977149080.6300326440.5495103370.0206746460.984766050.2818280740.9412404790.4559303590.2448313380.238302503 0
2000
4000
6000
8000
10000
12000
14000
16000
18000
20000
0 10 20 30 40 50
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39
Números aleatorios
MODELACIÓN ESTOCÁSTICA.
6 0.71-0.85 3 0.075 0.010101 0.06464 7 0.85-0.98 6 0.15 0.010101 0.06464
Datos 40 1
𝑛 = 40 (número de datos conocidos)
√𝑛 𝑐𝑙𝑎𝑠𝑒𝑠 = √40 = 6.32 ≈ 7 𝑐𝑙𝑎𝑠𝑒𝑠 Cálculo de la Media y de la Varianza.
Media 𝒂+𝒃
𝟐=
𝟎+𝟎.𝟗𝟗
𝟐= 𝟎. 𝟒𝟗𝟓 Varianza = 𝟎. 𝟎𝟕𝟔𝟓𝟎𝟕
Considerando que el comportamiento se asemeja a una distribución uniforme
entre: 𝒂 = 𝟎 𝒚 𝒃 = 𝟎. 𝟗𝟗 , 𝒇(𝒙|𝟎, 𝟎. 𝟗𝟗), 𝟎 ≤ 𝒙 ≤ 𝟎. 𝟗𝟗
Calculamos la frecuencia esperada para cada uno de los intervalos (𝐹𝐸𝑖),
integrando la función de densidad propuesta y multiplicándola por el número
total de datos.
𝒇(𝒙) = ∫ (𝟎. 𝟎𝟏
𝟎. 𝟗𝟗)
𝟎.𝟏𝟔
𝟎
𝒅𝒙 = 𝟎. 𝟎𝟎𝟏𝟔𝟏
Multiplicado por 𝑛 𝑑𝑎𝑡𝑜𝑠 → 0.001616 ( 40) = 0.06464
Cálculo del estimador C. Donde: m = número de intervalos considerado para construir la tabla de
frecuencias.
FOi = frecuencia observada para el i-ésimo intervalo.
FEi = frecuencia esperada para el i-ésimo intervalo.
Determinemos el estimador C con los valores obtenidos y m = 6 por medio
de:
C= ∑(𝐹𝐸𝑖−𝐹𝑂𝑖)
2
𝐹𝐸𝑖
𝑚𝑖=1 =
(0.06464−5)2
0.06464+
(0.06464−8)2
0.06464+
(0.06464−6)2
0.06464+
(0.06464−6)2
0.06464+
(0.06464−6)2
0.06464+
(0.06464−3)2
0.06464+
(0.06464−6)2
0.06464=
= 376.82+974.16+544.99+544.99+544.99+133.29+544.99=3664.23 Cálculo de chi –cuadrada.
Calculamos el valor de chi cuadrada con 𝑑𝑓 = 𝑘 − 1 = 7 − 1 = 6 grados de
libertad y un nivel de confianza del 95% donde k es el número de parámetros
estimados de la distribución donde, si el estimador C es menor o igual a éste,
entonces no podremos refutar que nuestra propuesta de modelo es correcta,
pues no se puede rechazar la hipótesis de que nuestra información histórica
encaja en el modelo probabilístico que propusimos.
𝝌𝜶,𝒅𝒇𝟐 =𝝌𝟓%,𝟔
𝟐 =12.5238 (según tabla)
Por tanto C < 𝝌𝟓%,𝟔𝟐 o sea 3664.23< 12.5238
MODELACIÓN ESTOCÁSTICA.
Por lo tanto, no se rechaza la hipótesis planteada.
MODELACIÓN ESTOCÁSTICA.
CONCLUSIÓN.
Algunas veces nos vamos a encontrar que no todos los métodos utilizados son los mejores para generar números pseudoaleatorios, como en los últimos ejercicios realizados; pero creo que ayuda mucho, la prueba de bondad de ajuste chi cuadrada así como la interpretación de la gráfica, con la cual podemos darnos una idea, en este caso, de que se acerca a una distribución normal; aunque resulta un poco laborioso, siempre resulta bueno intentar de hacerla de forma manual, y en este caso, hice la comprobación con el programa Geogebra; otra cosa que observé, es que los resultados que se obtienen con el método congruencial son más precisos y depende mucho de la semilla que se elija.
Actividad 2. Generación de Variables Aleatorias. 1. Para la distribución triangular:
a. Aplicando el método de la transformación inversa encuentra el
valor despejado de x
.
𝐴1 =𝑐 − 𝑎
𝑏 − 𝑎
𝐴2 =𝑏 − 𝑐
𝑏 − 𝑎
𝑓1(𝑥) =2
(𝑐 − 𝑎)2(𝑥 − 𝑎)
𝐹1(𝑥) =(𝑥 − 𝑎)2
(𝑏 − 𝑎)2
MODELACIÓN ESTOCÁSTICA.
𝑓(𝑥) =𝑐 − 𝑎
𝑏 − 𝑎(
2
(𝑐 − 𝑎)2(𝑥 − 𝑎)) +
𝑏 − 𝑐
𝑏 − 𝑎(
2
(𝑏 − 𝑐)2(𝑏 − 𝑥))
𝑓(𝑥) =
{
0 𝑝𝑎𝑟𝑎 𝑥 < 𝑎
2(𝑥 − 𝑎)
(𝑏 − 𝑎)(𝑐 − 𝑎) 𝑝𝑎𝑟𝑎 𝑎 ≤ 𝑥 ≤ 𝑐
2(𝑏 − 𝑥)
(𝑏 − 𝑎)(𝑏 − 𝑐) 𝑝𝑎𝑟𝑎 𝑐 < 𝑥 ≤ 𝑏
0 𝑝𝑎𝑟𝑎 𝑥 > 𝑏
b. Utilizando Excel simula 10 números aleatorios de la distribución
triangular suponiendo que a= 10, c=14 b=20
𝑓2(𝑥) =2
(𝑏 − 𝑐)2(𝑥 − 𝑏)
𝐹1(𝑥) =(𝑥 − 𝑏)2
(𝑏 − 𝑐)2
MODELACIÓN ESTOCÁSTICA.
c. Considerando los resultados del inciso b calcula:
i. Media y Varianza
𝑀𝑒𝑑𝑖𝑎 =𝑎 + 𝑏 + 𝑐
3= 14.6666
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 =𝑎2 + 𝑏2 + 𝑐2 − 𝑎𝑏 − 𝑎𝑐 − 𝑏𝑐
18= 4.2222
ii. ¿Cuántos valores de tu simulación son mayores que 14 y
cuántos son menores de 14?
3 son menores de 14 y 7 son mayores de 14.
iii. ¿Cuál es la probabilidad de que x≤16?
Para obtener la probabilidad la fórmula es: Haciendo mi tabla de frecuencias encuentro que solo tengo 5 datos que es el 50%
2. Suponga que se quiere simular el lanzamiento de una moneda.
a. Establece un método considerando lo visto en la unidad y realiza el
lanzamiento de 10 monedas cargadas con p=1/4
Ocuparé el Método Bernoulli:
MODELACIÓN ESTOCÁSTICA.
b. ¿Cómo será si quieres lanzar un dado? Realiza 5 lanzamientos de un
dado no cargado?
3. Suponga que se quiere simular el nacimiento de niños en una comunidad de 40
familias. Se sabe que cada familia tiene tres hijos. Utilizar a la distribución
Bernoulli como base para realizar esta simulación. Suponga que se tiene la
misma probabilidad de tener un niño que una niña.
a. Simular 40 familias.
MODELACIÓN ESTOCÁSTICA.
MODELACIÓN ESTOCÁSTICA.
b. Estimar del inciso a la media y varianza
𝜇 = 0.4988 𝜎2 = 0.3210666
c. ¿Cuántas familias tuvieron 0,1,2,3, niños?
𝑋(0) = 9 𝑋(1) = 9 𝑋(2) = 16 𝑋(3) = 6
d. Elabora el histograma de frecuencias
MODELACIÓN ESTOCÁSTICA.
e. ¿Cuál es la probabilidad de tener 2 o menos niños considerando los
resultados del inciso a?
𝑃(2) = 0.85 = 85%
f. Realiza la prueba de bondad de ajuste. ¿A qué distribución se ajusta?
Revisando los datos, detecto que se ajusta a una distribución normal, por lo que la pruebo que realizo es chi cuadrada, donde el nivel de confianza es del 5%; concluyendo con la aceptación de la hipótesis.
4. Se sabe quiere realizar la simulación de 40 estaturas de hombres. Se sabe que la
media es 1.70 con desviación estándar de 2.45. Utilizando el método de
simulación directa realiza la simulación de una normal.
a. Simular 40 estaturas.
MODELACIÓN ESTOCÁSTICA.
b. Estima del inciso a la media y varianza
c. ¿Cuántos midieron menos de 1.65?
12 personas miden menos de 1.65.
MODELACIÓN ESTOCÁSTICA.
d. ¿Cuántos midieron más 1.70?
28 personas e. ¿Cuál es la probabilidad de que un hombre tenga una estatura menor
o igual a 1.67 cm?
Es del 20.22% de que un hombre tenga menos o igual del 1.67 cm.
f. Realiza la prueba de bondad de ajuste.
MODELACIÓN ESTOCÁSTICA.
5. Suponga que las calificaciones de un grupo de la materia de Modelación
Estocástica con su frecuencia relativa son:
Calificación Frecuencia relativa
1 0
2 0.05
3 0.07
4 0.11 5 0.11
6 0.26
7 0.17
8 0.07 9 0.05
10 0.11
a) Realiza la simulación de 20 alumnos.
b) Estima del inciso a la media y varianza
MODELACIÓN ESTOCÁSTICA.
c) ¿Cuántos pasaron la materia de tu simulación?
Solo 12 personas.
d) ¿Cuántos obtuvieron 10?
1 e) ¿Cuál es la probabilidad de pasar la materia?
𝑝 = 60%
6. Elabora la siguiente tabla haciendo uso de una herramienta computacional:
Distribución de
Probabilidad Explica una Aplicación Concreta, no
olvides establecer la variable aleatoria y los parámetros
necesarios
Simulación de 5 valores
Exponencial Cierto sistema contiene cierto tipo de componente cuyo tiempo de falla en años está dado por la variable aleatoria T, distribuida exponencialmente con
tiempo promedio de falla . S í 5 de estos componentes se instalan en diferentes sistemas, ¿cuál es la probabilidad de que al menos 2 continúen funcionando después de 8 años? El tiempo que transcurre antes de que una persona sea atendida en una cafetería es una variable aleatoria que tiene una distribución exponencial con una media de 4 minutos. ¿Cuál es la probabilidad de que una persona sea atendida antes de que transcurran 3 minutos en al menos 4 de los 6 días siguientes?
P(x 2 ) = p(x=2) + p(x=3) + p(x=4) + p(x=5) = 1 – p(x = 0, 1) = 1 − {5𝐶0(0.2)
0(0.8)5+5𝐶1(0.2)1(0.8)4} = 1 −
0.7373
b) 𝑃(𝑇 ≤ 3) =1
4∫ 𝐸−
1
4𝑡3
0𝑑𝑡 = 𝐸−
1
4| = 1 − 𝐸−3
4 =
0.5276 la nos indica que la integral va a ser evaluada de 0 a 3 x = número de días en que un cliente es atendido antes de que transcurran 3 minutos x = 0, 1, 2,...,6 días p = probabilidad de que un cliente sea atendido antes de que transcurran 3 minutos en un día cualquiera = 0.5276 q = probabilidad de que un cliente no sea atendido antes de que transcurran 3 minutos en un día cualquiera = 1- p = 0.4724 𝑃(𝑥 = 5 𝑜 6,𝑁 = 6,𝑝 =0.5276) =6 𝐶5(0.5276)
5(0.4724)1+6(0.5276)6(0.4724)0
= 0.11587 + 0.02157 = 0.13744
Weibull Un sistema consiste de dos
componentes conectados en serie. El sistema fallara cuando alguno de los componentes falle. Sea T el momento en el que el sistema falla. Sean X1 y X2 las duraciones de los dos componentes. Suponga que X1 y X2 son independientes y que cada uno sigue
a) 𝑃(𝑋1 > 5) = 1 − 𝑝(𝑋1 ≤ 5) = 1 − (1−
𝑒 −[(0.2)(5)]2= 𝑒−1 = 0.1353
b) 𝑃(𝑇 ≤ 5) = 1 − 𝑃(𝑇 > 5) = 1 − 𝑒−2 =
0.8647
c) 𝑆𝑖, 𝑇~ 𝑊𝑒𝑖𝑏𝑢𝑙𝑙 (2,√0.08) =𝑊𝑒𝑖𝑏𝑢𝑙𝑙 (2, 0.2828)
MODELACIÓN ESTOCÁSTICA.
una distribución Weibull con 𝛼 = 2 𝑦 𝛽 = 0.2
a) Determine P(𝑋1 > 5) b) Determine P(T≤5) c) T Tiene una distribución de
Weibull= si es Así ¿Cuáles son sus parámetros?
Chi-cuadrada El gerente de ventas de una compañía
P&C afirma que todos sus vendedores realizan el mismo número de visitas durante el mismo período de tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana dada reveló el siguiente número de visitas.
Vendedor A B C D E
Número de visitas
23 29 25 23 30
Con el nivel de significación de 0.05, ¿es razonable aceptar la afirmación del gerente? 1) 𝑯𝟎 : hacen el mismo número de visitas 𝑯𝒂: hacen menor número de visitas
𝑔𝑙 = 𝑘 − 1 𝑔𝑙 = 5 − 1 = 4
𝑿(𝟒)𝟐 = 9,49
𝑋(4)2 =
(23− 26)2
26+(29 − 26)2
26+(25 − 26)2
26
+(23− 26)2
26+(30− 26)2
26
𝑿(𝟒)𝟐 = 0,35+ 0,35 + 0,04+ 0,35+ 0,62
𝑿(𝟒)𝟐 = 1.7
Acepta la hipótesis nula por que realizan el mismo número de visitas
Erlang Suponga que cierta pieza metálica se
romperá después de sufrir dos ciclos de
esfuerzo. Si estos ciclos ocurren de
manera independiente a una frecuencia
promedio de dos por cada 100 horas.
Obtener la probabilidad de que el
intervalo de tiempo se encuentre hasta
que ocurre el segundo ciclo.
a. Dentro de una desviación con
respecto del tiempo promedio.
b. A más de dos desviaciones por
encima de la media.
𝑋:Lapso que ocurre hasta que la pieza sufre el segundo ciclo de esfuerzo, en horas. 𝑘 = 2 𝑙 = 2 𝑐𝑖𝑐𝑙𝑜𝑠/100 ℎ𝑜𝑟𝑎𝑠 → 𝑙 = 0.02
𝜎 = √𝑉(𝑥) = √𝑘
𝜆2=√2
0.02= 70.71
a) 𝑃 (𝑚 − 𝑠 <> 𝑚 + 𝑠) = 𝑃 (29.29)
∫ 𝑥
170.71
29.28
0.022𝑒−0.02𝑥
1!𝑑𝑥
=0.022
1!∫ 𝑥𝑒−0.02𝑥
170.71
29.28
= 0.7375128
b-) 𝑃(𝑋 > 𝑚 + 2𝑠) = 𝑃(𝑋 > 241.42) =
1 – 𝑃(𝑋 £ 241.42) =
1 − ∫ 𝑥
241.42
0
0.022𝑒−0.02𝑥
1!𝑑𝑥
= 1 −0.022
1!∫ 𝑥𝑒−0.02𝑥
241.42
0
𝑑𝑥
= 0.0466
MODELACIÓN ESTOCÁSTICA.
EVIDENCIA DE APRENDIZAJE. SIMULACIÓN DE NÚMEROS PSEUDOALEATORIOS Y
DE VARIABLES ALEATORIAS.
INTRODUCCIÓN.
En la actualidad, la simulación es una de las herramientas de análisis
cuantitativo que más uso tienen y se presenta como una solución a muchos
problemas de índole administrativa; simular equivale a tratar de duplicar las
funciones, apariencias y características de un sistema real, mediante la
construcción de un modelo matemático que se asemeje lo más posible a la
representación real del sistema, y a partir de ahí, obtener conclusiones y tomar
decisiones de acción, con base en los resultados de la simulación. De esta
manera, el sistema real no sufre cambios, sino hasta que se tienen en el modelo
del sistema, las ventajas y desventajas de lo que puede ser una decisión de
política importante.
Los números pseudo-aleatorios constituyen la parte medular de la simulación
de procesos estocásticos y generalmente se usan para generar el
comportamiento de variables aleatorias, tanto continuas como discretas. Debido
a que no es posible generar números realmente aleatorios, los consideramos
como pseudo-aleatorios, generados por medio de algoritmos determinísticos
que requieren parámetros de arranque. Dada la importancia de contar con un
conjunto de números pseudo aleatorios suficientemente grande, en este trabajo
se presentan diferentes algoritmos determinísticos para obtenerlos; es
conveniente señalar que el conjunto de números pseudo-aleatorios, debe ser
sometido a una variedad de pruebas para verificar si son realmente
independientes y uniformes. Si las pruebas son superadas, podrán utilizarse en la
simulación; de lo contrario, simplemente debemos desecharlos.
Generar un conjunto de números pseudo-aleatorios es una tarea relativamente
sencilla, sólo es necesario diseñar un algoritmo de generación. Lo que resulta
difícil es diseñar un algoritmo que genere un conjunto de números pseudo -
aleatorios con período de vida suficientemente grande y además pase sin
problemas las pruebas de uniformidad e independencia, lo cual implica evitar
problemas como éstos:
Que los números pseudo-aleatorios no estén uniformemente distribuidos, es
decir, que haya demasiados números en un subintervalo y en otro muy pocos o
ninguno.
MODELACIÓN ESTOCÁSTICA.
Que los números pseudo-aleatorios generados sean discretos en lugar de
continuos.
Que la media del conjunto sea muy alta o muy baja, es decir, que esté por arriba
o por debajo de ½.
Que la varianza del conjunto sea muy alta o muy baja, es decir, que se localice
por arriba o por debajo del 1/12.
Establece los pasos a seguir para planificar una
simulación.
Para realizar un proceso de simulación, básicamente se deben
seguir los siguientes pasos:
MODELACIÓN ESTOCÁSTICA.
Definición de los objetivos
•El sistema a simular debe estar perfectamente definido. El cliente y el desarrollador deben acordar dónde estará la frontera del sistema a estudiar y las interacciones con el medioambiente que serán consideradas
Formulación del modelo
•Comienza con el desarrollo de un modelo simple que captura los aspectos relevantes del sistema real, los cuales dependen de la formulación del problema. Debe quedar claro, si lo que el cliente desea es un estudio de simulación o de optimización.La naturaleza y cantidad de datos necesarios están determinadas por la formulación del problema y del modelo: registros históricos, mediciones realizadas en el sistema real., experimentos de laboratorios.
Diseño del experimento
•Aquí se decide las características de los experimentos a realizar: el tiempo de arranque, de simulación, número de simulaciones.
Realización del experimento
•Se realizan las simulaciones de acuerdo al diseño previo. Los resultados obtenidos son debidamente recolectados y procesados..
Evaluación de los resultados
•Incluye la elaboración de la documentación técnica y manuales de uso, debe contar con una descripción detallada del modelo y de los datos; también, se debe incluir la evolución histórica de las distintas etapas del desarrollado, todo será de utilidad para el posterior perfeccionamiento del simulador.
MODELACIÓN ESTOCÁSTICA.
Elabora una tabla con los métodos para generar números
pseudoaleatorios que contemple dos columnas: nombre
del método y características básicas.
MÉTODOS PARA GENERAR NÚMEROS
PSEUDOALEATORIOS
NO
C
ON
GR
UE
NC
IAL
ES
N
O
CO
NG
RU
EN
CIA
LE
S
CUADRADOS MEDIOS. -Se requiere una semilla El problema con este método es que tiende a degenerar rápidamente. Se eleva la semilla al cuadrado. Se toman los k dígitos centrales del valor obtenido en el paso 2, con los cuales se considerará un número entre cero y uno, el cual será el primer valor pseudoaleatorio. Los dígitos considerados en el paso 3, se considerarán como una nueva semilla y se repiten los pasos 2 y 3 para obtener el siguiente número pseudoaleatorio. Se repiten los pasos del 1 al 4 hasta obtener el número de elementos deseado. PRODUCTOS MEDIOS. Este método es muy similar al anterior ya que se tomará como número aleatorio siguiente de la serie, a los n dígitos centrales del resultado de una multiplicación previa. Se requiere dos semillas. Una modificación para este método consiste en utilizar un multiplicador constante, en lugar de dos números aleatorios como se muestra a continuación: Rn+1 = K * Rn Estos métodos son similares al cuadrado medio. Sin embargo los dos tienen periodos más extensos y los números parecen estar distribuidos uniformemente. Este método tiende a degenerar a un valor constante. Tanto el método de cuadrados medios como el de producto medio tienen un periodo corto para la cantidad de números aleatorios que vamos a necesitaremos generar en cada uno de nuestros Modelos.
MULTIPLICADOR CONSTANTE.
CO
NG
RU
EN
CIA
LE
S
CO
NG
RU
EN
CIA
LE
S.
Lineales. CONGRUENCIAL MIXTO. La relación de recurrencia es la siguiente: 𝒓𝒊+𝟏 = (𝒂 + 𝒄𝒓𝒊)𝒎𝒐𝒅 𝒎 donde 𝒓𝟎 = se denomina semilla y es un número entero positivo. a= es un entero cualquiera. c= es un entero impar que no es divisible por tres ni por cinco. m= es un entero lo más grande posible. Ventajas: Utiliza poca memoria y es muy rápido., es fácil de volver a generar la misma secuencia, guardando un solo número, (se alcanza con partir desde la misma semilla: r0). Si no se escogen los valores adecuados de los parámetros, el período del generador de números pseudo – aleatorios, será menor que m.
CONGRUENCIAL MULTIPLICATIVO. La relación de recurrencia es la siguiente: En forma semejante al método anterior el generador congruencial multiplicativo genera el próximo número pseudo - aleatorio a partir del último número calculado, siguiendo la siguiente relación de recurrencia:
𝑿𝒏+ 𝟏 = 𝒂𝑿𝒏𝒎𝒐𝒅 𝒎 Para este generador también se deben escoger adecuadamente los valores de a, X0, y m, con la finalidad de que se pueda asegurar un período máximo para la series pseudo - aleatorias generadas por este método. A continuación se dan las reglas que indican como se deben escoger estos valores.
MODELACIÓN ESTOCÁSTICA.
No lineales: CONGRUENCIAL CUADRÁTICO.
Resuelve los siguientes:
1) Ingresa al siguiente enlace:
https://docs.google.com/spreadsheets/d/18qLHy8HNX6VsG6J7TcYm7y0VLvB
9BjJ3LwL7lUmQyus/edit?usp=sharing
Elige un método y coloca tu nombre. MÉTODO DE MONTECARLO.
En el siguiente enlace desarrolla con máximo DOS diapositivas
explicando el método puedes explicar con un ejemplo:
https://docs.google.com/presentation/d/1bTMcwAv10EhSTANowZEHI28wQ6
Gt-3cxwqJDNDMLtBo/edit?usp=sharing
Método de Montecarlo.
MODELACIÓN ESTOCÁSTICA.
DIAPOSITIVAS DEL MÉTODO DE CUADRADOS MEDIOS
MODELACIÓN ESTOCÁSTICA.
Analiza cada una de las situaciones proporcionadas y realiza lo que se
solicita en cada caso.
2) Elabora 5 simulaciones de la distribución Gamma usando el
método de simulación directa, recordando que la distribución
Gamma puede interpretarse como la distribución exponencial de
una suma de variables exponenciales cada una con parámetro .
Suponga que =4 y =5.
Para dar solución a este problema, empleamos la siguiente fórmula:
𝒇(𝒙) =∑𝜶𝒆−𝜶𝒙𝒊
𝟒
𝒊=𝟏
Aplicando la transformada inversa para la exponencial, obtenemos:
𝒙𝒊 = −𝟏
𝜶𝐥𝐧(𝟏 − 𝒓𝒊) , 𝒊 = 𝟏, 𝟐, 𝟑, 𝟒
Por tanto:
MODELACIÓN ESTOCÁSTICA.
𝒙 = (𝟏
𝜶)∑𝐥𝐧(𝟏 − 𝒓𝒊)
𝟒
𝒊=𝟏
= −𝟏
𝜶𝐥𝐧 (∏(𝟏 − 𝒓𝒊)
𝟒
𝒊=𝟏
)
Mediante la ayuda del programa Excel, generamos los siguientes
números pseudo-aleatorios:
Primera simulación.
𝒙 = −𝟏
𝟓𝐥𝐧 (∏(𝟏− 𝒓𝒊)
𝟒
𝒊=𝟏
) =
= −1
5ln[(1 − .541507)(1− .756066)(1− .097063)(1
− .725415)] =
= −1
5ln(. 027729325) = 𝟎. 𝟕𝟏𝟕𝟎𝟓𝟐𝟗𝟒𝟖
Segunda simulación.
𝑥 = −1
5ln[(1 − .449553)(1 − .710089)(1− .648787)(1− .2985951)]
= −1
5ln[. 039311496] = 𝟎. 𝟔𝟒𝟕𝟐𝟒𝟕𝟔𝟓𝟐
Tercera simulación.
𝑥 = −1
5ln[(1 − .684547)(1− .699872)(1 − .459106)(1 − .270868)] =
0.541507
0.756066
0.097063
0.725415
𝑟1 =
𝑟2 =𝑟3 =𝑟4 =
0.449553
0.710089
0.648787
0.985951
𝑟1 =
𝑟2 =𝑟3 =𝑟4 =
0.684547
0.699872
0.459106
0.270868
𝑟1 =
𝑟2 =𝑟3 =𝑟4 =
MODELACIÓN ESTOCÁSTICA.
−1
5ln[. 037338726] = 𝟎. 𝟔𝟓𝟕𝟓𝟒𝟒𝟖𝟓
Cuarta simulación.
𝑥 = −1
5ln[(1 − .638570)(1− .102171)(1 − .125543)(1 − .178799)] =
=−1
5ln[. 2033026737] =0.291320415
Quinta simulación.
𝑥 = −1
5ln[(1 − .132822)(1 − 0.424010)(1 − 0.761175)(1− 0.546615)] =
−1
5ln[0.054084164] = 0.583442767
Elabora 5 simulaciones de la distribución Gamma usando el método de
simulación directa, recordando que la distribución Gamma puede
interpretarse como la distribución exponencial de una suma de variables
exponenciales cada una con parámetro . Suponga que =4 y =5.
Solución:
La distribución Gamma puede representarse entonces como la suma de
variables iid exponenciales cada una con parámetro . De modo que tenemos:
𝑓(𝑥) =∑𝛼𝑒−𝛼𝑥𝑖
4
𝑖=1
En el material desarrollado vimos que usando la transformada inversa para la exponencial se tiene:
𝑥𝑖 = −1
𝛼ln(1 − 𝑟𝑖) , 𝑖 = 1,2,3,4
Por tanto:
0.638570
0.102171
0.125543
0.178799
𝑟1 =
𝑟2 =𝑟3 =𝑟4 =
0.132822
0.424010
0.761175
0.546615
𝑟1 =
𝑟2 =𝑟3 =𝑟4 =
MODELACIÓN ESTOCÁSTICA.
𝑥 = (1
𝛼)∑ln(1 − 𝑟𝑖)
4
𝑖=1
= −1
𝛼ln(∏(1 − 𝑟𝑖)
4
𝑖=1
)
Ahora, usando Excel, se generan los números: 𝑟1 = 0.467289261, 𝑟2 = 0.586165112, 𝑟3 = 0.491180205, 𝑟4 = 0.855542032
Por tanto, la primera simulación es:
𝑥 = −1
5ln(∏(1− 𝑟𝑖)
4
𝑖=1
)
= −1
5ln[(1 − 0.467289261)(1− 0.586165112)(1 − 0.491180205)(1
− 0.855542032)] = −1
5ln(0.01620407) = −
1
5(−4.12249297)
= 𝟎. 𝟖𝟐𝟒𝟒𝟗𝟖𝟓𝟗 Para la segunda simulación:
𝑟1 = 0.353629784, 𝑟2 = 0.540490564, 𝑟3 = 0.558970186, 𝑟4 = 0.266479015
𝑥 = −1
5ln[(1 − 0.353629784)(1 − 0.540490564)(1− 0.558970186)(1
− 0.266479015)] = −1
5ln[0.09608515] = −
1
5(−2.34252052)
= 𝟎. 𝟒𝟔𝟖𝟓𝟎𝟒𝟏𝟎 Para la tercera simulación:
𝑟1 = 0.15605013, 𝑟2 = 0.74620582, 𝑟3 = 0.38424669, 𝑟4 = 0.68026755
𝑥 = −1
5ln[(1 − 0.15605013)(1 − 0.74620582)(1− 0.38424669)(1
− 0.68026755)] =
−1
5ln[0.042168853] = −
1
5(−3.1660734419) = 𝟎. 𝟔𝟑𝟑𝟐𝟏𝟒𝟔𝟖𝟒
Para la cuarta simulación:
𝑟1 = 0.98798498, 𝑟2 = 0.67018686, 𝑟3 = 0.43082984, 𝑟4 = 0.51330694
𝑥 = −1
5ln[(1 − 0.98798498)(1 − 0.67018686)(1− 0.43082984)(1
− 0.51330694)] =
−1
5ln[0.001097715] = −
1
5(−6.814524431) = 𝟏. 𝟑𝟔𝟐𝟗𝟎𝟒𝟖𝟖𝟔
Para la quinta simulación: 𝑟1 = 0.75323506, 𝑟2 = 0.60685699, 𝑟3 = 0.69867496, 𝑟4 = 0.16677258
𝑥 = −1
5ln[(1 − 0.75323506)(1 − 0.60685699)(1− 0.69867496)(1
− 0.16677258)] =
−1
5ln[0.024357505] = −
1
5(−3.714915279) = 𝟎. 𝟕𝟒𝟐𝟗𝟖𝟑𝟎𝟓𝟔
3) El tiempo entre las llegadas de personas a una estética sigue una
distribución exponencial con llegadas en promedio de una persona cada
10 minutos. Sólo existe un peluquero que atiende a una persona cada 10
MODELACIÓN ESTOCÁSTICA.
minutos, con una distribución exponencial. Si hace una promoción, tendrá
en promedio un cliente cada 5 minutos. El día de trabajo es de 3 horas.
g. Realiza una simulación de un día sin promoción. El peluquero con
promoción cobra 50 pesos y sin promoción cobra 60 pesos.
Solución:
Evento de llegada. Se genera y vá guardando de manera
cronológica, el tiempo de ocurrencia del siguiente evento de
llegada (=tiempo de simulación actual +tiempo entre llegadas).
Si el peluquero está libre:
a) Se inicia el servicio y declara ocupada la instalación
(peluquero).
Se van actualizando las estadísticas de utilización de la
instalación.
b) Se genera y guarda cronológicamente el tiempo del evento de
salida del cliente (=tiempo de simulación actual+ tiempo de
servicio)
Si la instalación está ocupada, se pone al cliente en la cola y se
actualiza la estadística de la cola.
Evento de salida.
Si la cola está vacía, se declara ociosa la instalación, se actualiza las
estadísticas de utilización de la instalación.
Si la cola no está vacía:
a) Se selecciona un cliente de la cola, para ponerlo en la
instalación. Se actualizan las estadísticas de utilización de
instalación y la cola.
b) Se genera y guarda cronológicamente el tiempo de
ocurrencia del evento de salida del cliente(=tiempo de
simulación actual+tiempo de servicio)
Según los datos de problema, el tiempo de llegadas y de salidas con
distribución exponencial.
Si p y q representan muestras aleatorias de tiempos entre llegadas y
tiempo de servicio, entonces obtenemos:
MODELACIÓN ESTOCÁSTICA.
𝑝 = −(1
𝜆) (ln(1 − 𝑟)) , 0 ≤ 𝑅 ≤ 1
𝑞 = −(1
𝜆) (ln(1 − 𝑟) , 0 ≤ 𝑅 ≤ 1
Creamos una tabla de números aleatorios uniformes del (0,1);
entonces por cada uno de ellos, realizaremos la simulación de p, que
es el tiempo entre llegada exponencial.
Como los tiempos entre llegadas son exponenciales, el número de clientes que llega se distribuye como Poisson al igual que el número de clientes que se atienden. Por otra parte, el día de trabajo es de 3 horas, por tanto, tomando como unidad de tiempo 10 minutos, el equivalente en horas es de 6 clientes por
hora con lo que 𝜇 = 6 y la unidad de tiempo 1 hrs. Con esto, en un día de trabajo, en promedio, llegarían 18. Generamos números pseudoaleatorios entre 0 y 1 distribuidos de manera
uniforme y aplicamos 𝑥𝑖 = −1
𝜆ln(1 − 𝑟𝑖) , 𝑖 = 1,2,3,… para generar los tiempos
entre llegadas exponenciales simulados. Para esto nos ayudamos de Excel tanto en los 𝑟𝑖 como introduciendo la fórmula para los 𝑥𝑖. Luego, se tiene la siguiente tabla para los tiempos entre llegadas:
Tiempo entre llegadas en múltiplos de hora
Tiempo entre llegadas en minutos
Tiempo transcurrido
0.06583012 3.95 3.95 0.35740085 21.44 25.39 0.04923565 2.95 28.34 0.01451028 0.87 29.21 0.04834362 2.90 32.11 0.07733428 4.64 36.75 0.80516703 48.31 85.06 0.05395873 3.24 88.3 0.08152128 4.89 93.19 0.07911832 4.75 97.94 0.69958282 41.97 139.91 0.03509216 2.10 142.01 0.01354524 0.81 142.82 0.16989844 10.19 153.01 0.28707129 17.22 170.23 0.0858745 5.15 175.38
0.01670823 1.00 176.38 0.08301392 4.98 181.36
MODELACIÓN ESTOCÁSTICA.
Del mismo modo simulamos los tiempos de servicio como una exponencial en
donde también tomaremos 𝜇 = 6 clientes por hora y lo haremos hasta las 3 horas que dura abierto el servicio. Nos valemos nuevamente de Excel para
generar números pseudoaleatorios e implementar 𝑥𝑖 = −1
𝜆ln(1 − 𝑟𝑖) , 𝑖 = 1,2,3,…
para simular los tiempos de servicio exponenciales. La tabla siguiente tiene los cálculos:
Tiempo de servicio en
múltiplos de hora
Tiempo de servicio en minutos
Tiempo transcurrido
0.03606067 2.16 2.16 0.23792694 14.28 16.44 0.14336755 8.60 25.04 0.18272825 10.96 36.00 0.05321277 3.19 39.19 0.47385802 28.43 67.62 0.0514018 3.08 70.70
0.08816923 5.29 75.99 0.07057122 4.23 80.22 0.11984128 7.19 87.41 0.11369973 6.82 94.23 0.15797677 9.48 103.71 0.55895681 33.54 137.25 0.01826049 1.10 138.35 0.13773442 8.26 146.61 0.09699155 5.82 152.43 0.3990424 23.94 176.37
0.19199451 11.52 187.89
Entonces tendríamos la información reunida de la siguiente manera:
Tiempos entre llegadas Tiempos de servicio
Tiempo entre llegadas en
minutos
Tiempo transcurrido
Tiempo de servicio en
minutos
Tiempo transcurrido
3.95 3.95 2.16 2.16 21.44 25.39 14.28 16.44 2.95 28.34 8.60 25.04 0.87 29.21 10.96 36.00 2.90 32.11 3.19 39.19 4.64 36.75 28.43 67.62
48.31 85.06 3.08 70.70 3.24 88.3 5.29 75.99 4.89 93.19 4.23 80.22
MODELACIÓN ESTOCÁSTICA.
4.75 97.94 7.19 87.41 41.97 139.91 6.82 94.23 2.10 142.01 9.48 103.71 0.81 142.82 33.54 137.25
10.19 153.01 1.10 138.35 17.22 170.23 8.26 146.61 5.15 175.38 5.82 152.43 1.00 176.38 23.94 176.37 4.98 181.36 11.52 187.89
Podemos ahora comparar los tiempos de llegadas y servicios como la siguiente tabla:
Tiempo entre llegadas en minutos
Tiempo de servicio en minutos
3.95 2.16 21.44 14.28 2.95 8.60 0.87 10.96 2.90 3.19 4.64 28.43 48.31 3.08 3.24 5.29 4.89 4.23 4.75 7.19 41.97 6.82 2.10 9.48 0.81 33.54 10.19 1.10 17.22 8.26 5.15 5.82 1.00 23.94 4.98 11.52
Ahora, relacionamos la llegada de cada cliente con el servicio que se le proporciona, es decir, si 𝑥1 es el primer cliente, este llega al momento 3.95 y es atendido inmediatamente con lo que el servicio para este es de 2.16 minutos. Con esto se tiene que el cliente pasa en el sistema 2.16 minutos y la salida del
mismo es en el momento 3.95+2.16 = 6.11. Luego el segundo cliente 𝑥2 llega 21.44 minutos después de la llegada del primero, es decir, llega en el momento 3.95+21.44 = 25.39, y como el servidor está ocioso, es atendido inmediatamente y dura en el sistema 14.28 minutos (tiempo en que es atendido); luego sale de la
peluquería al tiempo 25.39+14.28 = 39.67. El tercer cliente 𝑥3 llega apenas 2.95 minutos después del segundo, es decir, al tiempo 28.34 pero el sistema está
MODELACIÓN ESTOCÁSTICA.
ocupado y tiene que esperar 39.67 – 28.34 = 11.33 minutos en la cola para ser atendido. Cuando se atiende a 𝑥3, el tiempo de servicio es de 8.60 minutos, por lo que su estancia en la peluquería será el tiempo de espera más el tiempo en que lo atienden, es decir 11.33+8.60 = 19.93 minutos y la salida tendrá lugar entonces en el instante 28.34+19.93 = 48.27. Siguiendo esto para cada caso, distinguimos aquí 4 cosas: el momento en el que se produce una llegada, el tiempo que un cliente puede esperar en la cola, el tiempo que permanece un cliente en la peluquería (tiempo de espera más el de servicio), y el momento en el que sale de la peluquería (momento en el que llegó más tiempo que dura en la peluquería). De este modo, haciendo los cálculos como antes para cada llegada asociada a un servicio, se tiene:
Cliente Momento en que llega
Tiempo que espera
Tiempo que permanece
en la peluquería
Momento en el que sale
X1 3.95 0 2.16 6.11 X2 25.39 0 14.28 39.67 X3 28.34 11.33 19.93 48.27 X4 29.21 19.06 30.02 59.23 X5 32.11 27.12 30.31 62.71 X6 36.75 25.96 54.39 91.14
X7 85.06 6.08 9.16 94.22
X8 88.3 5.92 11.21 99.51 X9 93.19 6.32 10.55 103.74
X10 97.94 5.8 12.99 110.93 X11 139.91 0 6.82 146.73
X12 142.01 4.72 14.2 156.21
X13 142.82 13.39 46.93 189.75 X14
Notemos que el último cliente salió hasta el momento 189.75 que son casi 3 horas 10 minutos. Esto quiere decir que si un cliente más llega ya no será atendido pues se terminó el turno de trabajo del peluquero. Este último cliente lo contabilizamos, pues ingresó al sistema en el minuto 142.82 esperó 13.39 por lo que comenzó su servicio en 156.21 y desde luego el peluquero no puede saber con precisión cuanto se tarda con cada cliente.
i. ¿Cuántos clientes llegaron?
Del conteo de llegadas tenemos que llegaron 13 clientes a la peluquería ii. ¿A cuántos clientes atendió?
El peluquero pudo atender a los 13 clientes iii. ¿Cuánto tardaron en promedio en la peluquería?
MODELACIÓN ESTOCÁSTICA.
Esto es el tiempo promedio que los 13 clientes permanecen en la peluquería desde que llegan hasta que son atendidos y salen. Para esto sumamos los valores de la columna “Tiempo que permanecen en la peluquería” y dividimos entre el número de clientes, es decir: 162.95/13 ≈ 20.23 minutos.
iv. ¿Cuál fue su ganancia?
Como este caso corresponde a un día sin promoción y se cobra 60, entonces la
ganancia es de (60)(13) = $780.00 v. ¿Cuánto tardo en promedio un cliente en la fila?
Esto es, sumamos la fila “Tiempo de espera” y dividimos entre el número de
clientes: 125.7
13≈ 9.7 minutos.
h. Realiza una simulación de un día con promoción.
Solución: Para este caso, simulamos como en el inciso anterior, tiempos entre llegadas y de servicios hasta que los tiempos acumulativos no sean mayores a 3 horas. En este caso, como tenemos promoción, 𝜇 = 1 por 5 minutos o 𝜇 = 12 por una hora para el caso de los tiempos entre llegadas. Para el tiempo de servicio, se simulan exponenciales con 𝜇 =6 por hora como en el inciso a). Para esto, nos valemos de Excel al generar números pseudoaleatorios entre 0 y 1 y los usamos
en la fórmula 𝑥𝑖 = −1
𝜆ln(1 − 𝑟𝑖) , 𝑖 = 1,2,3,… para simular las variables
exponenciales para cada caso, con lo que se tienen los resultados:
Tiempo entre llegadas en minutos
Tiempo transcurrido
1.97 1.97 10.72 12.69 1.48 14.17 0.43 14.6 1.45 16.05 2.32 18.37
24.15 42.52 1.62 44.14 2.45 46.59 2.37 48.96
20.99 69.95 1.05 71 0.41 71.41 5.10 76.51 8.61 85.12 2.58 87.7 1.50 89.2 2.49 91.69 5.87 97.56 2.90 100.46 3.74 104.2
12.15 116.35 8.40 124.75
MODELACIÓN ESTOCÁSTICA.
1.08 125.83 7.14 132.97 4.30 137.27 5.48 142.75 1.60 144.35
14.23 158.58 1.54 160.12 2.65 162.77 2.12 164.89 3.59 168.48 3.41 171.89 4.74 176.63
16.77 193.4
Tiempo de servicio en minutos
Tiempo transcurrido
0.55 0.55 17.71 18.26 6.60 24.86
23.23 48.09 0.58 48.67 9.77 58.44 4.34 62.78
21.10 83.88 5.01 88.89 1.24 90.13 2.73 92.86
19.33 112.19 0.39 112.58
53.03 165.61 1.90 167.51
14.49 182
Así tenemos:
Tiempo entre llegadas en minutos
Tiempo de servicio en minutos
1.97 0.55 10.72 17.71 1.48 6.60 0.43 23.23 1.45 0.58 2.32 9.77
24.15 4.34 1.62 21.10 2.45 5.01 2.37 1.24
20.99 2.73 1.05 19.33 0.41 0.39
MODELACIÓN ESTOCÁSTICA.
5.10 53.03 8.61 1.90 2.58 14.49 1.50 2.49 5.87 2.90 3.74
12.15 8.40 1.08 7.14 4.30 5.48 1.60
14.23 1.54 2.65 2.12 3.59 3.41 4.74
16.77
Con lo anterior procedemos como en el inciso a), es decir, el primer cliente 𝑥1 llega en el momento 1.97 y como no hay nadie más, se atiende inmediatamente con lo que su estancia es igual a 0.55 minutos pues es el tiempo que tarda el peluquero en atenderlo y el instante en el que sale de la peluquería es 1.97+0.55
= 2.52. Luego el segundo cliente 𝑥2 llega 10.72 minutos después que el primero, es decir, en el momento 1.97+10.72= 12.69 donde es atendido inmediatamente pues el servidor no está ocupado, de manera que su estancia en la peluquería dura lo que su servicio 17.71 minutos y por tanto sale de la peluquería en el instante 30.41. Siguiendo estos cálculos hasta que se complete la jornada de 3 horas del peluquero, se tiene la siguiente tabla:
Cliente Momento en que llega
Tiempo que espera
Tiempo que permanece
en la peluquería
Momento en el que sale
X1 1.97 0 0.55 2.52 X2 12.69 0 17.72 30.41 X3 14.17 16.24 22.84 37.01 X4 14.6 22.41 45.64 60.24 X5 16.05 44.19 44.77 60.82 X6 18.37 42.45 52.22 70.59
MODELACIÓN ESTOCÁSTICA.
X7 42.52 28.07 32.41 74.93 X8 44.14 30.79 51.89 96.03 X9 46.59 49.44 54.45 101.04
X10 48.96 52.08 53.32 102.28 X11 69.95 32.33 35.06 105.01 X12 71 34.04 53.34 124.34 X13 71.41 52.93 53.32 124.73 X14 76.51 48.22 101.25 177.76 X15 85.12 92.64 94.54 179.66 X16 87.7 91.96 106.45 194.15
89.2
El cliente 15 sale de la peluquería al minuto 179.66, por lo que el siguiente que entraría a servicio en el instante que sale el anterior y prácticamente 179.66 son las tres horas de trabajo del peluquero.
i. ¿Cuántos clientes llegaron?
Digamos que llegaron 16 pero ya no se atendió al último. ii. ¿A cuántos clientes atendió?
El peluquero atendió a 15 clientes. iii. ¿Cuánto tardaron en promedio en la peluquería?
Esto sería el promedio de la columna de tiempo de permanencia que es 713.32
15= 47.55 minutos.
iv. ¿Cuál fue su ganancia?
En este caso cobró 50 pesos y fueron 15 clientes que atendió, por tanto la ganancia es de (50)(15) = $750.00
v. ¿Cuánto tardo en promedio un cliente en la fila?
Esto es el promedio de la columna tiempo de espera en la tabla, el cual es: 545.83
15≈ 36.40 minutos.
i. Haciendo uso de los conocimientos de la unidad 2 y 3, compara
resultados y elabora una conclusión del ejercicio.
En la unidad 2 revisamos los modelos de colas en donde se planteaba un problema en base quizá a observaciones hechas tanto en los tiempos entre llegadas como de servicios definiendo la forma en que estos se distribuyen. Luego, dependiendo del tipo de problema, se determinaba la información de interés como los tiempos medios de espera en la fila, los tiempos medios de estancia en el sistema, la estabilidad del sistema, etc. mediante fórmulas que tienen que ver con el cálculo de algunas probabilidades iniciales. En suma, el tratamiento de estos problemas es de manera más bien analítica o indirecta. En cambio, en la presente unidad, revisamos la forma de simular variables aleatorias, y en el presente ejercicio sobre filas de espera, hemos simulado las variables aleatorias involucradas, a saber, los tiempos entre llegadas y de servicio. Con esto, hemos simulado todo el proceso, es decir, se simuló cada llegada, cada tiempo de servicio para los clientes, la espera de cada uno en la fila, su estancia en el sistema, etc. con esto, ahora hemos obtenido la
MODELACIÓN ESTOCÁSTICA.
información que nos interesa de manera directa de la simulación del proceso, es decir, ya no la tuvimos que estimar.
4) Suponga que tres barcos A, B y C se encuentran en combate. La fuerza
de cada barco se mide por la probabilidad que tiene de acertar a su
oponente al disparar. La probabilidad que tiene el barco A de eliminar a
un oponente es de 0.5 mientras que las probabilidades de B y C son de
0.40 y 0.3 respectivamente. El tiempo entre disparos es una distribución
exponencial con media de 1 minuto entre cada disparo. Un barco siempre
disparará al más fuerte de sus oponentes (o de los que aún queden). El
combate continuará hasta que queden uno o ceros barcos. Resuelve
utilizando un modelo de simulación y Realiza 10 combates. Nota: en este
caso no existe posibilidad de que los barcos disparen simultáneamente ya
que el tiempo de disparo es aleatorio.
Solución: Tenemos que los tiempos entre cada disparo se distribuyen de forma exponencial con media de un disparo por minuto. Luego, si generamos 3 exponenciales una por cada barco en el orden A, B, C para saber quién realiza un disparo primero, así tenemos:
A 0.39498072
B 0.00655182
C 0.29541388
De manera que B dispara primero y lo hará contra A que es el más fuerte entre A y C. Luego, generamos un número aleatorio uniforme y lo comparamos con la
probabilidad que tiene B de acertar a su oponente, es decir, 𝑃𝐵 = 0.40. Con la ayuda de Excel generamos 𝑟 = 0.61, de tal manera que 𝑟 < 𝑃𝐵 . Notemos que los exponenciales son los tiempos entre los disparos, por tanto el de menor valor es quien hace el primer disparo. Entonces, simulamos los tiempos entre los disparos y tenemos la siguiente tabla:
A 0.39498072
B 0.00655182 C 0.29541388 A 1.29993882
B 0.67695084
C 1.44655756
Donde se ve por ejemplo que tira primero B, luego C, luego A, luego B, luego A y por último C. Esto es solo la parte de los tiempos entre disparo que simula el orden en que van disparándose entre sí los barcos. Ahora, como siempre se trata de disparar al más fuerte o al que quede, para simular esto, se simulan variables binomiales que corresponden a las probabilidades que tiene cada barco de acertar a su objetivo, es decir que si
𝑟 < 𝑃𝐵 con 𝑟 un número pseudoaleatorio entre 0 y 1 entonces el barco que
MODELACIÓN ESTOCÁSTICA.
realizó el disparo ha acertado a su oponente y lo saca de la batalla, en caso contrario no acierta y vemos que pasa con el barco que realiza el siguiente disparo (recordar que los barcos nunca disparan simultáneamente). Teniendo esto en cuenta, cada que un barco acierta al objetivo le ponemos valor 1 a la variable aleatoria y 0 si no acierta. Podemos resumir la simulación en una tabla con las columnas que ya teníamos sobre los barcos y los tiempos entre disparos, más otra columna con los números pseudoaleatorios que sirven de comparación para determinar la variable que dice si un barco acertó o no, y otra columna donde se indique el barco que va quedando fuera de combate, es decir:
COMBATE NAVAL
A quien le pegan (1 si acierta, 0
si no acierta)
Queda
Barcos Tiempo entre
disparos
Probabilidades de acertar de
cada barco
Números pseudoaleatorios
(determinar si aciertan)
A B C
A 0.39498072 0.5 0.835466973 0 B 0.00655182 0.4 0.437000272 0 C 0.29541388 0.3 0.794410606 0 A 1.29993882 0.5 0.546210264 0 B 0.67695084 0.4 0.328580156 1 C 1.44655756 0.3 0.225019593 1 C
A 0.14891381 0.5 0.149432974 1 B 0.57266415 0.4 0.94764536 0 C 3.33884617 0.3 0.280901094 1 C
A 1.06503168 0.5 0.511118887 0 B 0.23379599 0.4 0.142602268 0 C 0.07377247 0.3 0.434940109 0 A 0.45350737 0.5 0.217943615 1 B 0.17788308 0.4 0.620252418 0 C 0.37323824 0.3 0.212168581 1 C
A 0.23554449 0.5 0.385645093 1 B 1.53321461 0.4 0.105044849 1 C 0.03141517 0.3 0.868994805 0 C
A 1.53107741 0.5 0.337256751 1 B 2.57881623 0.4 0.580065608 0 C 0.66916099 0.3 0.902868791 0 A 0.37323824 0.5 0.87958174 0 C 1.04975034 0.3 0.177345446 1 C
MODELACIÓN ESTOCÁSTICA.
A 1.0430157 0.5 0.497203341 1 B 0.83549583 0.4 0.306102647 1 C 0.6416326 0.3 0.195962446 1
A 0.24129493 0.5 0.227197317 1 B 2.5434048 0.4 0.143236083 1 C 1.11195154 0.3 0.285782438 1
A 1.01544463 0.5 0.576678055 0 B 1.16936004 0.4 0.391647176 1 C 1.53107741 0.3 0.494853736 0 B 0.02994378 0.4 0.119782862 1 C 1.05757296 0.3 0.279922907 1
A 1.1951942 0.5 0.932449015 0 B 0.02814208 0.4 0.216337725 1 C 0.14214613 0.3 0.501528744 0 B 0.47034312 0.4 0.000299747 1 B C 0.39103792 0.3 0.879495296 0
A 0.67018812 0.5 0.177608009 1 B 0.57136971 0.4 0.857579909 0 C 0.719927093 0.3 0.734910856 0 A 0.64824532 0.5 0.08681818 1 A C 1.35628795 0.3 0.707442137 0
a. Determina el número de veces que cada barco gana.
Aquí vemos que A gana 1 combate, B gana 1 combate y C gana 5 combates. b. Determina cuánto tiempo en promedio duran los combates.
Para esto, tómese en cuenta que el tiempo es la suma de los tiempos entre los disparos, entonces sumamos los tiempos en cada combate y nos da:
Combate 1 4.12039364
Combate 2 4.06042413
Combate 3 2.37722883 Combate 4 1.80017427
Combate 5 6.20204321 Combate 6 2.52014413
Combate 7 3.89665127
Combate 8 4.80339882 Combate 9 2.22686345
Combate 10 3.96601819
MODELACIÓN ESTOCÁSTICA.
Los sumamos y los dividimos entre los 10 combates y nos da: 35.9733399 / 10 = 3.59733399, es decir duran aproximadamente 4 minutos.
5) En cierta nación hay tres partidos políticos principales, el liberal (L), el
conservador (C) y el demócrata (D). La matriz de transición siguiente da
las probabilidades de que la nación sea controlada por cada uno de los
tres partidos políticos después de una elección, conocidas las diversas
posibilidades del resultado de la elección anterior.
0.7 0.2 0.10.5 0.3 0.20.3 0.4 0.3
i) Elabora 2 simulaciones considerando que 0=(0,1,0) y supón que cada
año realizan elecciones durante 5 años. Elabora promedios de tiempo
que cada partido político estará en el gobierno.
Solución: Entonces, son dos simulaciones considerando que cada año hay elecciones y esto durante 5 años, por tanto, se harán 10 simulaciones. Para ello generamos primero 10 números pseudoaleatorios entre 0 y 1 distribuidos uniformemente que servirán como datos para simular primero 10 variables aleatorias de distribución empírica. Para esto se tiene la siguiente tabla:
F(x) Datos
0 0.2521 0.1 0.7009 0.2 0.7284 0.3 0.6478 0.4 0.2411 0.5 0.3571 0.6 0.1424 0.7 0.4258 0.8 0.3143 0.9 0.6109 1 0.4042
Luego para 𝑟 = 0.4112 se tiene 𝐹(𝑥1) = 0.4, 𝐹(𝑥2) = 0.5 de donde:
𝑅𝑖 =(𝑥2 − 𝑥1)(𝑟 − 𝐹(𝑥1))
𝐹(𝑥2) − 𝐹(𝑥1)+ 𝑥1 =
0.116(0.4112 − 0.4)
0.1+ 0.2411 = 𝟎. 𝟐𝟓𝟒𝟏
Siguiendo este algoritmo tenemos:
𝒓𝒊 𝑹𝒊
0.4112 0.2541 0.9462 0.5154 0.6753 0.3562 0.5625 0.2229 0.3065 0.6214
MODELACIÓN ESTOCÁSTICA.
0.9155 0.5789 0.2052 0.7242 0.8245 0.3870 0.6287 0.2237 0.3054 0.6258
Ahora bien, siguiendo el orden de los partidos L, C, D tenemos que 0=(0,1,0) lo que supone que se empieza con C gobernando. Entonces:
C D L
E1 C 0.3 0.2 0.5 E2 D 0.4 0.3 0.3 E3 L 0.2 0.1 0.7
Luego, elaboramos la frecuencia acumulada por renglón para establecer los rangos de cada estado E1, E2, E3. Esto es:
F. Acumulada F. Acumulada F. Acumulada
E1 E2 E3 0.3 0.4 0.2 0.5 0.7 0.3 1 1 1
Para E1 Para E2 Para E3 Si ri Si ri Si ri
[0, 0.3] Pasa Xj = E1 [0, 0.4] Pasa Xj = E1 [0, 0.2] Pasa Xj = E1 (0.3, 0.5] Pasa Xj = E2 (0.4, 0.7] Pasa Xj = E2 (0.2, 0.3] Pasa Xj = E2 (0.5, 1] Pasa Xj = E3 (0.7, 1] Pasa Xj = E3 (0.3, 1] Pasa Xj = E3
De esta manera comparamos los rangos de cada estado con 𝑅𝑖 que son los valores empíricos simulados al principio. Así se tiene que la primera simulación que consiste en 5 años con elecciones cada año es:
Año de elecciones 𝑹𝒊 𝑿𝒊 𝑿𝒋
1 0.2541 E1 E1 2 0.5154 E1 E3 3 0.3562 E3 E3 4 0.2229 E3 E2 5 0.6214 E2 E2
La segunda simulación quedaría:
Año de elecciones 𝑹𝒊 𝑿𝒊 𝑿𝒋
1 0.5789 E1 E3 2 0.7242 E3 E3
MODELACIÓN ESTOCÁSTICA.
3 0.3870 E3 E3 4 0.2237 E3 E2 5 0.6258 E2 E2
Obsérvese que hemos empezado en E1 que corresponde al partido C de
acuerdo con 0=(0,1,0) si en la matriz estocástica el orden es L,C,D. De lo anterior, vemos que para la primera simulación, C pasa 2 años en el poder, D pasa 1 año y L 2 años. En la segunda simulación, C pasa un año en el poder, D pasa un año y L 3 años.
ii) Elabora 2 simulaciones considerando que 0=(0,0,1) y supón que cada
año realizan elecciones durante 5 años. Elabora promedios de tiempo
que cada partido político estará en el gobierno.
Solución: Procediendo de la misma manera que en el inciso i), se tiene primero:
F(x) Datos
0 0.8000 0.1 0.7446 0.2 0.5266 0.3 0.6227 0.4 0.8328 0.5 0.5642 0.6 0.4959 0.7 0.9425 0.8 0.2028 0.9 0.6208 1 0.6194
𝒓𝒊 𝑹𝒊
0.3162 0.6567 0.5295 0.5440 0.1707 0.5904 0.7246 0.7605 0.7956 0.2353 0.5555 0.5263 0.9763 0.6197 0.1362 0.6657 0.9911 0.6195 0.6093 0.5374
Ahora bien, siguiendo el orden de los partidos L, C, D tenemos que 0 = (0,0,1) lo que supone que se empieza con D gobernando. Entonces:
MODELACIÓN ESTOCÁSTICA.
D L C
E1 D 0.3 0.3 0.4 E2 L 0.1 0.7 0.2 E3 C 0.2 0.5 0.3
Luego, elaboramos la frecuencia acumulada por renglón para establecer los rangos de cada estado E1, E2, E3. Esto es:
F. Acumulada F. Acumulada F. Acumulada
E1 E2 E3
0.3 0.1 0.2 0.6 0.8 0.7 1 1 1
Para E1 Para E2 Para E3
Si ri Si ri Si ri [0, 0.3] Pasa Xj = E1 [0, 0.1] Pasa Xj = E1 [0, 0.2] Pasa Xj = E1
(0.3, 0.6] Pasa Xj = E2 (0.1, 0.8] Pasa Xj = E2 (0.2, 0.7] Pasa Xj = E2 (0.6, 1] Pasa Xj = E3 (0.8, 1] Pasa Xj = E3 (0.7, 1] Pasa Xj = E3
De esta manera comparamos los rangos de cada estado con 𝑅𝑖 que son los valores empíricos simulados al principio. Así se tiene que la primera simulación que consiste en 5 años con elecciones cada año es:
Año de elecciones 𝑹𝒊 𝑿𝒊 𝑿𝒋
1 0.6567 E1 E3 2 0.5440 E3 E2 3 0.5904 E2 E2 4 0.7605 E2 E2 5 0.2353 E2 E2
La segunda simulación quedaría:
Año de elecciones 𝑹𝒊 𝑿𝒊 𝑿𝒋
1 0.5263 E1 E2 2 0.6197 E2 E2 3 0.6657 E2 E2 4 0.6195 E2 E2 5 0.5374 E2 E2
En la primer simulación el partido D pasa 1 año en el poder, el partido L 3 años y el partido C un año. En la segunda simulación D pasa un año, L pasa 4 años y C ninguno.
MODELACIÓN ESTOCÁSTICA.
5) Se tienen los diferentes llenados de cajas de cereal en una fábrica. Con
los siguientes datos:
F(x) Llenado de 300
gramos
0.0 250
0.10 292
0.20 295
0.30 297
0.40 298
0.50 299.5
0.60 300
0.70 302
0.80 305
0.90 310
1 315
Se sabe que por cada gramo extra que contenga la caja se tiene una pérdida de 2 pesos.
i. Realice la simulación de 20 cajas.
Solución: En primera instancia se observa que la tabla corresponde al llenado unitario que corresponden a las probabilidades acumuladas de 0 hasta 1. Entonces, corresponde hacer una simulación de distribución empírica continua. Para esto,
se generan los números aleatorios 𝑟1 = 0.2853 de donde 𝐹(𝑥1) = 0.2, 𝐹(𝑥2) =0.3 y los valores de 𝑥1 = 295 y 𝑥2 = 297. Al sustituir en:
𝑥 =(𝑥2 − 𝑥1)(𝑟 − 𝐹(𝑥1))
𝐹(𝑥2) − 𝐹(𝑥1)+ 𝑥1 =
2(0.2853 − 0.2)
0.1+ 295 = 𝟐𝟗𝟔. 𝟕𝟎𝟔
Siguiendo el proceso para 20 datos, se tiene:
𝒓𝒊 𝒙𝒊(Cajas)
0.2853 296.706
0.8087 305.435
0.2518 296.036
0.4547 298.8205
0.5514 299.757
0.4471 298.7065
0.6784 301.568
0.0864 286.288
0.1168 292.504
0.7148 302.444
0.9295 311.475
0.4322 298.483
MODELACIÓN ESTOCÁSTICA.
0.2759 296.518
0.1592 293.776
0.5464 299.732
0.4023 298.0345
0.2867 296.734
0.9229 311.145
0.9199 310.995
0.9227 311.135
ii. ¿Cuántas cajas tendrán exactamente 300 gramos?
De la tabla, vemos que ninguna caja simulada tiene exactamente 300 gramos. iii. ¿Cuál es la probabilidad de tener 300 o menos gramos?
Esta probabilidad sería 𝑃(𝑋 ≤ 300) y como vemos que hay 20 cajas de las
cuales 12 cumplen 𝑋 ≤ 300, entonces, por simple regla de tres, 13∗100
20= 65, es
decir la probabilidad es del 65%. iv. ¿Cuál será la pérdida calculada para esta simulación?
Tenemos que la perdida es de 2 pesos por cada gramo extra. Luego, las cajas que exceden los 300 gramos son:
305.435
301.568 302.444 311.475 311.145 310.995 311.135
De aquí, a cada cantidad le restamos 300 y la multiplicamos por 2 para saber la pérdida en cada caso, la suma, será la pérdida total, es decir:
Cajas excedidas pérdida
305.435 10.87
301.568 3.136
302.444 4.888
311.475 22.95
311.145 22.29
310.995 21.99
311.135 22.27
Pérdida total = 108.394
MODELACIÓN ESTOCÁSTICA.
CONCLUSIONES GENERALES DEL TRABAJO.
En esta evidencia, pudimos observar, que algunos problemas se pueden
resolver por medio de números pseudoaleatorios, los cuales, pueden
generar un conjunto muy grande de números sin mostrar correlación entre
ellos, y para ello, podemos utilizar ciertos métodos preestablecidos que
garantizan esta demanda. Entonces, para realizar una simulación, es
preciso generar una serie de números que sean aleatorios por sí mismos, y
que su aleatoriedad se extrapola al modelo de simulación que se está
construyendo.
En la construcción del modelo los números aleatorios juegan un papel
relevante, el sistema puede generar números pseudo-aleatoros por medio
de algoritmos congruenciales y no congruenciales; para cada algoritmos, el
sistema recomienda realizar las pruebas de Media, Varianza y Chi cuadrada,
con el objetivo de saber, si los números generados son aceptados o
rechazados.
ACTIVIDAD A CARGO DEL FACILITADOR 3.
En una empresa que fabrica ventiladores, se está elaborando un análisis de la
duración de sus ventiladores se cree que la vida característica es de 3 años.
Además se piensa que el su desgaste crece en forma 1.5 cada año. Se tienen
los siguientes datos:
1.50923032 0.87065021 8.50543576 0.49308679
3.82166483 6.60855197 4.95103743 3.49755942
3.8650723 1.57942825 3.99065026 1.8230526
0.77352532 4.03772305 1.9745555 3.98617647
2.36215509 2.10174448 5.46062918 2.97205754
3.02431857 0.70902955 0.53181479 4.64618251
2.48022209 3.39092002 3.07573105 1.93392071
1.19263937 3.28749872 2.29038102 1.20372836
1.72466787 1.48968017 1.44811212 3.25361879
1.47477626 4.47209886 1.79678429 4.15074596
Se contrata a un alumno de la UNAD que va en séptimo semestre para
realizar un análisis de los datos, por tanto será necesario obtener:
MODELACIÓN ESTOCÁSTICA.
1. Histograma de Frecuencias (gráfica y tabla).
2. Media y Varianza (explicar que significan estos valores con respecto
al problema).
MODELACIÓN ESTOCÁSTICA.
3. Se sabe que por cada ventilador que falle antes de los tres años, se
tiene que pagar $550 al cliente, de los resultados cuanto se tendrá que
pagar en total. ¿Cuál será la probabilidad de que el ventilador falle
antes de los tres años (utilice el histograma para calcular esta
probabilidad? ¿Cuál es la probabilidad de que dure 3 o más años?
MODELACIÓN ESTOCÁSTICA.
4. Prueba de bondad de ajuste para justificar la distribución a utilizar y
estimación de parámetros.
PRUEBA DE BONDAD DE AJUSTE. MÉTODO CHI-
CUADRADA.
Probaremos con la hipótesis dada de una distribución poisson según la gráfica
obtenida.
int FO F0/40 fx(0/.99) FE
1 0.49-1.64 12 0.3 0.010101 0.06464 2 1.64-2.78 9 0.225 0.010101 0.06464 3 2.78-3.93 9 0.225 0.010101 0.06464 4 3.93-5.7 7 0.175 0.010101 0.06464 5 5.7-6.22 1 0.025 0.010101 0.06464 6 6.22-7.36 1 0.025 0.010101 0.06464
MODELACIÓN ESTOCÁSTICA.
7 7.36-8.51 1 0.025 0.010101 0.06464 Datos 40 1
𝑛 = 40 (número de datos conocidos)
√𝑛 𝑐𝑙𝑎𝑠𝑒𝑠 = √40 = 6.32 ≈ 7 𝑐𝑙𝑎𝑠𝑒𝑠
Cálculo de la Media y de la Varianza.
Media 𝒂+𝒃
𝟐=
𝟎+𝟗
𝟐= 𝟒. 𝟓 Varianza = 𝟎. 𝟎𝟕𝟔𝟓𝟎𝟕
Considerando que el comportamiento se asemeja a una distribución Poisson
entre:
𝒂 = 𝟎 𝒚 𝒃 = 𝟗 , 𝒇(𝒙|𝟎, 𝟎. 𝟗𝟗), 𝟎 ≤ 𝒙 ≤ 𝟎. 𝟗𝟗
Calculamos la frecuencia esperada para cada uno de los intervalos (𝐹𝐸𝑖),
integrando la función de densidad propuesta y multiplicándola por el número
total de datos.
𝒇(𝒙) = ∫ (𝟎. 𝟎𝟏
𝟗)
𝟏.𝟔𝟒
𝟎
𝒅𝒙 = 𝟎. 𝟎𝟎𝟏𝟏𝟏
Multiplicado por 𝑛 𝑑𝑎𝑡𝑜𝑠 → 0.00111 ( 40) = 0.04444
Cálculo del estimador C. Donde:
m = número de intervalos considerado para construir la tabla de
frecuencias.
FOi = frecuencia observada para el i-ésimo intervalo.
FEi = frecuencia esperada para el i-ésimo intervalo.
Determinemos el estimador C con los valores obtenidos y m = 6 por medio
de:
C=∑(𝐹𝐸𝑖−𝐹𝑂𝑖)
2
𝐹𝐸𝑖
𝑚𝑖=1 =
(0.06464−5)2
0.06464+(0.06464−8)2
0.06464+(0.06464−6)2
0.06464
+(0.06464−6)2
0.06464+(0.06464−6)2
0.06464+(0.06464−3)2
0.06464+(0.06464−6)2
0.06464=
= 376.82+974.16+544.99+544.99+544.99+133.29+544.99=3664.23
MODELACIÓN ESTOCÁSTICA.
Cálculo de chi –cuadrada.
Calculamos el valor de chi cuadrada con 𝑑𝑓 = 𝑘 − 1 = 7 − 1 = 6 grados de
libertad y un nivel de confianza del 95% donde k es el número de parámetros
estimados de la distribución donde, si el estimador C es menor o igual a éste,
entonces no podremos refutar que nuestra propuesta de modelo es correcta,
pues no se puede rechazar la hipótesis de que nuestra información histórica
encaja en el modelo probabilístico que propusimos.
𝝌𝜶,𝒅𝒇𝟐 =𝝌𝟓%,𝟔
𝟐 =12.5238 (según tabla)
Por tanto C < 𝝌𝟓%,𝟔𝟐 o sea 3664.23< 12.5238
Por lo tanto, no se rechaza la hipótesis planteada.
5. Simular 40 ventiladores con dos propuestas con diferentes valores
para los parámetros. Calcule el costo de pago a los clientes de sus
diferentes propuestas. Calcule probabilidad para sus datos simulados
como en el inciso 3.
6. Elija entre sus propuestas o el funcionamiento actual del sistema.
Justifique su razonamiento.
7. Concluya considerando la utilidad de la simulación en este tipo de
problemas.
AUTORREFLEXIÓN 3.
1. Elabora una simulación. Plantea el problema.
MODELACIÓN ESTOCÁSTICA.
Los socios de la Empresa Electrónica Hnos. desean realizar varias
promociones de la venta de varios productos ahorradores de energía , en
5 diferentes módulos en las principales ciudades de la entidad, la elección
de eso 5 módulos, se realizarán al azar, para obtener los lugares donde se
instalarán para la promoción de los productos. Para este ejercicio, se
usarán los números pseudoaleatorios. Núm de Modulo Nombre del Módulo.
0 Culiacán 1
1 Culiacán 2
2 Culiacán 3
3 Culiacán 4
4 Culiacán 5
5 Mazatlán 1
6 Mazatlán 2
7 Mazatlán 3
8 Mazatlán 4
9 Mazatlán 5
10 Los Mochis 1
11 Los Mochis 2
12 Los Mochis 3
13 Los Mochis 4
14 Los Mochis 5
15 Guasave 1
16 Guasave 2
17 Guasave 3
18 Guamúchil 1
19 Guamúchil 2
20 Guamúchil 3
21 Guamúchil 4
22 Mazatlán 6
23 Rosario 1
24 Cosalá 1
25 Concordia 1
26 El Fuerte 1
27 El Fuerte 2
28 Choix 1
29 Choix 2
30 Angostura 1
31 Badiraguato 1
MODELACIÓN ESTOCÁSTICA.
2. En el siguiente enlace elabora un resumen de tu aplicación y coloca
Tres diapositivas con tu resumen:
https://docs.google.com/presentation/d/14QIi7apyZ2oxTWbm2CKoM0lz9
Cid7Qlr7Bb0hJDLejY/edit?usp=sharing
MODELACIÓN ESTOCÁSTICA.
MODELACIÓN ESTOCÁSTICA.
MODELACIÓN ESTOCÁSTICA.
3. Responde las siguientes preguntas:
1. ¿Esta unidad cómo contribuye a mi aprendizaje?
Contribuye en mucho, pues en lo personal, todo lo que aprendí
me va a servir para poder realizar algún proyecto que vaya a realizar,
pues considero que esta materia, es la que más vamos a aplicar en el
trabajo o proyecto y por eso, es importante, tratar de asimilar cada
método aprendido, dado que la simulación se enfoca en muchas áreas y
es muy diversa, sobre todo, podemos verla en los campos de la
Logística y la Economía, así como en otras disciplinas que manejan
tanto la parte física y los procesos de producción; la simulación permite
hacer optimizaciones, modificaciones, hacer predicciones sobre
procesos financieros que puedan ocurrir, permite también, realizar
reducciones de costo de pruebas utilizando tan sólo modelos, sin tener
que afectar la realidad
2. ¿Qué me falta para mejorar mi aprendizaje de la materia?
Me dí cuenta, que hay que estar en continuo repaso de los
conocimientos que adquirimos sobre Estadística, Probabilidad,
Procesos Estocásticos, tener más firmes las funciones matemáticas así
como los principios básicos relativas a las variables aleatorias. Otra
cosa muy importante, dominar algunas herramientas de computación
para realizar simulaciones, con el objetivo de dar más calidad a las
presentaciones.
3. ¿Qué realicé durante el bloque que me hace sentir orgulloso de mi
aprendizaje?
Resulta un poco difícil dar respuesta a esta pregunta, ya que,
sinceramente, me habría gustado dar más de mí, pero la presión de
trabajo me impidió dedicarle unas pocas más horas, para marcar la
diferencia, y tener al cien las actividades; aunque reconozco que sí le
dediqué mucho más tiempo a esta materia que a las otras en cuanto a
tiempo para realizar cada una de las actividades.