Upload
bo-mccullough
View
227
Download
6
Embed Size (px)
DESCRIPTION
第 5 章 中心极限定理与大数定律. 大数定理: 讨论大量随机变量的算术平均值稳定性的一系列定理. 中心极限定理: 讨论在什么条件下,大量随机变量之和的极限分布为正态分布的一系列定理. 1. 大数定律. 定义 设随机变量序列 { X n } , 如果存在一个常数 列 , 使 得对任意的 ε>0 ,有. 则称 { X n } 服从大数定律. 大数定理. 马尔可夫大数定理. 切比雪夫大数定理. 泊松大数定理. 伯努利大数定理. 辛钦大数定理. 定理 1 ( 马尔可夫大数定律 ) 设 {X n } 为随机变量序列 , 且有 - PowerPoint PPT Presentation
Citation preview
返回
大数定理: 讨论大量随机变量的算术平均值稳定性的一系列定理
中心极限定理: 讨论在什么条件下,大量随机变量之和的极限分布为正态分布的一系列定理
第 5章 中心极限定理与大数定律
返回
1. 大数定律
定义 设随机变量序列 {Xn}, 如果存在一个常数列 , 使
得对任意的 ε>0 ,有
1lim 1
n
ii
nn
XP a
n
则称 {Xn} 服从大数定律 .
na
返回
大数定理 大数定理
切比雪夫大数定理
辛钦大数定理 伯努利大数定理
马尔可夫大数定理
泊松大数定理
返回
定理 1 ( 马尔可夫大数定律 )
设 {Xn} 为随机变量序列 , 且有
则对任意的 ε>0 , 有1 1
1 1lim 1n n
i ini i
P X EXn n
12
( )0 )
n
ii
D Xn
n
(
2
1 12 2 2
1 1
( )1
1( ) ( )1 1 1 1 1
n n
i in ni i
i ii i
D XX EX
D X D Xn
X EXn n n
由切比雪夫不等式:P 得
P
证 :
返回
定理 2 ( 切比雪夫大数定律 ) 设 {Xn} 是两两不相关随机变量序列 , 方差一致有界 D(Xn)=σn
2 <C (n=1,2,...), 其中常数 C 与 n 无关 , 则对任意的 ε>0, 有
1 1
1 1lim 1n n
i ini i
P X EXn n
2
1 12 2 2 2 2
1 1
( )1
1( ) ( )1 1 1 1 1 1
n n
i in ni i
i ii i
D XX EX
D X D Xn nC
P X EXn n n n
由切比雪夫不等式P 得证 :
返回
1lim 1
n
in i
n
pP
n n
定理 3 ( 泊松大数定律 ) 设每次试验中事件 A 发生的概率为 , n 次重复独立试验中事件 A 发生的次数为 , 事件的频率 , 则对任意 ε>0, 有n
nn
1 1
1 1 1n n
i ii i
P X EXn n
证 :
1
n
in i
pP
n n
1 1, , (1 )
0 4k k k k k k
k AX EX p DX p p
k A
第 次 发生定义:
第 次 不发生
kp
返回
1lim
pn
P n
n
定理 4 ( 伯努里利大数定律 ) 设每次试验中事件 A 发生的概率为 p , n 次重复独立试验中事件 A 发生的次数为 ,事件的频率有 , 则对任意 ε>0,
nnn
( 伯努里利大数定律是泊松大数定律的特例 )
意义: Bernoulli 大数定理表明当试验次数无限增加时事件 A 的频率按概率收敛到事件 A 的概率 .
这为频率的稳定性提供了理论依据 .
返回
11lim1
n
ii
nX
nP
定理 5 ( 辛钦大数定律 ) 设 {Xi} 为相互独立的随机变量序列 , 且有相同期望 E(Xi)=u,(i=1,2,...), 则对任意的 ε>0 ,有
大数定理是参数估计和假设检验的重要理论基础 .
注意 辛钦大数定理成立的条件中只需 的数学期望存在;而当 的方差存在时,其即为切比雪夫大数定理的直接推论 .
iX
iX
返回
1. 中心极限定理:
概率论中有关论证随机变量和的极限分布是正态分布 (Gauss) 分布
的一系列定理。
意义 : 大量的独立同分布的随机变量之和的分布 可近似认为是正态分布 .
这是数理统计中大样本问题研究的理论基础 .
返回
定理 6 林德贝格 - 勒维定理 ( 独立同分布中心极限定理 ) 设 X1,X2,…,X n,… 为独立同分布序列 , 期望 μ, 方差 σ2>0, 设
)n,n(N~X 2n
1ii
注 以上定理表明只要 n 比较大 , 就有近似结果 :
)(}{lim)(lim 1 xxn
nXPxF
n
ii
nY
n n
有则对任意)(分布函数为 xxFn
nXY
nY
n
ii
n ,1
返回
例 1 用机器包装味精 , 每袋味精净重为随机变量 ,期望值为 100 克 , 标准差为 10 克 , 一箱内装 200袋味精 , 求一箱味精净重大于 20500 克的概率 ?
解 设一箱净重为 X, 箱中第 i 袋味精净重为 Xi,(i=1,2,…,200)
则 X1,X2,…,X200 独立同分布 , EXi=100, DXi=102=100,且
200
1iiXX 由中心极限定理得 X 近似服从正态分布 ,
EX=200EXi=20000, DX=200DXi=20000,
所求为 P(X>20500)=1-P(X≤20500)
)20000
2000020500(1
)54.3(1 =0.0002
故一箱味精净重大于 20500 的概率为 0.0002.
返回
例 2 一生产线生产的产品成箱包装 , 每箱的重
量是随机的 . 假设每箱平均重 50kg, 标准差为 5kg. 若用最大载重量为 5 吨的汽车承运 , 试用中心极限定理说明每车最多可以装多少箱 , 才能保障不超载的概率大于 0.9772.
解 设 Xi(i=1,2,…,n) 为装运的第 i 箱的重量 ,n 是所求的箱数 .则 X1,X2,…,Xn 独立同分布 , EXi=50, DXi=52=25, 令 ,
1
n
iin XY
由中心极限定理得nYDnYE nn 25)(,50)( 则
)2(9772.05
505000)5000(
n
nYP n
所以 ,2101000
n
n0199.98n
即最多可以装 98 箱 .
返回
lim ( ) ( ) ( )(1 )
n
n
npP a b b a
np p
定理 7 若随机变量 μn ~B (n,p)(n=1,2,…), 则对任
意 a<b 有
注 :
(1) 定理称为棣莫佛 - 拉普拉斯定理 .
(2) 它表示当 n 很大时 , 二项分布可用正态分布近似逼近 :
即 若 X~B(n,p), 当 n 很大时 , 有近似结果 X~N[np,np(1-p)]. 2( )
2 (1 )1(1 )2 (1 )
k npk k n k np pnC p p e
np p
返回
定理 8 ( 泊松定理 ) 二项概率的泊松近似
( )(1 ) , ,
!
k npk k n kn
np eC p p n p
n
较大 较小,近似程度较高
例 3: 每颗子弹击中飞机的概率为 0.01, 连发 500发 , 求命中 5 发的概率 .
5 5 495500
55
0
2
500 ( ) 0.01,
( 5) 0.01 0.99 0.1764,
5( 5) 0.17547, ( 5)
5!
( 5) 0.159312 500 0.01 0.99
P A
P X C
P X e np
eP X
解:看作 次伯努里试验.
返回
例 4 某保险公司多年的统计资料表明 , 在索赔户
中被盗索赔户占 20%, 随机抽查 100 户 , 利用棣莫佛 - 拉普拉斯积分定理求被盗索赔户不少于 14 户且不多于 30 户的近似值 .解 设 X 表示 100 户中被盗索赔户数 , 则X~B(100,0.2)
由棣莫佛 - 拉普拉斯定理得: X 近似服从正态分布 ,
EX=np=20, DX=np(1-p)=16,
所以 X~N(20,16)
所求 P(14≤X≤30) )4
2014()
4
2030(
)5.1()5.2(
)]5.1(1[)5.2( =0.927
返回
0083.00387.0!30
20
!14
20
8.02.08.02.0
2030
2014
703030100
861414100
eeP
CCP
返回
例 5 某校有 4900 个学生,已知每天每个学生去阅览室自修的概率为 0.1, 问阅览室要准备多少座位,才能以此为准99% 的概率保证每个去阅览室自修的学生都有座位。
4900
1
10.99
0i ii
iX P X n
i
第个人去阅览室解:设 ,
第个人不去阅览室4900
1
4900 0.1490
0.994900 0.1 0.9 4900 0.1 0.9
ii
Xn
P
即 得
4902.33 539
4900 0.1 0.9
nn
个
返回
9979.019838.01 =
20 P
例 :6某厂有 400 台同类机器,每台发生故障的概率为 0.02 ,假如各台机器彼此独立,求最多 2 台机器发生故障的概率。
解:
86.214.2 =
84.7
82
98.002.0400
02.0400
84.7
80 -P
0141.0
返回
为实际开工的车床数,设
例 7 :某车间有 200 台独立工作的车床,各台车床开工的概率都是 0.6 ,每台开工车床要耗电 1 千瓦,问供电所至少要供给这个车间多少千瓦电力,才能以 99.9 %的概率保证这个车间不会因供电不足而影响生产。
解: pnb ,~
为供给电力的千瓦数,设k 则
返回
48
120k=
kP 0
48
120
48
120k=
npq
np
npq
npk 0
%9.99查表得 ,0902.3
48
120
k ,4095.141k即
即可。=取 142k
返回
应用 : 用频率代替概率时误差的近似估计
Bernoulli 大数定理 :
而由棣莫弗 - 拉普拉斯中心极限定理可得
1lim
pn
P n
n
2 ( ) 1
n n
n
np nP p P
n npq npq
np n nP
pq pqnpq
,p 已知 ,n, 之三求另一值。
返回
已知某厂生产一批无线电元件已知某厂生产一批无线电元件 ,, 合格品占合格品占 1/6 1/6
(1) 选出 6000 个这种元件 , 试问在这 6000 个元件中 , 合格品的比例与 1/6 之差小于 1% 的概率是多少 ?
(2) 选出 6000 个这种元件 , 试问误差限定为多少时 ,才能保证频率与概率之差不大于 的概率为 0.99? 此时合格品数落在哪个范围内 ?
(3) 选出多少个这种元件 , 使选出的这批元件中合格品的比例与 1/6 的差异不大于 0.01 的概率不小于 0.95?
解解 :: 把任选把任选 nn 个元件看作个元件看作 nn 次次 BernoulliBernoulli 试验试验 , , 为其中为其中 的合格品数的合格品数 ,, 则 则
例 6
n
~ ( , )n B n p 2 ( ) 1n
pq
返回
(1) 6000, 1/ 6, 1%,n p
60002 ( ) 1 2 (1% ) 1
1/ 6 5 / 6
2 (2.0785) 1 0.9624
n
pq
(2) 6000, 1/ 6, 0.99n p
60000.99 2 ( ) 1 2 ( ) 1
1/ 6 5 / 6
6000 6000( ) 0.995 2.5758
1/ 6 5 / 6 1/ 6 5 / 60.0124
n
pq
925.6 1074.4 0.99nnP p P
n
返回
(3) 0.01, 1/ 6, 0.95p
2 ( ) 1 (0.06 ) 0.9755
0.06 1.96 5335.565
n n
pq
nn
即
说明相应的合格品数落在 925 ~ 1075 之间 .
所以至少要选 5336 个元件 .
注 : 若 p 未知 , 则可利用 1
4pq
返回