25
返返 大大大大大大大大大大大大大大大大大大大大大大 大大大大 大大大大大大大大大大大大大大 大大大大大大大大大大大大大大大大大大大大 大大大大 ,一 大5大 大大大大大大大大大大大

大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

Embed Size (px)

DESCRIPTION

第 5 章 中心极限定理与大数定律. 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理. 中心极限定理:   讨论在什么条件下,大量随机变量之和的极限分布为正态分布的一系列定理. 1. 大数定律. 定义 设随机变量序列 { X n } , 如果存在一个常数 列 , 使 得对任意的 ε>0 ,有. 则称 { X n } 服从大数定律.  大数定理. 马尔可夫大数定理. 切比雪夫大数定理. 泊松大数定理. 伯努利大数定理. 辛钦大数定理. 定理 1 ( 马尔可夫大数定律 ) 设 {X n } 为随机变量序列 , 且有 - PowerPoint PPT Presentation

Citation preview

Page 1: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

大数定理:  讨论大量随机变量的算术平均值稳定性的一系列定理

中心极限定理:  讨论在什么条件下,大量随机变量之和的极限分布为正态分布的一系列定理

第 5章 中心极限定理与大数定律

Page 2: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

1. 大数定律

定义 设随机变量序列 {Xn}, 如果存在一个常数列 , 使

得对任意的 ε>0 ,有

1lim 1

n

ii

nn

XP a

n

则称 {Xn} 服从大数定律 .

na

Page 3: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

  大数定理  大数定理

切比雪夫大数定理

辛钦大数定理 伯努利大数定理

马尔可夫大数定理

泊松大数定理

Page 4: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

定理 1 ( 马尔可夫大数定律 )

设 {Xn} 为随机变量序列 , 且有

则对任意的 ε>0 , 有1 1

1 1lim 1n n

i ini i

P X EXn n

12

( )0 )

n

ii

D Xn

n

2

1 12 2 2

1 1

( )1

1( ) ( )1 1 1 1 1

n n

i in ni i

i ii i

D XX EX

D X D Xn

X EXn n n

由切比雪夫不等式:P 得

P

证 :

Page 5: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

定理 2 ( 切比雪夫大数定律 ) 设 {Xn} 是两两不相关随机变量序列 , 方差一致有界 D(Xn)=σn

2 <C (n=1,2,...), 其中常数 C 与 n 无关 , 则对任意的 ε>0, 有

1 1

1 1lim 1n n

i ini i

P X EXn n

2

1 12 2 2 2 2

1 1

( )1

1( ) ( )1 1 1 1 1 1

n n

i in ni i

i ii i

D XX EX

D X D Xn nC

P X EXn n n n

由切比雪夫不等式P 得证 :

Page 6: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

1lim 1

n

in i

n

pP

n n

定理 3 ( 泊松大数定律 ) 设每次试验中事件 A 发生的概率为 , n 次重复独立试验中事件 A 发生的次数为 , 事件的频率 , 则对任意 ε>0, 有n

nn

1 1

1 1 1n n

i ii i

P X EXn n

证 :

1

n

in i

pP

n n

1 1, , (1 )

0 4k k k k k k

k AX EX p DX p p

k A

第 次 发生定义:

第 次 不发生

kp

Page 7: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

1lim

pn

P n

n

定理 4 ( 伯努里利大数定律 ) 设每次试验中事件 A 发生的概率为 p , n 次重复独立试验中事件 A 发生的次数为 ,事件的频率有 , 则对任意 ε>0,

nnn

( 伯努里利大数定律是泊松大数定律的特例 )

  意义: Bernoulli 大数定理表明当试验次数无限增加时事件 A 的频率按概率收敛到事件 A 的概率 .

  这为频率的稳定性提供了理论依据 .

Page 8: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

11lim1

n

ii

nX

nP

定理 5 ( 辛钦大数定律 ) 设 {Xi} 为相互独立的随机变量序列 , 且有相同期望 E(Xi)=u,(i=1,2,...), 则对任意的 ε>0 ,有

大数定理是参数估计和假设检验的重要理论基础 .

  注意 辛钦大数定理成立的条件中只需 的数学期望存在;而当  的方差存在时,其即为切比雪夫大数定理的直接推论 .

iX

iX

Page 9: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

1. 中心极限定理:

概率论中有关论证随机变量和的极限分布是正态分布 (Gauss) 分布

的一系列定理。

意义 : 大量的独立同分布的随机变量之和的分布 可近似认为是正态分布 .

这是数理统计中大样本问题研究的理论基础 .

Page 10: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

定理 6 林德贝格 - 勒维定理 ( 独立同分布中心极限定理 ) 设 X1,X2,…,X n,… 为独立同分布序列 , 期望 μ, 方差 σ2>0, 设

)n,n(N~X 2n

1ii

注 以上定理表明只要 n 比较大 , 就有近似结果 :

)(}{lim)(lim 1 xxn

nXPxF

n

ii

nY

n n

有则对任意)(分布函数为 xxFn

nXY

nY

n

ii

n ,1

Page 11: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

例 1 用机器包装味精 , 每袋味精净重为随机变量 ,期望值为 100 克 , 标准差为 10 克 , 一箱内装 200袋味精 , 求一箱味精净重大于 20500 克的概率 ?

解 设一箱净重为 X, 箱中第 i 袋味精净重为 Xi,(i=1,2,…,200)

则 X1,X2,…,X200 独立同分布 , EXi=100, DXi=102=100,且

200

1iiXX 由中心极限定理得 X 近似服从正态分布 ,

EX=200EXi=20000, DX=200DXi=20000,

所求为 P(X>20500)=1-P(X≤20500)

)20000

2000020500(1

)54.3(1 =0.0002

故一箱味精净重大于 20500 的概率为 0.0002.

Page 12: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

例 2 一生产线生产的产品成箱包装 , 每箱的重

量是随机的 . 假设每箱平均重 50kg, 标准差为 5kg. 若用最大载重量为 5 吨的汽车承运 , 试用中心极限定理说明每车最多可以装多少箱 , 才能保障不超载的概率大于 0.9772.

解 设 Xi(i=1,2,…,n) 为装运的第 i 箱的重量 ,n 是所求的箱数 .则 X1,X2,…,Xn 独立同分布 , EXi=50, DXi=52=25, 令 ,

1

n

iin XY

由中心极限定理得nYDnYE nn 25)(,50)( 则

)2(9772.05

505000)5000(

n

nYP n

所以 ,2101000

n

n0199.98n

即最多可以装 98 箱 .

Page 13: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

lim ( ) ( ) ( )(1 )

n

n

npP a b b a

np p

定理 7 若随机变量 μn ~B (n,p)(n=1,2,…), 则对任

意 a<b 有

注 :

(1) 定理称为棣莫佛 - 拉普拉斯定理 .

(2) 它表示当 n 很大时 , 二项分布可用正态分布近似逼近 :

即 若 X~B(n,p), 当 n 很大时 , 有近似结果 X~N[np,np(1-p)]. 2( )

2 (1 )1(1 )2 (1 )

k npk k n k np pnC p p e

np p

Page 14: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

定理 8 ( 泊松定理 ) 二项概率的泊松近似

( )(1 ) , ,

!

k npk k n kn

np eC p p n p

n

较大 较小,近似程度较高

例 3: 每颗子弹击中飞机的概率为 0.01, 连发 500发 , 求命中 5 发的概率 .

5 5 495500

55

0

2

500 ( ) 0.01,

( 5) 0.01 0.99 0.1764,

5( 5) 0.17547, ( 5)

5!

( 5) 0.159312 500 0.01 0.99

P A

P X C

P X e np

eP X

解:看作 次伯努里试验.

Page 15: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

例 4 某保险公司多年的统计资料表明 , 在索赔户

中被盗索赔户占 20%, 随机抽查 100 户 , 利用棣莫佛 - 拉普拉斯积分定理求被盗索赔户不少于 14 户且不多于 30 户的近似值 .解 设 X 表示 100 户中被盗索赔户数 , 则X~B(100,0.2)

由棣莫佛 - 拉普拉斯定理得: X 近似服从正态分布 ,

EX=np=20, DX=np(1-p)=16,

所以 X~N(20,16)

所求 P(14≤X≤30) )4

2014()

4

2030(

)5.1()5.2(

)]5.1(1[)5.2( =0.927

Page 16: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

0083.00387.0!30

20

!14

20

8.02.08.02.0

2030

2014

703030100

861414100

eeP

CCP

Page 17: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

例 5 某校有 4900 个学生,已知每天每个学生去阅览室自修的概率为 0.1, 问阅览室要准备多少座位,才能以此为准99% 的概率保证每个去阅览室自修的学生都有座位。

4900

1

10.99

0i ii

iX P X n

i

第个人去阅览室解:设 ,

第个人不去阅览室4900

1

4900 0.1490

0.994900 0.1 0.9 4900 0.1 0.9

ii

Xn

P

即 得

4902.33 539

4900 0.1 0.9

nn

Page 18: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

9979.019838.01 =

20 P

例 :6某厂有 400 台同类机器,每台发生故障的概率为 0.02 ,假如各台机器彼此独立,求最多 2 台机器发生故障的概率。

解:

86.214.2 =

84.7

82

98.002.0400

02.0400

84.7

80 -P

0141.0

Page 19: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

为实际开工的车床数,设

例 7 :某车间有 200 台独立工作的车床,各台车床开工的概率都是 0.6 ,每台开工车床要耗电 1 千瓦,问供电所至少要供给这个车间多少千瓦电力,才能以 99.9 %的概率保证这个车间不会因供电不足而影响生产。

解: pnb ,~

为供给电力的千瓦数,设k 则

Page 20: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

48

120k=

kP 0

48

120

48

120k=

npq

np

npq

npk 0

%9.99查表得 ,0902.3

48

120

k ,4095.141k即

即可。=取 142k

Page 21: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

应用 : 用频率代替概率时误差的近似估计

Bernoulli 大数定理 :    

而由棣莫弗 - 拉普拉斯中心极限定理可得

1lim

pn

P n

n

2 ( ) 1

n n

n

np nP p P

n npq npq

np n nP

pq pqnpq

,p 已知 ,n, 之三求另一值。

Page 22: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

已知某厂生产一批无线电元件已知某厂生产一批无线电元件 ,, 合格品占合格品占 1/6 1/6

(1) 选出 6000 个这种元件 , 试问在这 6000 个元件中 , 合格品的比例与 1/6 之差小于 1% 的概率是多少 ?

(2) 选出 6000 个这种元件 , 试问误差限定为多少时 ,才能保证频率与概率之差不大于 的概率为 0.99? 此时合格品数落在哪个范围内 ?

(3) 选出多少个这种元件 , 使选出的这批元件中合格品的比例与 1/6 的差异不大于 0.01 的概率不小于 0.95?

解解 :: 把任选把任选 nn 个元件看作个元件看作 nn 次次 BernoulliBernoulli 试验试验 , , 为其中为其中 的合格品数的合格品数 ,, 则 则

例 6

n

~ ( , )n B n p 2 ( ) 1n

pq

Page 23: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

(1) 6000, 1/ 6, 1%,n p

60002 ( ) 1 2 (1% ) 1

1/ 6 5 / 6

2 (2.0785) 1 0.9624

n

pq

(2) 6000, 1/ 6, 0.99n p

60000.99 2 ( ) 1 2 ( ) 1

1/ 6 5 / 6

6000 6000( ) 0.995 2.5758

1/ 6 5 / 6 1/ 6 5 / 60.0124

n

pq

925.6 1074.4 0.99nnP p P

n

Page 24: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回

(3) 0.01, 1/ 6, 0.95p

2 ( ) 1 (0.06 ) 0.9755

0.06 1.96 5335.565

n n

pq

nn

说明相应的合格品数落在 925 ~ 1075 之间 .

所以至少要选 5336 个元件 .

注 : 若 p 未知 , 则可利用 1

4pq

Page 25: 大数定理:   讨论大量随机变量的算术平均值稳定性的一系列定理

返回