Upload
calais
View
68
Download
7
Embed Size (px)
DESCRIPTION
第六章 数理统计的基本概念. 总 体,个 体,样 本, 统 计 量 ( 三大定义,三大定理 ). 关键词:. 数理统计学 是一门以数据为基础的科学 , 可以定义为收集数据 , 分析数据和由数据得出结论的一组概念、 原则和方法 。 例如:若规定灯泡寿命低于 1000 小时者为次品,如何确定次品率?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研究的问题之一。. §6. 1 随机样本与统计量. 总体:研究对象的全体; 个体:总体中的成员; 总体容量:总体中包含的个体数; - PowerPoint PPT Presentation
Citation preview
第六章 数理统计的基本概念
总 体,个 体,样 本, 统 计 量
( 三大定义,三大定理 )
关键词:
2 分布 t 分布 F 分布
数理统计学 是一门以数据为基础的科学 , 可以定义
为收集数据 , 分析数据和由数据得出结论的一组概念、
原则和方法。
例如:若规定灯泡寿命低于 1000 小时者为次品,如何确定次品率?由于灯泡寿命试验是破坏性试验,不可能把整批灯泡逐一检测,只能抽取一部分灯泡作为样本进行检验,以样本的信息来推断总体的信息,这是数理统计学研究的问题之一。
§6.1 随机样本与统计量 总体:研究对象的全体;
个体:总体中的成员; 总体容量:总体中包含的个体数; 有限总体:容量有限的总体; 无限总体:容量无限的总体,通常将容量非
常大的总体也按无限总体处理。
例:现要研究某一个公司员工工资水平及其影响工资水平的因素 . 这个公司的每个员工就是 " 个体 ", 而所有的员工构成一个 " 总体 ". 由于公司的员工总数是有限的 , 因此 , 是一个有限总体 .
每个员工都附着有年龄 , 性别 , 工种 ,
工资 , 受教育程度等指标 ( 变量 ).
总体的某个指标 X, 对于不同的个体来说有不同的取值 , 这些取值可以构成一个分布 , 因此 X 可以看成一个随机变量 . 有时候就把 X
称为总体 . 假设 X 的分布函数为F(x), 也称 F(x) 为总体 .
数理统计主要任务是从总体中抽取一部分个体 , 根据这部分个体的数据对总体分布给出推断 . 被抽取的部分个体叫做总体的一个 样本 .
随机样本:从总体中随机地取 n 个个体 , 称为一个随机样本。称 n 为样本容量。
简单随机样本:满足以下两个条件的随机样
本 (X1,X2,…,Xn) 称为样本容量是 n 的简单
随机样本。
1. 每个 Xi与 X 同分布;
2. X1,X2,…,Xn 是相互独立的随机变量。
[ 说明 ] :后面提到的样本均指简单随机样本。由概率论知,若总体 X 具有概率密度 f(x) ,
则样本( X1,X2,…,Xn )具有联合密度函数:
1 21
, ,n
n n ii
f x x x f x
如何取得的样本才称是简单随机样本 ?
对于有限总体 , 采用放回抽样就能得到简单随机样本 .
但当总体容量很大的时候 , 放回抽样有时候很不方便 , 因此在实际中当总体容量比较大时 ,
通常将不放回抽样所得到的样本近似当作简单随机样本来处理 .
对于无限总体 , 一般采取不放回抽样 .
统计量:不含任何未知参数的样本的函数。
常用统计量:设( X1,X2,…,Xn )为取自总体
X 的样本。常用的统计量如下:
1
11. Xn
ii
Xn 样本均值
1
1
13. 1, 2,
1 ( ) 1, 2,
nk
k ii
nk
k ii
k A X kn
k B X X kn
样本矩 阶矩:
阶中心矩:
2 2
1
12. ( ) ,1
n
ii
S X X Sn 样本方差 为样本标准差
答:只有(4)不是统计量。
一般, 用样本均值 X 作为总体均值 ( )E X 的估计;
用样本方差 2S 作为总体方差 2 2( )E X 的估计;
用样本的原点矩 kA 作为总体原点矩 ( )kk E X 的估计;
用样本的中心矩 kB 作为总体中心矩 ( )kk E X 的估
计. (假设总体各阶矩存在)
总体方差的估计可以用 2S 也可以 2B , 主要的区别是 2S 作为
总体方差估计是无偏估计, 但 2B 作为总体方差的估计是有偏的
(关于估计的无偏性将在下一章讨论).
§6.2
统计量的分布称为抽样分布 .
在数理统计中 , 最重要的三个分布分别为 :
2 分布 t 分布 F 分布
2 分布 t 分布 F 分布
2
2 2 2
1 2
2
1
, , 0,1 1,2, ,
1
1
n
n
n
n
i
ii
X X X X N i n
n
X
n
设随机变量 相互独立,
则称
服从自由度为 的 ,
指 式右端包含
分布 记为
的独立变自由度
定义:
量的个数.
2 分布
x
( )f x
0
10n
1n
4n
2 分布的概率密度函数
2 分布的一些重要性质:
2n
0
2分分分分分分
x
()fx
2 2 2 21. , , 2n E n D n 设 则有
2 2 21 1 2 2 1 2 1 2 1 22. , , ,Y n Y n Y Y Y Y n n 设 且 相互独立,则有
22 分布的可加性性质 称为 ,可推广到有限个的情形:
minY ii ,2,1,~ 2 ,并假设 mYYY ,, 21 相互独立,
则
m
ii
m
ii nY
1
2
1
~
2
2
2 2 2
,0 1,
,
nnf dy
n
y
n
n
为
分布的上 分
对给定的概率 称满足条件 的点
上 分位数 的值可查位数 分布表
通过 Excel 给出 .
( 1 )具体如下 : 在 Excel 表单的任一单元格输入“ =” ;
( 2 )在主菜单中点击“插入”,点击“函数 (F)” ;
( 3 )在选择类别的下拉式菜单中选择‘’统计“ 选择 “ CHIINV” 点击“确定”在函数参数表单中输入 Probability=0.1.
( 4 ) Deg\_freedom=25, 点击 '' 确定 " 即在单元格中出现 ''34.382".
例:求 251.02
1, 2, ,ii
XY i n
解:(1)作变换
1 2, , , 0,1 1, 2, ,n iY Y Y Y N i n 显然 相互独立,且
2 2 2
1 1
( )n n
ii
i i
XY n
2于是
22 21 2
1 2 2
( )(2) ~ (0,2 ), ~ (1)
2
X XX X N
22 23 4 5
3 4 5 2
(2 )2 ~ (0,6 ), ~ (1)
6
X X XX X X N
1 2 3 4 5
2223 4 51 2
2 2
(2 )( )~ (2)
2 6
X X X X X
X X XX X
与2 相互独立,
故 +
2
2
1,
21
,62.
a
b
k
t 分布设 )1,0(~ NX , nY 2~ ,并且假设 YX , 相互独立,
则称随机变量nY
XT
/ 服从自由度为 n的 t分布。
记为 )(~ ntT
t n 分布概率密度函数
, 0 1, ,t n
f t n dt t n
t n t t
对给定的 称满足条件 的点
为 分布的上 。分布的上 分位数可位数 查分 分布表
1 ( ) ( )t n t n
t 分布
例:求 2505.0t
通过 Excel 给出 .
( 1 )具体如下 : 在 Excel 表单的任一单元格输入“ =”
;
( 2 )在主菜单中点击“插入”,点击“函数 (F)” ;
( 3 )在选择类别的下拉式菜单中选择‘’统计“ 选择 “ TINV” 点击“确定“在函数参数表单中输入 Probability=0.1.
( 4 ) Deg\_freedom=25, 点击“确定” 即在单元格中出现 ‘‘ 1.708".
F分布
11 2 2 1~ ( , ), ~ ( , )F F n n F F n n性质: 则
5,10F 分布概率密度函数
1 21 2,
1 2 1 2
1 2
, 0 1,
; ,
, ,
,
F n nf x n n dx
F n n F n n
F n n F
对于给定的 称满足条件
的点 为 分布的上 分位数。
的值可查 分布表
11 1 2 2 1( , ) [ ( , )]F n n F n n
例:求 10,91.0F
通过 Excel 给出 .
( 1 )具体如下 : 在 Excel 表单的任一单元格输入“ =”
;
( 2 )在主菜单中点击“插入”,点击“函数 (F)” ;
( 3 )在选择类别的下拉式菜单中选择“统计” 选择 “ FINV” 点击“确定”在函数参数表单中输入 Probability=0.1.
( 4 ) Deg\_freedom1=9, Deg\_freedom2=10 点击“确定” 即在单元格中出现 ‘‘ 2.347”.
定理 6.3.1 设 1 2, , , nX X X 为来自正态总体
),( 2N 的简单随机样本, X 是样本均值,
则有:
n
NX2
,~ .
§6.3 正态总体下的抽样分布
定理 6.3.2 设 1 2, , , nX X X 为来自正态总体
),( 2N 的简单随机样本 , X 是样本均值 ,
2S 是样本方差, 则有:
(1) )1(~)1 2
2
2
nSn
(
,
(2) X 与 2S 相互独立.
定理 6.3.3 设 1 2, , , nX X X 为来自正态总体
),( 2N 的简单随机样本, X 是样本均值, 2S
是样本方差, 则有:
~ ( 1)X
t nS n
定理6.3.4
).1,1(~)1( 2122
22
21
21 nnFS
S
1 2
2 21 2
1 2
(2) ~ (0,1)
, .
X YN
n n
X Y
其中 分别为样本均值
(3)当 222
21 时,
.2~
1121
21
21
nnt
nnS
YX
w
21 4
1 9
2 21 2
2 21 2
1
42 2
2 1 2 1 21
, , ,
, ,
, ,
( );
(2) ~ ( ), ,
(3) ( ) ~ ( , ), , ,ii
X N X X
Y Y X
X S Y S
D S S
X Ya t k a kS
b X S F n n b n n
例:设总体 ,
与 是取自总体 的两个独立样本,
和 分别为样本均值和样本方差;
求(1)
则 各为多少?
则 各为多少?
22
2
( 1)~ ( 1),
n Sn
解:(1)一般地,由
2
2
( 1)2( 1)
n SD n
42 2( ) .
1D S
n
4 42 2
1 22( ) , ( )
3 4D S D S 所以,
42 2 2 2
1 2 1 211( ) ( ) ( ) .
12D S S D S D S 因此,
2 2
(2) ~ ( , ), ~ ( , ),4 9
X N Y N X Y 且 与 相互独立,
212
1
6 1336~ (3)
3 1313
X YSX Yt
S 所以,
22 21
12
3~ (3),
SX Y S
又 且 与 相互独立,
213~ (0, ),
36X Y N
6 13, 3.
13a k
242 2 22
2 21
42 2
21
81(3) ( ) ~ (4), ~ (8),
( )
ii
ii
SX
X S
且 与 独立,
24 42 2 22
22 21 1
81 1( ) ( ) ~ (4,8),44 8i i
i i
SX X S F
1 21 , ( , ) (4,8).4
b n n