统计推断 (statistical inference)

统计推断(statistical inference)

第四章

第四章统计推断

统统计计推推断断

由一个样由一个样本或一糸本或一糸列样本所列样本所得的结果得的结果来推断总来推断总体的特征体的特征

假设检验

参数估计

分析误差产生的原因

任务

确定差异的性质

排除误差干扰

对总体特征做出正确判断

第四章

第一节

第二节

第三节

第四节

第五节

假设检验的原理与方法

样本平均数的假设检验

样本频率的假设检验

参数的区间估计与点估计

方差的同质性检验

一概念：假设检验（ hypothesis test ）又称显著性检验（ significance test ） , 就是根据总体的理论分布和小概率原理，对未知或不完全知道的总体提出两种彼此对立的假设，然后由样本的实际原理，经过一定的计算，作出在一定概率意义上应该接受的那种假设的推断。

第一节假设检验

小概率原理小概率原理

概率很小的事件在一次抽样试验中实际是几乎不可能发生的。

=0.05/0.01

如果假设一些条件，并在假设的条件下能够准确地算出事件Ａ出现的概率 α 为很小，则在假设条件下的 n 次独立重复试验中，事件 A 将按预定的概率发生，而在一次试验中则几乎不可能发生。

假假设设检检验验

参数检验参数检验

非参数检验非参数检验

平均数的检验

频率的检验

方差的检验

秩和检验

符号检验

游程检验

秩相关检验

二、假设检验的步骤

治疗前 0 ＝ 126

2 ＝ 240

N ( 126,240 ）

治疗后 n ＝ 6 x ＝ 136 未知

那么＝ 0 ? 即克矽平对治疗矽肺是否有效？

例：设矽肺病患者的血红蛋白含量具平均数 0 ＝ 126(mg/L) ， 2 ＝ 240 (mg/L)2 的正态分布。现用克矽平对 6位矽肺病患者进行治疗，治疗后化验测得其平均血红蛋白含量 x =136(mg/L) 。

1 、提出假设

对对

立立

无效假设无效假设// 零假设零假设

// 检验假设检验假设

备择假设备择假设// 对应假设对应假设

00 ＝＝

00

误差误差效应效应

处理处理效应效应

HH00

HHAA

例：克矽平治疗矽肺病是否能提高血红蛋白含量？

平均数的假设检验

检验治疗后的总体平均数是否还是治疗前的 126(mg/L) ？

x-0 ＝ 136-126 ＝ 10(mg/L) 这一差数

是由于治疗造成的，还是抽样误差所致。

本例中零假设是指治疗后的血红蛋白平均数仍和治疗前一样，二者来自同一总体，接受零假设则表示克矽平没有疗效。

而相对立的备择假设表示拒绝 H0 ，治疗后的血红蛋白平均数和治疗前的平均数来自不同总体，即克矽平有疗效。

H0:μ=μ0 =126(mg/L) HA:μ≠μ0

2 、确定显著水平

＝ 0.05

显著水平 *

极显著水平 **

能否定 H0 的人为规定的概率标准称为显著水平，记作。

统计学中，一般认为概率小于 0.05 或 0.01 的事件为小概率事件 , 所以在小概率原理基础上建立的假设检验也常取 =0.05 和 =0.01 两个显著水平。

P< ＝ 0.01

＝ 0.05

3 、选定检验方法，计算检验统计量，确定概率值

u= x- x

136-126=

√40= 1.581

P( u >1.581)=2×0.0571=0.1142

根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例：

1260 x 40

6

24022

nx

4 、作出推断结论：是否接受假设

P>

P<

小小概概率率原原理理

接受接受 HH00

否定否定 HHAA

否定否定 HH00

接受接受 HHAA

可能正确

可能错误

例：上例中

P ＝ 0.1142>0.05

所以接受 H0 ，从而得出结论：使用克矽平治疗前后血红蛋白含量未发现有显著差异，其差值 10 应归于误差所致。

P( u >1.96) =0.05

P( u >2.58) =0.01

已知：

0.950.025 0.025

u >1.96

u >2.58

P( u ) <0.05

P( u ) <0.01

差异达显著水平

差异达极显著水平

0

P(-1.96x <x< +1.96x) =0.95

-1.96x +1.96x

0.95 0.0250.025

临界值： + ux

左尾右尾

否定区否定区接受区

u + 1.96x

三、双尾检验与单尾检验

0

P(-2.58x <x< +2.58x) =0.99

-2.58x +2.58x

0.99 0.0050.005

临界值： + 2.58x

左尾右尾

双尾检验(two-sided test)

否定区否定区接受区

0.95 0.950.05 0.05

1.64 -1.64

H0 ： ≤ 0 HA ： > 0

假设：

否定区

H0 ： ≥ 0 HA ： < 0

左尾检验右尾检验

单尾检验(one-sided test)

接受区接受区

u 0.05=1.64u 0.01=2.33

单尾检验

分位数

双尾检验

分位数u 0.05=1.96u 0.01=2.58

２

２

否定区

否定区否定区

接受区

接受区

查表时，单尾概率等于双尾概率乘以 2

＞

四、两类错误

假设检验的两类错误　　　　　　 H0 正确　　　　 H0 错误

否定 H0 　　　　错误 () 　　推断正确 (1-)

接受 H0 　　推断正确 (1-) 　错误 ()第一类错误（ type I error ），又称弃真错误或错误 ;

第二类错误（ type II error ），又称纳伪错误或错误

0

Ⅰ Ⅱ

0.025

Ⅰ 和Ⅱ重合

= 0

0.950.025

错误

犯第一类错误的概率等于显著水平值

Ⅰ ⅡC1 C2

2

2

0 u -u

Ⅰ 和Ⅱ不重合

犯第二类错误的概率记为值

１、两类错误既有联系又有区别

　错误只在否定 H0 时发生错误只在接受 H0 时发生

错误增加错误减小错误增加错误减小

结论

2 、还依赖于 - 0 的距离

结论

3 、 n , 2 可使两类错误的概率都减小 .

单尾检验

左尾检验右尾检验

0.95 0.950.05 0.05

1.64 -1.64否定区

接受区接受区

否定区只在一侧

分析题意

提出假设

确定显著水平

计算检验统计量

作出推断

假设检验的步骤 :

大样本平均数的假设检验

－－ u 检验

小样本平均数的假设检验

－－ t 检验

单样本

双样本

一、一个样本平均数的假设检验一、一个样本平均数的假设检验

适用范围：检验某一样本平均数 x 所属的总体

平均数是否和某一指定的总体平均数是否和某一指定的总体平均数 00 相同。相同。

若相同，则说明该样本属于这个以若相同，则说明该样本属于这个以 00 为平均数的为平均数的

指定总体；若不相同，则说明该样本所属的总体指定总体；若不相同，则说明该样本所属的总体

与这个指定总体（与这个指定总体（ 00 ）不同，即有显著或极显）不同，即有显著或极显

著差异。著差异。

1 、总体方差 σ2 已知，无论 n 是否大于 30 都可采用 u 检验法

例：某鱼场按常规方法所育鲢鱼一月龄的平均体长为 7.25cm ，标准差为 1.58cm ，现采用一新方法进行育苗，一月龄时随机抽取 100 尾进行测量，其平均体长为 7.65cm ，

问新育苗方法与常规方法有无显著差异？

分析分析

（１）这是一个样本平均数的假设检验，因总体 σ2 已知，采用 u 检验；（２）新育苗方法的鱼苗体长≥ 或≤常规方法鱼苗体长，应进行双尾检验。

（１）假设

（ 2 ）水平

（ 3 ）检验

（ 4 ）推断

H0:μ=μ0=7.25(cm) ，

即新育苗方法与常规方法所育鱼苗一月龄体长相同；

HA:μ≠μ0

选取显著水平 α ＝ 0.05

158.0100

58.1

nx

532.2158.0

25.765.7

x

xu

u >1.96

否定 H0 ，接受 HA ；

认为新育苗方法一月龄体长与常规方法有显著差异。

2 、总体方差 σ2 未知，但 n>30 时，可用样本方差 s2 来代替总体方差 σ2 ，仍用 u 检验法

总体(μ0)

样本 (n>30)x

s2

σ2

xs

xu

例：生产某种纺织品，要求棉花纤维长度平均为 30mm 以上，现有一棉花品种，以 n=400 进行抽查，测得其纤维平均长度为30.2mm ，标准差为 2.5mm ，

问该棉花品种的纤维长度是否符合纺织品的生产要求？

分析分析

（１）这是一个样本平均数的假设检验，因总体 σ2 未知， n=400 > 30 ，可用 s2代替 σ2 进行 u 检验；

（２）棉花纤维只有 >30mm才符合纺织品的生产要求，因此进行单尾检验。

（１）假设

（ 2 ）水平

（ 3 ）检验

（ 4 ）推断

H0:μ≤ μ0=30(cm) ，

　即该棉花品种纤维长度达不到纺织品生产的要求。

HA:μ>μ0


125.0400

5.2

n

ss

x6.1

125.0

0.302.30

xs

xu

u <1.645

接受 H0 ，否定 HA ；

认为该棉花品种纤维长度不符合纺织品生产的要求。

3 、总体方差 σ2 未知，且 n<30 时，可用样本方差 s2 来代替总体方差 σ2 ，采用 df=n-1 的 t 检验法

总体(μ0)

样本 (n<30)x

s2

σ2

ts

x

x

例：某鱼塘水中的含氧量，多年平均为 4.5(mg/L) ，该鱼塘设 1

0 个点采集水样，测定含氧量为： 4.33,4.62,3.89,4.14,4.78,4.64,4.

52,4.55,4.48,4.26(mg/L)

试检验该次抽样测定的水中含氧量与多年平均值有无显著差别。

分析分析

（１）这是一个样本平均数的假设检验，因总体 σ2 未知， n=10 < 30 ，可用 s2代替 σ2 进行 t 检验；

（２）该次测定的水中含氧量可能 > 或 <多年平均值，用双尾检验。

（１）假设

（ 2 ）水平

（ 3 ）检验

（ 4 ）推断

H0:μ ＝ μ0=4.5(mg/L) ，即认为该次测定与多年平均值没有显著差别。

HA: μ≠ μ0


在 0.05 显著水平上，接受 H0 ，否定 HA ；认为该次抽样所测结果与多年平均值无显著差别，属于随机误差。

267.01

)( 22

nn

xx

s

94.011

x

n s

xt

t 0.05(9) =2.262

084.0n

ss

x

P>0.05

421.4n

xx

二、两个样本平均数的假设检验二、两个样本平均数的假设检验

适用范围：检验两个样本平均数 x11 和 x22

所属的总体平均数 11 和和 22 是否来自同一总是否来自同一总

体。体。

样本 1X1

样本 2X2

总体 1μ1

总体 2μ2

1 、提出假设

无效假设 H0: μ1=μ2 ，两个平均数的差值是随机误差所引起的；

21 xx

备择假设 HA: μ1=μ2 ，两个平均数的差值除随机误差外还包含其真实的差异，即由处理引起的；

21 xx

2 、确定显著水平： 0.05 或 0.01

3 、检验统计量

(1) 样本平均数差数的平均数 = 总体平均数的差数 .

212121

xxxx

两个样本平均数的差数 21 xx

(2) 样本平均数差数的方差 = 两样本平均数方差之和 .

22

2

22

1

212

2121 xxxx nn

2

22

1

21

21 nnxx

样本平均数差数的标准误

2

22

1

212

21 nnxx

)11

(21

22

21 nnxx

nxx

22

212

21

nxx

22

221

σ12=σ2

2=σ

n1=n2=n

σ12=σ2

2=σ n1=n2=n

)1,0(N

当σ12 和 σ2

2 已知

21

)()( 2121

xx

xxu

21

21

xx

xxu

H0 ： μ1=μ2=μ 时

)1,0(N

当σ12 和 σ2

2 未知，两样本都为大样本时

21

)()( 2121

xxs

xxu

21

21

xxs

xxu

H0 ： μ1=μ2=μ 时

2

22

1

21

21 n

s

n

ss

xx

)2( 21 nnt

当σ12 和 σ2

2 未知，两样本都为小样本时

21

)()( 2121

xxs

xxt

21

21

xxs

xxt

H0 ： μ1=μ2=μ 时

2

22

1

21

21 n

s

n

ss

xx

4 、作出推断，并解释之

接受接受 HH00 否定否定 HHAAuu tt 或

否定否定 HH00 接受接受 HHAAuu tt 或

试试验验设设计计

成组数据平均数的比较成组数据平均数的比较

成对数据平均数的比较成对数据平均数的比较

成组数据平均数的比较成组数据平均数的比较

如果两个样本的各个变量是从各自总体中随机抽取的，两个样本之间的变量没有任何关联，即两个抽样样本彼此独立，则不论两样本的容量是否相同，所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准，来检验其差异的显著性。

根据两样本所属的总体方差是否已知和样本大小不同而采用不同的检验方法。

1 、两个总体方差 σ12 和 σ2

2 已知，或 σ12 和 σ2

2 未知，但两个样本都是大样本，即 n1>30 且 n2>30 时，用 u 检验法。

例：某杂交黑麦从播种到开花的天数的标准差为 6.9d

A 法：调查 400株，平均天数为 69.5d

B 法：调查 200株，平均天数为 70.3d

差异？差异？

分　析

分　析

（１）这是两个样本（成组数据）平均数比较的假设检验， σ1

2=σ22=(6.9d)2,样本为大样本，用 u检验。

（２）因事先不知 A 、 B 两方法得到的天数孰高孰低，用双尾检验。

试比较两种调查方法所得黑麦从播种到开花天数有无显著差别。

（１）假设

（ 2 ）水平

（ 3 ）检验

（ 4 ）推断

H0:μ1 ＝ μ2 ，即认为两种方法所得天数相同。

HA: μ1≠ μ2


在 0.05 显著水平上，接受 H0 ，否定 HA ；

认为两种方法所得黑麦从播种到开花天数没有显著差别。

598.011

2121

nnxx

338.1598.0

3.705.69

21

21

xx

xxu

u < 1.96 ， P > 0.05

例：为了比较“ 42-67XRRIM603” 和“ 42-67XPB86” 两个橡胶品种的割胶产量，两品种分别随机抽样 55株和 107株进行割胶，平均产量分别为 95.4ml/株和 77.6ml／株，割胶产量的方差分别为 936.36 （ ml/株） 2 和 800.89 （ ml/株） 2

分　析

分　析

（１）这是两个样本（成组数据）平均数比较的假设检

验， σ12 和 σ2

2 未知 , n1>30且 n2>30 ，用 u检验。

（２）因事先不知两品种产量孰高孰低，用双尾检验。

试检验两个橡胶品种在割胶产量上是否有显著差别。

（１）假设

（ 2 ）水平

（ 3 ）检验

（ 4 ）推断

H0:μ1 ＝ μ2 ，即认为两品种割胶产量没有显著差别。

HA: μ1≠ μ2


在 0.01 显著水平上，否定 H0 ，接受 HA ；

两个橡胶品种的割胶产量存在极显著的差别，“ 42-67XRRIM603” 割胶产量极显著高于“ 42-67XPB86” 。

951.42

22

1

21

21 n

s

n

ss

xx

595.3951.4

6.774.95)(

21

21

xx

s

xxu

u > 2.58 ， P < 0.01

2 、两个总体方差 σ12 和 σ2

2 未知，且两个样本都是小样本，即 n1<30 且 n2<30 时，用 t 检验法。

(1) 如果 σ12=σ2

2=σ2

)1()1(

)1()1(

21

2221

212

nn

nsnsse

Se2

σ2

2

2

1

2

21 n

s

n

ss ee

xx平均数差数的标准误

21

)()( 2121

xxs

xxt

H0: μ1 ＝ μ2= μ

21

21

xxs

xxt

df=(n1-1)+(n2-1)=n1+n2-2

例：用高蛋白和低蛋白两种饲料饲养一月龄大白鼠，在三个月时，测定两组大白鼠的增重 (g)

高蛋白组： 134,146,106,119,124,161,107,83,113,129,97,123

低蛋白组： 70,118,101,85,107,132,94

分　析

（１）这是两个样本平均数的检验， σ12 和 σ2

2 未知，且为小样本，用 t检验。（２）事先不知两种饲料饲养大白鼠增重量孰高孰低，用双尾检验。

试问两种饲料饲养的大白鼠增重量是否有差别？

)(17.1201 gx 221 )(97.451 gs 121 n

)(00.1012 gx 222 )(33.425 gs 72 n

063.133.425

97.45122

21

s

sF

03.4)6,11(05.0 F05.0FF

（１）假设

（ 2 ）水平

（ 3 ）检验

H0:σ12=σ2

2=σ2 HA: σ12 ≠ σ2

2


（ 4 ）推断两样本方差相等。

（ 3 ）检验 568.442)1()1(

)1()1(

21

2221

212

nn

nsnsse

005.102

2

1

2

21 n

s

n

ss ee

xx

916.121

21

xx

s

xxt

（１）假设

（ 2 ）水平

H0:μ1 ＝ μ2 ，即认为两种饲料饲养的大白鼠增重无差异。

HA: μ1 ≠ μ2


（ 4 ）推断在 0.05 显著水平上，接受 H0 ，否定 HA ；

认为两种饲料饲养大白鼠的增重无显著差别，属于随机误差。

t 0.05(17) =2.110 P>0.05

916.121

21

xx

s

xxt

df=(n1-1)+(n2-1)=17

（ 2） σ12≠σ2

2 ， n1=n2=n

)1()1(

)1()1(

21

2221

212

nn

nsnsse

Se2

σ2

2

2

1

2

21 n

s

n

ss ee

xx

21

)()( 2121

xxs

xxt

df=n-1

平均数差数的标准误

n

ss e

xx

2221

当 n1=n2=n 时

例：两个小麦品种千粒重 (g)调查结果

品种甲： 50,47,42,43,39,51,43,38,44,37

品种乙： 36,38,37,38,36,39,37,35,33,37

检验两品种的千粒重有无差异。

82.7933.2

933.2222

21

s

sF 18.3)9,9(05.0 F 05.0FF

两样本方差不相等。

)(4.431 gx 221 )(933.22 gs

)(6.362 gx 222 )(933.2 gs

101 n

102 n

分　析（１） σ1

2 和 σ22 未知，且不相等，都小样本，

且n1=n2 ,用 df=n-1 的 t检验。

（２）事先不知道两个品种千粒重孰高孰低，

故而用双尾检验。

（１）假设

（ 2 ）水平

（ 3 ）检验

H0:μ1 ＝ μ2 ，即认为两品种千粒重无显著差异。

HA: μ1 ≠ μ2


933.12)1()1(

)1()1(

21

2221

212

nn

nsnsse

608.12

2

1

2

21 n

s

n

ss ee

xx

229.421

21

xx

s

xxt

（ 4 ）推断

在 0.05 显著水平上，否定 H0 ，接受 HA ；认为两品种千粒重存在明显差异，即品种甲的千粒重显著高于品种乙。

t 0.05(9) =2.262 P<0.05

229.421

21

xx

s

xxt

df=n-1 ＝ 9

3 σ12≠σ2

2 ， n1 ≠ n2 ，采用近似地 t检验，即

Aspin-Welch 检验法。

2

22

1

21

21 n

s

n

ss

xx

1)1(

1

1'

2

2

1

2

nR

nR

df

2

22

1

21

1

21

22

2

21

1

ns

ns

ns

ss

sR

xx

x

21

21'

xx

df s

xxt

检验两品种小麦蛋白质含量是否有显著差异？

分　析 n1 ≠ n2 ，用近似的 t 分布，使用双尾检验。

测定农大 193 的蛋白质含量（％） 5 次， x2=11.7 ， s22=0.13

5

测定东方红 3 号的蛋白质含量（％） 10 次， x1=14.3 ， s12=1.62

1

01.1222

21

s

sF

00.6)4,9(05.0 F

05.0FF

（１）假设

（ 2 ）水平

（ 3 ）检验

H0:σ12=σ2

2=σ2 HA: σ12 ≠ σ2

2

（ 4 ）推断两样本方差有显著不同。


例：

（１）假设

（ 2 ）水平

（ 3 ）检验

H0:μ1 ＝ μ2 ，即两品种蛋白质含量没有显著差别。

HA: μ1 ≠ μ2


435.02

22

1

21

21 n

s

n

ss

xx

977.521

21'

xx

df s

xxt

（ 4 ）推断


认为两品种蛋白质含量有极显著差异，东方红3 号小麦蛋白质含量极显著的高于农大 193 。

t 0.01(12) = 3.056 P<0.01

977.521

21'

xx

df s

xxt

12

1)1(

1

1'

2

2

1

2

nR

nR

df

857.0

2

22

1

21

1

21

22

2

21

1

ns

ns

ns

ss

sR

xx

x

成对数据平均数的比较成对数据平均数的比较

将性质相同的两个样本（供试单位）配偶成对，每一对除随机地给予不同处理外，其他试验条件应尽量一致，以检验处理的效果，所得的观测值称为成对数据。

xx11

xx22

21 xxd

212121 )(

xxn

x

n

x

n

xxd n

d

样本样本 11

样本样本 22

……

nn 对对

样本差数的平均数等于样本平均数的差数

1

)(22

22

1

)(

n

n

dd

d n

dds

)1(

)(

)1(

)(

222

2

nn

n

dd

nn

dd

n

ss d

d

d

d

s

dt

HH00: μ: μdd=0=0d

s

dt

df = n-1df = n-1

样本差数的方差

样本差数平均数的标准误

t 值

例例：在研究饮食中：在研究饮食中缺乏缺乏 VVE 与肝中与肝中 VVA

的关系时，将试验的关系时，将试验动物按性别、体重动物按性别、体重等配成等配成 88 对，并将对，并将每对中的两头试验每对中的两头试验动物用随机分配法动物用随机分配法分配在正常饲料组分配在正常饲料组和和 VVE 缺乏组，然后缺乏组，然后将试验动物杀死，将试验动物杀死，测定其肝中测定其肝中 VVA 含量，含量，结果如右表：结果如右表：

配对正常饲料组配对正常饲料组 VVE E 缺乏组差数缺乏组差数 d dd d22

1 3550 2450 1100 12100001 3550 2450 1100 1210000

2 2000 2400 -400 1600002 2000 2400 -400 160000

3 3000 1800 1200 14400003 3000 1800 1200 1440000

4 3950 3200 750 5625004 3950 3200 750 562500

5 3800 3250 550 3025005 3800 3250 550 302500

6 3750 2700 1050 11025006 3750 2700 1050 1102500

7 3450 2500 950 9025007 3450 2500 950 902500

8 3050 1750 1300 16900008 3050 1750 1300 1690000

合计合计 6500 73700006500 7370000

试检验两组饲料对试验动物肝中 VA 含量的作用有无显著差异。

分析分析此题为成对数据，事先不知两组饲料作用孰大孰小，用双尾。此题为成对数据，事先不知两组饲料作用孰大孰小，用双尾。

（１）假设

（ 2 ）水平

（ 3 ）检验

H0:μd ＝ 0 HA: μd ≠0

α ＝ 0.01

5.812 n

dd

857.2983921

)(

2

22

nn

dd

ds 13.1932

n

ss d

d

207.4d

s

dt

（ 4 ）推断在 0.01 显著水平上，否定 H0 ，接受 HA ；两组饲料对动物肝中 VA 含量作用有极显著差异，正常饲料组的动物肝中的 VA 含量极显著高于 VE缺乏组。

t 0.01(7) = 3.499 t > t 0.01(7)

7181 ndf

8n 6500d 73700002d已知已知

种子种子发芽不发芽

害虫害虫存活死亡

植物植物结实不结实

后代后代红花白花

产品产品合格不合格

二二项项分分布布

频频率率分分布布

合格率合格率

发芽率发芽率

死亡率死亡率

结实率结实率

性状比性状比

二项成二项成数数

目标性目标性状状

频率的假设检验频率的假设检验

当 np 或 nq<5

由二项式 (p+q)n

展开式直接检验

xnxxn qpCxP )(

概率函数 Cnxpxqn-x P(x)

P(0) C50p0q5 0.00001

P(1) C51p1q4 0.00045

P(2) C52p2q3 0.0081

P(3) C53p3q2 0.0729

P(4) C54p4q1 0.32805

P(5) C55p5q0 0.59049

孵化小鸡的概率表(p= 0.90 q=0.10)

P(0) 或 P(1) 或 P(2) < 0.05 ，差异显著；

P(3) 或 P(4) 或 P(5) > 0.05 ，差异不显著。


当 np 和 nq > 30

中心极限定中心极限定理理

正态分布（（ u u 检验检验））正态分布（（ u u 检验检验））

近似近似

发芽率发芽率死亡率死亡率结实率结实率相状比相状比


当 5<np 或 nq<30

由于二项总体的百分数（频率）是由某一属性的个体计算来的整数，所以是离散型的。当样本不太大时，把它当作连续型的近似正态总体来处理，结果会有些出入，容易发生第一类错误。补救的办法时仍按正态分布的假设检验计算，但必须进行连续性矫正，即随机变量所落的区间+0.5 ，如一个样本由矫正为。在经连续型校正之后所作的推断其准确性不亚于 2×2列联表。

)ˆ( nppn 5.0ˆ nppn

一、一个样本频率的假设检验

一、一个样本频率的假设检验

适用范围适用范围：：检验一个样本频率（记为检验一个样本频率（记为

）和某一理论值或期望值）和某一理论值或期望值 pp 的差异显著性。的差异显著性。

p̂

在二项分布中，事件 A 发生的频率 x/n称为二项成数，即百分数或频率。则二项成数的平均数和标准差分别为：

也称为二项总体成数的标准误，当 p 未知时，常以样本百分数来估计。此时上式改写为：

=

称为样本成数标准误。

pp npq /)(

pp̂

nqp /)ˆˆ( pq ˆ1ˆ pS

pS

样本频率的标准误n

pqp ˆ 其中 q = 1-p

1 、当 np 和 nq > 30 ，不需连续性矫正，则 u 值为：

npq

nppn

npq

ppppu

p

ˆ

/

ˆˆ

ˆ

pppc n

nppnnpp

npp

uˆˆˆ

5.0ˆ5.0

ˆ5.0

)ˆ(

2 、当 5<np 或 nq<30 时，需要进行连续性矫正， uc 值为：

如果 np<30 ，因 0<p<1 ，所以 n<30

nqp

npp

sn

ppt

pc ˆˆ

5.0ˆ

5.0ˆ

ˆ

1~ ndf

其中“＋”表示在 >p 时取“－”； <p 时取“＋”。

p̂ p̂

例例：有一批蔬菜种子的平均发芽率为：有一批蔬菜种子的平均发芽率为 0.850.85 ，现随机抽取，现随机抽取 500500

粒，用种衣剂进行浸种处理，结果有粒，用种衣剂进行浸种处理，结果有 445445粒发芽，粒发芽，

检验种衣剂对种子发芽有无效果？检验种衣剂对种子发芽有无效果？

（ 3 ）不知使用种衣剂的发芽率是高是低，用双尾检验。

分　析

分　析

（ 1 ）一个样本频率的假设检验；

（ 2 ） np 和 nq > 30 ，无需连续矫正，用 u 检验；

（１）假设

（ 2 ）水平

（ 3 ）检验

（ 4 ）推断

H0:p=0.85

　即用种衣剂浸种后的发芽率仍为 0.85;

HA:p≠0.85


89.0500

445ˆ

n

xp

u >1.96 ， P<0.05


016.0/ˆ npqp

认为种衣剂浸种能够显著提高蔬菜种子的发芽率。

5.2016.0

85.089.0ˆ

ˆ

p

ppu

例例：规定种蛋的孵化率：规定种蛋的孵化率 >0.80>0.80 为合格，现对一批种蛋随为合格，现对一批种蛋随

机抽取机抽取 100100枚进行孵化，结果有枚进行孵化，结果有 7878枚孵出，枚孵出，

问这批种蛋是否合格？问这批种蛋是否合格？

（ 3 ）只有孵化率≤ 只有孵化率≤ 0.800.80 ，才认为是不合格，故采，才认为是不合格，故采用用

单尾检验。单尾检验。

分　析

分　析

（ 1 ）一个样本频率的假设检验；

（ 2 ） np 和 nq > 5 ，但 nq <30nq <30 ，，需要进行连续矫正，

由于 n > 30 ，用 u 检验；

（１）假设（１）假设

（（ 22 ）水平）水平

（（ 33 ）检验）检验

（（ 44 ）推断）推断

HH00:p≤ 0.80:p≤ 0.80 ，即该批种蛋不合格。，即该批种蛋不合格。

HHAA:p>0.80:p>0.80

选取显著水平选取显著水平 αα ＝＝ 0.05 0.05

78.0ˆ n

xp

uucc <1.645 <1.645 ，， P>0.05P>0.05

在在 0.050.05 显著水平上，接受显著水平上，接受 HH00 ，否定，否定 HHAA ；；

04.0/ˆ npqp

认为这批种蛋不合格。认为这批种蛋不合格。

375.0

5.0ˆ

ˆ

p

cn

ppu

二、两个样本频率的假设检验

二、两个样本频率的假设检验

适用范围适用范围：：检验两个样本频率和检验两个样本频率和

差异的显著性。差异的显著性。

1p̂ 2p̂

一般假定两个样本的方差是相等的，即 22

21 pp

2

22

1

11ˆˆ

ˆˆˆˆ21 n

qp

n

qps

pp

两个样本频率差数的标准误两个样本频率差数的标准误

H0: p1 = p2= p ， q1=q2=q

)11

(21

ˆˆ 21 nnpqs

pp

1

11ˆ

n

xp

2

22ˆ

n

xp

21

21

21

2211

nn

xx

nn

pnpnp

pq 1

n

qps

pp

221 ˆˆ

当 n1= n2=n 时

在总体 p1 和 p2 未知，假定条件下，可用两样本频率的加权平均值作为对 p1 和 p2 的估计，即：

22

21 pp

p

111 pnx

222 pnx

)11

(21

ˆˆ 21 nnqps

pp

1 、当 np 和 nq > 30 ，不需连续性矫正，用 u 检验：

21 ˆˆ

2121 )()ˆˆ(

pps

ppppu

在 H0: p1 = p2 下，

21 ˆˆ

21 ˆˆ

pps

ppu

21 ˆˆ

212121

5.05.0)()ˆˆ(

pp

c s

nnpppp

u

2 、当 5 < np 或 nq < 30 ，需进行连续性矫正，

如果 n > 30 , 用 u 检验：

在 H0: p1 = p2 下，

21 ˆˆ

2121

5.05.0ˆˆ

pp

c s

nnpp

u

21 ˆˆ

212121

5.05.0)()ˆˆ(

pp

c s

nnpppp

t

2 、当 5 < np 或 nq < 30 ，需进行连续性矫正，

如果 n < 30 , 用 t 检验：

在 H0: p1 = p2 下，

21 ˆˆ

2121

5.05.0ˆˆ

pp

c s

nnpp

t

2)1()1(~ 2121 nnnndf

例：研究地势对小麦锈病发病的影响

比较两块麦田锈病发病率是否有显著性差异。

低洼地麦田 378 株，其中锈病株 342株

高坡地麦田 396 株，其中锈病株 313株

（ 3 ）事先不知两块麦田的锈病发病率孰高孰低，

用双尾检验。

分　析

分　析

（ 1 ） 2 个样本频率的假设检验；

（ 2 ） np 和 nq > 30 ，无需连续矫正，用 u 检验；

（１）假设

（ 2 ）水平

（ 3 ）检验

H0: p1=p2 　即两块麦田锈病发病率没有显著差异。

HA: p1 ≠ p2选取显著水平 α ＝ 0.01

905.0378

342ˆ

1

11

n

xp 790.0

396

313ˆ

2

22

n

xp

846.0396378

313342

21

21

nn

xxp

154.01 pq

026.0)11

(21

ˆˆ 21

nnqps

pp


认为两块麦田锈病发病率有极显著差异，即地势对小麦锈病的发生有极显著影响作用，低洼地小麦锈病的发病率极显著高于高坡地。

（ 4 ）推断

u>2.58 ， P<0.01

423.4ˆˆ

21 ˆˆ

21

pp

s

ppu

例：某鱼场发生了药物中毒，

检验甲、乙两池发生药物中毒以后，鱼的死亡率是否有显著性差异。

抽查甲池中的 29尾鱼，有 20尾死亡

抽查乙池中的 28尾鱼，有 21 尾死亡

（ 3 ）事先不知两池鱼的死亡率孰高孰低，用双尾检验。

分　析

分　析

（ 1 ） 2 个样本频率的假设检验；

（ 2 ） 5 < np 和 nq < 30 ，需进行连续矫正，

因 n1<30 ， n2<30 ，用 t 检验；

（１）假设

（ 2 ）水平

（ 3 ）检验

H0: p1=p2 　即甲乙两池鱼的死亡率没有显著差异

HA: p1 ≠ p2


690.029

20ˆ

1

11

n

xp 750.0

28

21ˆ

2

22

n

xp

719.02829

2120

21

21

nn

xxp

281.01 pq

119.0)11

(21

ˆˆ 21

nnqps

pp

df=29+28-2=55

在 0.05 显著水平上，接受 H0 ，否定 HA ；

认为发生药物中毒后，甲、乙两鱼池鱼的死亡率没有显著差异。

（ 4 ）推断

209.0

5.05.0ˆˆ

21 ˆˆ

2121

pp

c s

nnpp

t

t 0.05(55) = 2.004 ， t c <t 0.05(55)

第四节：参数的区间估计与点估计

一、参数区间估计与点估计的原理

三、两个总体平均数差数的区间估计与点估计

二、总体平均数的区间估计与点估计

四、总体频率、两个总体频率差数的区间估计与点估计


参数的区间估计与点估计是建立在一定理论基础上的一种方法。

由中心极限定理和大数定律，只要抽样为大样本，不论其总体是否为正态分布，其样本平均数都近似服从正态分布N(μ， σ2/n)。

0

0.95 （接受区）

0.0250.025

临界值

接受区0-1.96x 0+1.96x

xu

95.0)96.196.1( xx

xP

05.0)96.1()96.1( xx

xPxP

99.0)58.258.2( xx

xP

01.0)58.2()58.2( xx

xPxP

95.0)96.196.1( xx

xP

99.0)58.258.2( xx

xP

95.0)96.196.1( xx

xP

95.0)96.196.1( xx

xxP

95.0)96.196.1( xx

xxP

95.0)96.196.1( xx

xxP

99.0)58.258.2( xx

xxP

95.0)96.196.1( xx

xxP

1)(xx

uxuxP

99.0)58.258.2( xx

xxP

uα ：正态分布下置信度 P=1- α 时的 u 临界值

1- α ：置信水平

1)(xx

uxuxP

知道 x ，但不知道 μ

1- α置信区间、置信距 ),(xx

uxux

),( 21 xxuxLuxL

),( 21 xxuxLuxL

用样本平均数 x 对总体平均数 μ 的置信度为 P=1-α 的区间估计。

xuxL

用样本平均数 x 对总体平均数 μ 的置信度为 P=1-α 的点估计。


参数的区间估计也可用于假设检验。

对参数所进行的假设如果落在该区间之外，就说明这个假设与真实情况有本质的不同，因而就否定零假设，接受备择假设。

置信区间是在一定置信度 P=1-α 下总体参数的所在范围，故对参数所进行的假设如果落在该区间内，就说明这个假设与真实情况没有不同，因而就可以接受零假设。


无论区间估计还是点估计，都与概率显著水平 α的大小联系在一起。

α越小，则相应的置信区间就越大，也就是说用样本平均数对总体平均数估计的可靠程度越高，但这时估计的精度就降低了。

在实际应用中，应合理选取概率显著水平 α的大小，不能认为α取值越小越好。

二、总体平均数 μ 的区间估计和点估计

当为大样本时，不论总体方差 σ2

为已知或未知，可以利用样本平均数x 和总体方差 σ2 作出置信度为 P ＝1-α 的中体平均数的区间估计为：

),( 21 xxuxLuxL

xuxL 1

xuxL 2

其置信区间的下限 L1 和上限 L2

为

总体平均数的点估计 L为

xuxL

当样本为小样本且总体方差 σ2 未知时， σ2需由样本方差 s2 来估计，于是置信度为P ＝ 1-α 的总体平均数 μ 的置信区间可估计为

),(xx

stxstx

其置信区间的下限 L1 和上限 L2 为：

),( 21 xxstxLstxL

总体平均数的点估计 L 为：

xstxL

Tа为正态分布下置信度 P＝ 1 － α 时的 t 临界值

例 4.14 测得某批 25 个小麦样本的平均蛋白质含量＝ 14.5％，已知 σ ＝ 2.50％，试进行 95％置信度下的蛋白质含量的区间估计和点估计。

分析：本例 σ 为已知 , 置信度P＝ 1- α =0.95，u0.05=1.96。

50.025

50.2

nx

(%)52.1350.096.15.141 x

uxL

(%)48.1550.096.15.142 x

uxL

98.05.1450.096.15.14 x

uxL

蛋白质含量的点估计为：

说明小麦蛋白质含量有 95％的把握落在 13.52％～ 15.48％的区间里。

例题从某渔场收对虾的总体中，随机取 20 尾对虾，测的平均体长 x ＝ 120mm ，标准差是＝15mm ，试估计置信度为 99％的对虾总体平均数本例中，由于总体方差 σ 2 未知，需用 s2 估计σ2 ，当 df ＝ 20 － 1 ＝ 19 时， t0.01 ＝ 2.861 。具体计算如下

354.320

15

n

ss

x

于是对虾体长的区间估计为

)(6.129354.3861.21202 mmstxLx

)(4.110354.3861.21201 mmstxLx

对虾体长的点估计为：

)(6.9120354.3861.2120 mm

stxLx

说明对虾体长有 99％把握落在 110.4mm～ 129.6mm 区间里

三、两个总体平均数差数

µ1-µ2 的区间估计与点估计

　　当两个总体方差 σ 12 和 σ 2

2 为已知，或总体方差 σ1

2 和 σ22 未知但为大样本时，在置信度为 P ＝ 1-

α下，两个总体平均数差数 µ1-µ2 的区间估计为：

2121

)(, 2121 xxxxuxxuxx

21

21 xxuxxL

两个总体平均数差数 µ1-µ2 的点估计Ｌ为

其置信区间的下限Ｌ 1 和上限 L2

为： 2121

)(, 212211 xxxxuxxLuxxL

　　当两个样本为小样本，总体方差 σ12 和

σ22 未知，当两总体方差相等，即 σ1

2 ＝ σ

22 ＝ σ2 时，可由两样本方差 s1

2 和 s22 估

计总体方差 σ12 和 σ2

2 ，在置信度为 P ＝ 1- α下，两总体平均数差数 µ1-µ2 的区间估计为：

2121)(, 2121 xxxx

stxxstxx

两个总体平均数差数 µ1-µ2 的点估计Ｌ为：

21

21 xxstxxL

其置信区间的下限Ｌ 1 和上限 L2 为：

2121

)(, 212211 xxxxstxxLstxxL

　　当两个样本为小样本，总体方差 σ12 和 σ2

2

未知，且两总体方差不相等，即 σ12 ≠ σ2

2 时，可由两样本方差 s1

2 和 s22 对总体方差 σ1

2 和 σ22

的估计而算出的 t 值，已不是自由度 df ＝ n1+n2-2 的 t 分布，而是近似的服从自由度 df '的t分布，在置信度为 P ＝ 1-α下，两总体平均数差数 µ1-µ2 的区间估计为：

21

'21

' )(21)(21 )(,xxdfxxdf

stxxstxx


21

'21

' )(212)(211 )(,xxdfxxdf

stxxLstxxL


21

',21 xxdfstxxL

上面三式中， tα ， df ' 为置信度为P=1- α 时自由度为 df ' 的 t 临界值。

当两样本未成对资料时，在置信度为 P ＝ 1- α 时，两总体平均数差数 µ1-µ2 的置信区间可估计为：

其置信区间的下限Ｌ 1 和上限 L2 为： d ds t d s t d ,

d ds t d L s t d L 2 1,

d s t d L


例题用高蛋白和低蛋白两种饲料饲养一月龄大白鼠，在三个月时，测定两组大白鼠的增重重量（ g ），两组的数据分别为：高蛋白组：134 ， 146 ， 106 ， 119 ， 124 ， 161 ， 107 ， 83 ， 113 ， 129 ， 97 ， 123 低蛋白组： 70 ， 118 ， 101 ， 85 ， 107 ， 132 ， 94

试进行置信度为 95％时两种蛋白饲料饲养的大白鼠增重的差数区间估计和点估计。

005.1021 xx

s

gxgx 00.101,17.120 21

110.2,17 05.0 tdf

其置信度为 95％时两种蛋白饲料饲养的大白鼠增重的差数区间估计为：

)(94.1005.10110.2)00.10117.120(21

21

g

stxxLxx

)(284.40005.10110.2)00.10117.120(

2121

g

stxxLxx

已算得

两种蛋白质饲料饲养的大白鼠增重的差数点估计为：

)(11.2117.19

005.10110.2)00.10117.120(21

21

g

stxxLxx

说明两种蛋白饲料饲养下大白鼠增重的差数有 95％的把握落在 -1.94g～ 40.284g 的区间里。

例题试对表 4 － 1资料进行置信度为 99％的区间估计和点估计。

已算得

499.3,7

13.193

,5.812

01.0

1

1

tdf

gIUs

gIUd

d

于是，两种饲料饲养下动物肝脏中维生素 A 含量差数的区间估计为：

) ( 74 . 136

13 . 193 499 . 3 5. 8121

g IU

s t d Ld

) ( 26 . 1488

13 . 193 499 . 3 5. 8121

g IU

s t d Ld

两种饲料饲养下动物肝脏中维生素 A 含量差数的点估计为：

) ( 76 . 675 5. 812

13 . 193 499 . 3 5. 8121

g IU

s t d Ld

说明两种饲料饲养下动物肝脏中维生素A 含量差数的有 99％的把握落在 136.74IU·g-1～ 148.26 IU·g-1 的区间里。

四、总体频率 p 、两总体频率差数 p1-p2 的区间估计和点估计

在置信度Ｐ＝ 1- α 下，对一　　个总体频率 P 的区间估计为：

pp upup ˆˆ ˆ,ˆ

总体频率 p 的点估计 L 为：

pupL ˆˆ


pp upLupL ˆ2ˆ1 ˆ,ˆ

　　当样本容量较小或者 np 、 nq远小于 30时，对总体频率 p 进行的区间估计和点估计，需要做连续性校正，其校正公式为：

nupL

nupL pp

5.0ˆ,

5.0ˆ ˆ2ˆ1

总体频率 p 的点估计Ｌ为：

nupL p

5.0ˆ ˆ

　　在进行两个总体频率 p1-p2 的区间估计和点估计时，一般应明确两个频率有显著差异才有意义。

　　在置信度为 P ＝ 1-α 下，两总体频率差数 p1-p2 的区间估计为

])ˆˆ(,)ˆˆ[(2121 ˆˆ21ˆˆ21 pppp uppupp

　其置信区间的下限Ｌ 1 和上限 L2 为：

])ˆˆ(,)ˆˆ([2121 ˆˆ211ˆˆ211 pppp uppLuppL

　两总体频率差数 p1-p2 的点估计 L 为：

21 ˆˆ21 )ˆˆ( ppuppL

例 4.18 调查 100株玉米 ,得到受玉米螟为害的为 20株，即 p ＝ 0.2 或 np ＝ 20 。试进行置信度为 95％的玉米螟为害率的区间估计和点估计。

04.0100

)20.01(20.0)1(ˆˆ

n

ppp

α ＝ 0.05 ，ｕ 0.05 ＝ 1.96．于是，置信度为95％的玉米螟为害率的区间估计为：

1216.004.096.12.0ˆ ˆ1 pupL

2784.004.096.12.0ˆ ˆ2 pupL

玉米螟为害率的点估计为：

0784.02.0

04.096.12.0

ˆ ˆ

pupL

例 4.19 　例用例 4.12 计算结果，试进行置信度为 99％的两块麦田锈病发病率差数的区间估计和点估计。

计算得 790.0ˆ,905.0ˆ 21 pp

026.021 ˆˆ pps

由于 np 、 nq 均大于 30 ，故可以用

2121 ˆˆˆˆ pppps 估计

　　当 P ＝ 1-α ＝ 0.99 时， α ＝ 0.01 ， u0.01 ＝ 2.58 　　　　　　　　　　　　　所以置信度为 99％的两块麦田锈病发病率差数的区间估计为　　

0479.0

026.058.2)790.0905.0(

)ˆˆ(21 ˆˆ211

ppsuppL

1821.0

026.058.2)790.0905.0(

)ˆˆ(21 ˆˆ212

ppsuppL

两块麦田锈病发病率差数的点估计为：

0671.0115.0

026.058.2)790.0905.0(

)ˆˆ(21 ˆˆ21

ppsuppL

第五节　方差的同质性检验

所谓方差的同质性，就是指各个总体的方差是相同的。

方差的同质性检验就是要从各样本的方差来推断其总体方差是否相同

一、一个样本方差的同质性检验我们知道从标准正态总体中抽取 k 个独立 u2之和为 χ2 ，即

22

22 )(1

)(

xx

当用样本平均数估计 μ 时，则有：x

22

2 )(1 xx

1

)(2

n

xxs

1

)(2

n

xxs s

1

(2

n

xxs

）由样本方差

上式中 , 分子表示样本的离散程度 , 分母表示总体方差 , 其服从自由度为 n-1 的分布 .2 2

2

22 )1(

sn

得

例题已知某农田受到重金属的污染，经抽样测定其铅浓度为4.2 ， 4.5 ， 3.6 ， 4.7 ， 4.0 ， 3.8 ， 3.7 ， 4.2μg·g-1 ，样本方差为 0.150 （ μg·g-1 ） 2 ，试检验受到污染的农田铅浓度的方差是否与正常农田铅浓度的方差 0.065 （ μg·g-1 ） 2 相同。此题为一个样本方差与总体方差的同质性检验

（１）假设

（ 2 ）水平选取显著水平 α ＝ 0.05

H0: σ2 ＝ 0.065 ，即受到污染的农田铅浓度的方差与正常农田铅浓度的方差相同。 HA: σ2≠0.065

（ 3 ）检验15.16

065.0

150.0)18()1(2

22

sn

查附表，当 df ＝ 8-1 ＝ 7 时，　 2

05.022

95.02

05.0 ,17.2,07.14 现实得

（ 4 ）推断

否定 H0 ，接受Ｈ A ，即样本方差与总体方差是不同质的，认为受到污染的农田铅浓度的方差与正常农田铅浓度的方差 0.065 （ μg·g-1 ） 2 有显著差异

二、两个样本方差的同质性检验

假设两个样本容量分别为 n1 和 n2 ，方差分别为 s1

2 和 s22 ，总体方差分别为 σ1

2 和 σ22 ，

当检验 σ12 和 σ2

2 是否同质时，可用Ｆ检验法。当两样本总体均服从正态分布，且两样本的抽样是随机的和独立的，其Ｆ值等与两样本方差 s1

2 和 s22之比。

22

21

s

sF

且否从 df1 ＝ n1-1 ， df2 ＝ n2-1 的 F 分布。当 F<Fα 时，接受Ｈ 0 ： σ1

2 ＝ σ22 ，即认为

两样本的方差是同质的，当 F>Fα 时，否定Ｈ 0 ： σ1

2≠σ22 ，即认为两样本的方差是不

同质的。

例题　检验例 4.7 中两个小麦品种千粒重的方差是否同质。

该题中， s12 ＝ 22.933 ， s2

2 ＝ 2.933 ， n1=n2=10

（１）假设 H0 ： σ12 ＝ σ2

2 ， HA ： σ12≠

σ22

（ 2 ）水平选取显著水平 α ＝ 0.05

（ 3 ）检验

819 . 7933 . 2

933 . 2222

21

s

sF

（ 4 ）推断

否定 H0 ，接受 HA ，即认为两小麦品种千粒重的方差不是同质的

Documents

统计推断 (statistical inference)