53
第第第 第第第第第第第第第第

第十章 基于秩次的非参数检验

Embed Size (px)

DESCRIPTION

第十章 基于秩次的非参数检验. 本章内容:. 第一节 配对样本比较的 Wilcoxon 符号秩检验 第二节 两个独立样本比较的 Wilcoxon 秩和检验 第三节 完全随机设计多个样本比较的 Kruskal-Wallis H 检验 第四节 随机区组设计多个样本比较的 Friedman M 检验. 概述 前面所述的 计量资料的 t 检验和 F 检验 ,都是基于总体分布为正态分布、总体方差相等的前提下对总体均数进行的检验。这类检验方法 总体分布为已知的函数形式,是对其总体参数作假设检验称为参数检验( parametric test )。. - PowerPoint PPT Presentation

Citation preview

Page 1: 第十章 基于秩次的非参数检验

第十章 基于秩次的非参数检验

Page 2: 第十章 基于秩次的非参数检验

本章内容:

第一节 配对样本比较的 Wilcoxon 符号秩检验

第二节 两个独立样本比较的 Wilcoxon 秩和检验

第三节 完全随机设计多个样本比较的 Kruskal-Wallis H 检验

第四节 随机区组设计多个样本比较的 Friedman M 检验

Page 3: 第十章 基于秩次的非参数检验

概述 前面所述的计计计计计 t 检验和 F 检验 计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计计总体分布为已知的函数形式,是对其总体参数作假设检验称为参数检验( parametric test )。

Page 4: 第十章 基于秩次的非参数检验

若总体分布未知或已知总体分布与检验所要求的条件不符,数据转换也不使其满足参数检验的条件,这时需要采用一种不依赖于总体分布的具体形式,与总体参数无关的检验方法。这种方法不受总体参数的影响,它检验的是分布,不是参数,称为非参数检验( nonparametric test )。

Page 5: 第十章 基于秩次的非参数检验

本章介绍常用的秩转换( rank transformation )的非参数检验,也称秩和检验( rank sum test ),该类方法在非参数检验中占有重要地位。 秩转换的非参数检验是首先将定量数据从小到大,或等级从弱到强转换成秩后,再求秩和,计算检验统计量—秩统计量,做出统计推断。

Page 6: 第十章 基于秩次的非参数检验

由于秩统计量的分布与原数据总体分布无关,具有较好的稳健性,可用于任何分布类型的资料。 例如,一端或两端有不确定数值(如 <0.1,>15.0 )的资料、总体分布为偏态或分布不明的小样本(比如 n<30 )资料、不满足参数检验条件的资料、等级资料等。 如果已知其计量资料满足(或近似满足)参数检验条件的,应该选用参数检验的方法,因为此时若选用秩转换的非参数检验的方法,会降低检验效能。

Page 7: 第十章 基于秩次的非参数检验

第一节配对设计和单样本资料的符号秩和检验

Page 8: 第十章 基于秩次的非参数检验

一、  配对设计资料的符号秩和检验

Page 9: 第十章 基于秩次的非参数检验

配对设计计量资料两处理效应的比较,一般采用配对 t 检验,如果差数严重偏离正态分布,可采用 Wilcoxon 秩检验,亦称符号秩和检验( signed rank test )。一般认为,在数据满足配对 t 检验要求时, Wilcoxon 秩检验的功效是检验效能的 95% 左右。

Page 10: 第十章 基于秩次的非参数检验

目的是推断配对样本差值的总体中位

数是否和 0 有差别,即推断配对的两个相

关样本所来自的两个总体中位数是否有差

别。方法步骤见例 8-1 。

Page 11: 第十章 基于秩次的非参数检验

例 10-1 某研究者欲研究保健食品对小鼠抗疲劳作用,

将同种属的小鼠按性别和年龄相同、体重相近配成对

子,共 10 对,并将每对中的两只小鼠随机分到保健

食品两个不同的剂量组,过一定时期将小鼠杀死,测

得其肝糖原含量( mg/100g ),结果见表 10-1 ,

问不同剂量组的小鼠肝糖原含量有无差别?

Page 12: 第十章 基于秩次的非参数检验

表 1 0 - 1 不 同 剂 量 组 小 鼠 肝 糖 原 含 量 ( m g /1 0 0 g)

小 鼠 对 号 中 剂 量 组 高 剂 量 组 差 值 d 秩 次 ( 1 ) ( 2 ) ( 3 ) ( 4 ) = ( 3 ) - ( 2 ) ( 5 ) 1 6 2 0 . 1 6 9 5 8 . 4 7 3 3 8 . 3 1 1 0 2 8 6 6 . 5 0 8 3 8 . 4 2 - 2 8 . 0 8 - 5 3 6 4 1 . 2 2 7 8 8 . 9 0 1 4 7 . 6 8 8 4 8 1 2 . 9 1 8 1 5 . 2 0 2 . 2 9 1 . 5 5 7 3 8 . 9 6 7 8 3 . 1 7 4 4 . 2 1 6 6 8 9 9 . 3 8 9 1 0 . 9 2 1 1 . 5 4 3 . 5 7 7 6 0 . 7 8 7 5 8 . 4 9 - 2 . 2 9 - 1 . 5 8 6 9 4 . 9 5 8 7 0 . 8 0 1 7 5 . 8 5 9 9 7 4 9 . 9 2 8 6 2 . 2 6 1 1 2 . 3 4 7

1 0 7 9 3 . 9 4 8 0 5 . 4 8 1 1 . 5 4 3 . 5

5.48T 5.6T

Page 13: 第十章 基于秩次的非参数检验

本例配对样本差值经正态性检验,推断得总体不服从正态分布,现用 Wilcoxon 符号秩检验。

Page 14: 第十章 基于秩次的非参数检验

0H:差值的总体中位数 0dM

1H: 0dM 0.05

1. 建立检验假设,确定检验水平

2. 求检验统计量 T 值

① 省略所有差值为 0 的对子数,令余下的有效对子数为 n ,见表 10-1 第( 4 )栏,本例 n=1

0 ;

检验步骤

若多个差值为 0,可通过提高测量工具的精度来解决。

Page 15: 第十章 基于秩次的非参数检验

② 按差值的绝对值从小到大编秩,然后分别冠以正负号。遇差值绝对值相等则取平均秩,称为相同秩( ties )(样本较小时,如果相同秩较多,检验结果会存在偏性,因此应提高测量精度,尽量避免出现较多的相同秩) , 表 10-1 第( 4 )栏差值的绝对值为 2.29 有 2 个,其秩依次应为 1 , 2 ,皆取平均秩为 1.5 ,见表 10-1 第( 5 ) .

③ 任取正秩和或负秩和为 T ,本例取 T=6.5 。

Page 16: 第十章 基于秩次的非参数检验

3. 确定 P 值,作出推断结论

( 1 )查表法( 时) ,查 T 界值表(附表 9 ), 判断原则:内大外小 。本例, n=10,T=6.5,查附表9,得双侧02.0p,按05.0检验水准,拒绝0H。可以认为该保健食品的不同剂量对小鼠肝糖原含量的作用不同。

505 n

Page 17: 第十章 基于秩次的非参数检验

( 2 )正态近似法( n>50 时)超出附表 9 范围,可用正态近似法作 u 检验。

T

TTZ

4/)1( nnT 24/)12)(1( nnnT

Page 18: 第十章 基于秩次的非参数检验

当 n 不很大时,统计量 Z 需要作如下的连续性校正:

24/)12)(1(

5.04/)1(5.0

nnn

nnTTZ

T

T

Page 19: 第十章 基于秩次的非参数检验

若 多 次 出 现 相 持 现 象 ( 如 超 过 2 5 % ), 用 ( 1 0 - 3 ) 式 求 得 的 Z 值 偏 小 , 应 按 公

式 ( 1 0 - 4 ) 计 算 校 正 的 统 计 量 值 Z c 。

48

)(

24

)12)(1(

5.04/)1(3

jj

cttnnn

nnTZ ( 1 0 - 4 )

式 中 t j 为 第 j ( j = 1 , 2 … ) 次 相 持 所 含 相 同 秩 次 的 个 数 。 如 例 1 0 - 1 , 第 1 次 相 持 ,

有 两 个 差 值 的 绝 对 值 均 为 2 . 2 9 , 则 t 1 = 2 ; 第 2 次 相 持 , 有 两 个 差 值 均 为 1 1 . 5 4 ,

则 t 2 = 2 。 于 是 , )( 3jj tt )()( 2

321

31 tttt = ( 2 3 - 2 ) + ( 2 3 - 2 ) = 1 2 。

Page 20: 第十章 基于秩次的非参数检验

二、一组样本资料的符号秩和检验

若单组随机样本来自正态总体,比较其总体均数与某

常数是否不同,可用检验;若样本来自非正态总体

或总体分布无法确定,也可用 Wilcoxon 符号秩和

检验,检验总体中位数是否等于某已知数值。

Page 21: 第十章 基于秩次的非参数检验

例 10-2 已知某地正常人尿氟含量的中位数为 2.15mmol/L 。今在该地某厂随机抽取12 名工人,测得尿氟含量( mmol/L ),结果见表 10-2 。问该厂工人的尿氟含量是否高于当地正常人?

mol/L

Page 22: 第十章 基于秩次的非参数检验

表 10-2 12名工人尿氟含量(mmol/L)测定结果

尿氟含量 X

差值 d

秩次

2.15 0 2.10 -0.05 -2.5 2.20 0.05 2.5 2.12 -0.03 -1 2.42 0.27 4 2.52 0.37 5 2.62 0.47 6 2.72 0.57 7 2.99 0.84 8 3.19 1.04 9 3.37 1.22 10 4.57 2.42 11

T+=62.5 T-=3.5

Page 23: 第十章 基于秩次的非参数检验

由表10-2第2栏可计算观察值与已知中位数0M2.15mmol/L的差值d,其均数为5975.0d,标准差为7141.0dS对这些差值进行正态性检验,8380.0W,03.0P,因此,不满足t检验关于样本来自正态分布的条件,该资料宜用

Wilcoxon符号秩和检验。

Page 24: 第十章 基于秩次的非参数检验

1 、 求差值 0Mxd i ,见表 10-2 的第(2)栏。

2 、 检验假设

0H :差值的总体中位数等于零,即 0)( dMd

1H :差值的总体中位数不等于零,即 0)( 计dMd

05.0

3. 编秩 对差值的绝对值编秩,方法同上。

4. 求正、负秩和并确定检验统计量

本例,T+=62.5,T-=3.5,T+与 T-之和为 66,恰好等于 11(11+1)/2,表明秩和

的计算无误;取 T= min(T+,T-)=3.5。

Page 25: 第十章 基于秩次的非参数检验

5. 确定 P 值并做出推断结论本例, n=11 , T=3.5 ,查配对设计用 T 界值表,得 P<0.005 ,按 α=0.05 检验水准,拒绝,接受。可认为该厂工人尿氟含量高于当地正

常人。

Page 26: 第十章 基于秩次的非参数检验

第二节

完全随机化设计两独立样本的秩和检验

Page 27: 第十章 基于秩次的非参数检验

一、两组连续变量资料的秩和检验

例 10-3 在河流监测断面优化研究中,研究者从

某河流甲乙两个断面分别随机抽取 10 和 15 个

样品,测得其亚硝酸盐氮 (mg/L) 的含量如表 1

0-3 ,试比较甲乙两个河流断面亚硝酸盐氮的

含量有无差别?

Page 28: 第十章 基于秩次的非参数检验

.

表 10-3 某河流甲乙断面亚硝酸盐氮含量(mg/L)监测结果

河流甲断面 河流乙断面

亚硝酸盐氮含量 秩次 亚硝酸盐氮含量 秩次 亚硝酸盐氮含量 秩次

0.014 1.0 0.018 2.5 0.036 17.0

0.018 2.5 0.019 4.0 0.037 18.0

0.024 8.5 0.020 5.0 0.055 21.0

0.025 10.5 0.022 6.0 0.064 22.5

0.027 12.0 0.023 7.0 0.067 24.0

0.034 15.0 0.024 8.5

0.038 19.0 0.025 10.5

0.043 20.0 0.028 13.0

0.064 22.5 0.030 14.0

0.100 25.0 0.035 16.0

n1=10 T1=136.0 n2=15 T2=189.0

本例两样本资料经方差齐性检验,推断得两总体方差不等

Page 29: 第十章 基于秩次的非参数检验

0H :甲乙两河流断面亚硝酸盐氮含量的总体分布相同

1H:甲乙两河流断面亚硝酸盐氮含量的总体分布不同

0.05

检验 步骤

求检验统计量 T 值:

①把两样本数据混合从小到大编秩,遇数据相等者取平均秩; ②以样本例数小者为1n,其秩和(1T)为T,若两样本例数相等,可任取一样本的秩和(1T或2T)为T,本例T=136.0。

Page 30: 第十章 基于秩次的非参数检验

确定 P 值,作出推断结论:

( 1 )查表法 查 T界值表(成组设计用),先从左侧找到 n1 ( n1 和 n2 中的较小者),本例为 10 ;再从表上方找两组例数的差( n2-n1 ),本例, n2-n1=5 ;在两者交叉处即为 T 的临界值。将检验统计量 T 值与 T 临界值相比,若 T 值在界值范围内,其 P 值大于相应的概率;若 T 值等于界值或在界值范围外,其 P 值等于或小于相应的概率。本例 , 概率为双侧 0.05 对应的 T 界值为 94 ~ 166 ; T=136.0 并未超出该范围,故 P>0.05 ;按 α=0.05 检验水准,不拒绝 H0 。不能认为某河流甲乙断面亚硝酸盐氮含量的总体分布的位置不同。

Page 31: 第十章 基于秩次的非参数检验

若110n或2110nn,超出附表10的范围,可用正态近似法作u检验,令12nnN,按下式计算u值。

12)1(

5.02)1(

2121

21

nnnn

nnTZ

若 Z 超过标准正态分布的临界值,则拒绝 。0H

Page 32: 第十章 基于秩次的非参数检验

上式用于无相持或相持不多的情形;若相持较多(比如超过 2 5 %),应按下

式进行校正。

c

ZZ c ( 1 0 - 6)

其 中 , )/()(1 33 NNttc jj , jt 为 第 j 次 相 持 时 相 同 秩 次 的 个 数 ,

21 nnN 。

Page 33: 第十章 基于秩次的非参数检验

二、两组有序变量资料的秩和检验

例 10-4 某研究者欲评价新药按摩乐口服液治疗高甘油三脂血症的疗效,将高甘油三脂血症患者 189例随机分为两组,分别用按摩乐口服液和山楂精降脂片治疗,数据见表 10-4 ,问两种药物治疗高甘油三脂血症的疗效有无不同?

Page 34: 第十章 基于秩次的非参数检验

表 10-4 两种药物治疗高甘油三脂血症的疗效

人数 秩和

疗效 按摩乐口服液

山楂精降脂片 合计

秩次范围

平均秩次 按摩乐口服

液 山楂精降脂

(1) (2) (3) (4) (5) (6) (7)=(2)(6) (8)=(3)(6)

无效 17 70 87 1-87 44 748 3080

有效 25 13 38 88-125 106.5 2662.5 1384.5

显效 27 37 64 126-

189 157.5 4252.5 5827.5

合计 69 120 189 7663 10292

Page 35: 第十章 基于秩次的非参数检验

0H:两种药物疗效的总体分布相同

1H:两种药物疗效的总体分布相同

0.05

① 先确定各等级的合计人数、秩范围和平均秩,见表 10-4 的( 4 )栏、( 5 )栏和( 6 )栏,再计算两样本各等级的秩和,见( 7 )栏和( 8 )栏;

② 本例 T=7663 ;

Page 36: 第十章 基于秩次的非参数检验

③ 计算 Z 值0587.3

12/)1189(69120

5.02/)1189(697663

Z

8555.0189189

)6464()3838()8787(1

)/()(1

3

333

33

NNttc jj

3069.38555.0

0587.3

c

ZZ c

3069.3cZ,查标准正态分布表,得001.0P。按05.0检验水准,拒绝0H,接受1H,可以认为,两种药物对高甘油三脂血症的疗效分布不同。

Page 37: 第十章 基于秩次的非参数检验

第三节完全随机化设计多组独立样本的

秩和检验

Page 38: 第十章 基于秩次的非参数检验

一、多组连续变量资料的秩和检验

例 10-5 某研究者欲研究 A 、 B 两个菌种对小鼠巨

噬细胞吞噬功能的激活作用,将 60 只小鼠随机分为三

组,其中一组为生理盐水对照组,用常规巨噬细胞吞

噬功能的监测方法,获得

三组的吞噬指数,试比较三组吞噬指数有无差别?

Page 39: 第十章 基于秩次的非参数检验

表10-5 不同菌种对小鼠巨噬细胞的吞噬指数

对照组(1) A菌组(2) B菌组(3)

吞噬指数 秩次 吞噬指数 秩次 吞噬指数 秩次

1.30 1.0 1.80 14.5 1.50 4.0

1.40 2.0 1.80 14.5 1.80 14.5

1.50 4.0 2.20 20.5 1.80 14.5

1.50 4.0 2.20 20.5 2.00 17.0

1.60 6.5 2.20 20.5 2.30 26.5

1.60 6.5 2.20 20.5 2.30 26.5

1.70 10.0 2.30 26.5 2.40 33.5

1.70 10.0 2.30 26.5 2.40 33.5

1.70 10.0 2.30 26.5 2.40 33.5

1.70 10.0 2.66 42.5 2.40 33.5

1.70 10.0 2.66 42.5 2.50 37.5

2.10 18.0 2.68 44.5 2.50 37.5

2.30 26.5 2.68 44.5 2.60 40.0

2.30 26.5 2.70 47.0 2.60 40.0

2.30 26.5 2.80 49.5 2.60 40.0

2.40 33.5 2.80 49.5 2.70 47.0

2.40 33.5 3.00 51.0 2.70 47.0

3.10 54.5 3.10 54.5

3.10 54.5 3.10 54.5

3.10 54.5

3.10 54.5

3.20 58.0

4.30 59.5

4.30 59.5

Ri 238.5 956.5 635.0

ni 17 24 19

Page 40: 第十章 基于秩次的非参数检验

经检验, 本例的对照组和A菌组均来自非正态总体,因此,不能用方差分析

方法进行检验。现采用Kruskal-Wallis秩和检验。

1.检验假设

H0:三个总体的分布位置相同

1H:三个总体的分布位置不同或不全相同

=0.05

2.编秩 将各组数据混合,由小到大排序并编秩,如遇有相等数值则取平

均秩次,如吞噬指数为1.5的有三个,它们的秩次为3、4和5, 取平均秩次为

(3+4+5)/3=4。

Page 41: 第十章 基于秩次的非参数检验

3 . 求 秩 和 分 别 将 各 组 秩 次 相 加 , 分 别 求 得 1R 、 2R 和 3R 。

4 . 计 算 统 计 量

)1(3)1(

12 2

Nn

R

NNH

i

i ( 1 0 - 7 )

式 中 iR 为 各 组 的 秩 和 , in 为 各 组 对 应 的 例 数 , inN 。 本 例 , 60N ,

5374.22)160(3)19

0.635

24

5.956

17

5.238(

)160(60

12 222

H

Page 42: 第十章 基于秩次的非参数检验

5.确定 P值并做出推断结论

(1)当组数 k=3,每组例数 5in ,可查附表中的H界值表得到P值。

(2)当不满足条件(1)时,H近似地服从自由度为 1k 的 2 分布,

可查 2 界值表得到P值。

式(10-7)用于无相持或相持不多的情形;若相持较多(如超过 25%),应

按式(10-8)计算校正值 cH

c

HH c (10-8)

其中, )()(1 33 NNttc jj , jt 为第 j次相持时相同秩次的个数。本例,

9941.0)6060/()]22(

)66()22()33()22()22()33()22()66()88(

)44()44()55()22()33[(1)()(1

33

333333333

3333333

NNttc jj

671.229941.0/5374.22 cH

2 , 60.1022,005.0 ,得出 005.0P 。按 05.0 检验水准,拒绝 0H 。可以认

为, 不同菌种对小鼠巨噬细胞的吞噬指数的作用不同

Page 43: 第十章 基于秩次的非参数检验

二、多组有序变量资料的秩和检验

例 10-6 四种疾病患者痰液内嗜酸性粒细胞的检查结果见表 10-6 。问四种疾病患者痰液内嗜酸性粒细胞的等级分布有无差别?

Page 44: 第十章 基于秩次的非参数检验

表 10-6 四种疾病患者痰液内嗜酸性粒细胞等级比较

例 数 秩 和 白细胞等级 支气管

扩张 肺水肿 肺癌 病毒性呼吸道感染

合计 秩次范围

平均秩次 支气管

扩张 肺水肿 肺癌 病毒性呼吸道感染

(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) - 0 3 5 3 11 1~11 6 0 18 30 18 + 2 5 7 5 19 12~30 21 42 105 147 105

++ 9 5 3 3 20 31~50 40.5 364.5 202.5 121.5 121.5 +++ 6 2 2 0 10 51~60 55.5 333 111 111 0

合计 17 15 17 11 60 — — 739.5 436.5 409.5 244.5

Page 45: 第十章 基于秩次的非参数检验

1.检验假设

H0:四种疾病患者痰液内嗜酸性粒细胞总体分布相同

H1:四种疾病患者痰液内嗜酸性粒细胞总体分布不同或不全相同。

α =0.05

2.编秩 与两样本比较类似,混合编秩。先计算各等级的合计,再确定秩

次范围及平均秩次,见表第(6)、(7)和(8)栏。

3.求秩和 与样本比较类似,结果见表第(9)、(10)、(11)和(12)栏。

4.计算检验统计量 H

Page 46: 第十章 基于秩次的非参数检验

28.14)160(3)11

5.244

17

5.409

15

5.436

17

5.739(

)160(60

12

)1(3)1(

12

2222

2

Nn

R

NNH

i

i

由 于 相 持 较 多 , 故 需 校 正 。

92.0)6060/()]1010()2020()1919()1111[(1

)/()(133333

33

NNttc jj

52.1592.0/28.14/ cHH c

3 . 确 定 P 值 , 做 出 推 断 结 论

已知H0成立时,Hc近似服从=k-1=3的2分布。据Hc=15.52查2界值表,得P<0.005。按=0.05检验水准,拒绝H0。可以认为, 不同疾病患者痰液内的嗜酸性粒细胞分布的差别有统计学意义。

Page 47: 第十章 基于秩次的非参数检验

第四节 随机化区组设计资料的秩和检验

Page 48: 第十章 基于秩次的非参数检验

例 10-7 欲用学生的综合评分来评价四种教学方式的不同,按照年龄、性别、年级、社会经济地位、学习动机相同和智力水平、学习情况相近作为配伍条件,将 4 名学生分为一组,共 8 组,每区组的 4 名学生随机分到四种不同的教学实验组,经过相同的一段时间后,测得学习成绩的综合评分,试比较四种教学方式对学生学习成绩的综合评分影响有无不同?

Page 49: 第十章 基于秩次的非参数检验

表10-7 不同区组4种教学方式对学生学习综合评分比较 教学方式A 教学方式B 教学方式C 教学方式D 区组编号 综合评分 秩 综合评分 秩 综合评分 秩 综合评分 秩

1 8.4 1 9.6 2 9.8 3 11.7 4 2 11.6 1 12.7 4 11.8 2 12.0 3 3 9.4 2 9.1 1 10.4 4 9.8 3 4 9.8 2 8.7 1 9.9 3 12.0 4 5 8.3 2 8.0 1 8.6 3.5 8.6 3.5 6 8.6 1 9.8 3 9.6 2 10.6 4 7 8.9 1 9.0 2 10.6 3 11.4 4 8 8.3 2 8.2 1 8.5 3 10.8 4

jR 12 15 23.5 29.5

本例属随机化区组设计,观察指标为连续型变量资料,各实验组(不同教学方式组)来自非正态总体,不宜做随机化区组设计方差分析。

Page 50: 第十章 基于秩次的非参数检验

1 . 假 设 0H : 三 个 总 体 分 布 相 同

1H : 三 个 总 体 分 布 不 同 或 不 全 相 同

05.0

2 . 编 秩 先 将 各 区 组 内 数 据 由 小 到 大 编 秩 , 遇 相 同 数 值 取 平 均 秩 次 。 再 将

各 处 理 组 的 秩 次 相 加 , 得 到 各 处 理 组 秩 和 jR 。

3 . 计 算 统 计 量 M 值

2)( RRM j ( 1 0 - 9 )

式 中 , kRR j / , k 为 处 理 组 数 。 本 例 ,

204

5.295.231512

R

5.191)205.29()205.23()2015()2012( 2222 M

Page 51: 第十章 基于秩次的非参数检验

4. 确 定 P 值 并 做 出 推 断 结 论

( 1) 查 表 法 ( 当 15b , 15k 时 ) 查 本 书 附 录 中 的 M 界 值 表 。

本 例 , 区 组 数 8b , 处 理 数 4k , 查 附 表 得 M 0 . 0 5 = 1 0 5 ; M = 1 9 1 . 5 > 1 0 5,

P < 0 . 0 5 ; 按 = 0 . 0 5 检 验 水 准 , 拒 绝 H 0。 可 以 认 为 不 同 教 学 方 式 对 不 同 学 生 的 学

习 综 合 评 分 的 影 响 有 统 计 学 意 义 。

( 2) 2 分 布 近 似 法

当 处 理 数 k 或 区 组 数 b 超 出 M 界 值 表 的 范 围 时 , 可 以 采 用 近 似 2 分 布 法 。

jR 为 第 j 处 理 组 的 秩 和 , 故 总 秩 和 为

2

)1(

1

kbkR

k

jj ( 1 0 - 1 0)

Page 52: 第十章 基于秩次的非参数检验

当 0H 成 立 时 , 第 j 列 秩 和 的 期 望 与 方 差 分 别 为 :

2

)1(

kbjR ( 1 0 - 1 1 )

12

)1( 22

kb

jR ( 1 0 - 1 2 )

大 样 本 时 , 统 计 量

2

j

j

R

Rj

j

RZ

( 1 0 - 1 3 )

近 似 地 服 从 标 准 正 态 分 布 ; 但 k 个 jZ 的 加 权 和 2r 服 从 自 由 度 为 ( 1k ) 的 2 分

布 ,

k

j

jj

k

jr kkb

kbRZ

k

k

1

22

1

2

12/)1(

]2/)1([)

1( ( 1 0 - 1 4 )

Page 53: 第十章 基于秩次的非参数检验

不难导出其简化计算式为

)1(3)1(

12

1

22

kbRkbk

k

jjr (10-15)

现以例10-7说明其计算步骤, 8b , 4k , 121 R , 5.233 R , 5.294 R

36.14)14(83)5.295.231512()14(48

12 22222

r

以 314 查 2 界值表, 34.1123,01.0 , 01.0001.0 P ;按 =0.05检验水

准,拒绝 H0。可以认为不同教学方式对学生的学习综合评分的影响有统计学意

义。

当各区组间相持较多时,需用式(10-16)进行校正。

cc

22

(10-16)

式中, )1()(1 23 kbkttc jj ,tj为第 j(j=1,2…)次相持所含相同秩次的个数。

1c ,故校正的 22 c ,对应的P值减小。 2c 在 ①下列情况下意义较大: 相

②持数据的个数在各区组中所占比重较大时; 所得P值在检验水准附近时