28
(analysis of variance, ANOVA)

方 差 分 析 (analysis of variance, ANOVA)

  • Upload
    emele

  • View
    73

  • Download
    10

Embed Size (px)

DESCRIPTION

方 差 分 析 (analysis of variance, ANOVA). 八. 宝丹. 生肌散. 油纱条. 空白对照. 0.839. 0.799. 0.443. 0.430. 0.745. 0.698. 0.414. 0.332. 0.604. 0.554. 0.502. 0.436. 0.851. 0.823. 0.613. 0.382. 0.973. 0.944. 0.402. 0.457. 0.636. 0.595. 0.343. 0.593. 0.656.  X. 0.75688. - PowerPoint PPT Presentation

Citation preview

Page 1: 方    差    分    析 (analysis of variance, ANOVA)

方 差 分 析(analysis of variance, ANOV

A)

方 差 分 析(analysis of variance, ANOV

A)

Page 2: 方    差    分    析 (analysis of variance, ANOVA)

表 1 外用中药对大白鼠肉芽组织增长的比较( g )

八宝丹 生肌散 油纱条 空白对照

0.839 0.799 0.443 0.430

0.745 0.698 0.414 0.332

0.604 0.554 0.502 0.436

0.851 0.823 0.613 0.382

0.973 0.944 0.402 0.457

0.636 0.595 0.343

0.593 0.656

0.814

0.75688

0.72414

0.45283

0.4074

X

Page 3: 方    差    分    析 (analysis of variance, ANOVA)

表 9-3 三组 50-59 岁男性的空腹血糖测定结果( 9mmol/L )

正常组( x1j

) 冠心病组( x2j ) 脂肪肝组( x3j

)4.75 6.26 5.78

4.75 4.36 6.68

4.77 5.24 5.44

4.61 4.67 5.86

4.49 4.55 5.67

4.02 5.18 5.24

5.03 4.61 5.42

4.57 5.12 5.14

4.21 5.26 6.09

4.88 4.83 5.74

4.62 5.59 5.72

xi 4.61 5.06 5.71

Page 4: 方    差    分    析 (analysis of variance, ANOVA)

方差分析的基本思想各组的样本均数不同、各组与总的均数不同差异来源: 个体变异所致的抽样误差的影响 可能的处理因素或影响因素的作用同时总的变异又可分解为两部分: 各组内的变异、各组间的变异

2 2 2

( ) ( )

( ) ( ) ( )

ij ij i i

ij ij i i

x x x x x x

x x x x x x

Page 5: 方    差    分    析 (analysis of variance, ANOVA)

方差分析的基本思想

SS 总= SS 组内+ SS 组间

ν 总 =N-1 ν 组间 =k-1 ν 组内 =ν 总 - ν 组间

比较: SS 组间 /ν 组间 与 SS 组内 /ν 组内

即可知处理因素是否有作用

Page 6: 方    差    分    析 (analysis of variance, ANOVA)

单因素方差分析SS 总 = SS 组间 + SS 组内

总 = 组间 + 组内

总 = N-1 组间 =k-1 组内 =N - k

组内

组间

2

2 2

2

2 2

2

( )

SS = ( ) =

( )

SS = ( ) =

SS ( )

iji j

ij iji j i j

ijj

ij i iji j i j i i

i ii

x

x x xN

x

x x xn

n x x

Page 7: 方    差    分    析 (analysis of variance, ANOVA)

单因素方差分析表

变异来源 SS MS F P

总 N-1

组间 K-1SS 组间 / 组

MS 组间 /MS组内

组内 ( 误差 )

SS 总 -SS组间

N-kSS 组内 / 组

2ij

i j

x C

2( )ijj

i i

x

Cn

Page 8: 方    差    分    析 (analysis of variance, ANOVA)

方差分析的基本思想

把总的离均差平方和 ( 即总变异 ) 分解为至少两个部分,其自由度也分解为相应几个部分,其中至少有一部分表示 ( 处理 ) 因素的效应,有一部分表示抽样误差的影响,然后比较两者的均方,计算 F 值,若 F 值远大于 1 ,可认为各组均数间差别有统计学意义,处理有效应,若 F 值接近甚至小于 1 ,表示差别无统计学意义,处理组间效应相同 ( 差异仅仅由抽样原因所致 ) 。

把总的离均差平方和 ( 即总变异 ) 分解为至少两个部分,其自由度也分解为相应几个部分,其中至少有一部分表示 ( 处理 ) 因素的效应,有一部分表示抽样误差的影响,然后比较两者的均方,计算 F 值,若 F 值远大于 1 ,可认为各组均数间差别有统计学意义,处理有效应,若 F 值接近甚至小于 1 ,表示差别无统计学意义,处理组间效应相同 ( 差异仅仅由抽样原因所致 ) 。

Page 9: 方    差    分    析 (analysis of variance, ANOVA)

方差分析应用条件

1 、各样本来自正态或接近正态的总体

2 、各样本为相互独立的随机样本

3 、各样本所来自的总体方差相等

Page 10: 方    差    分    析 (analysis of variance, ANOVA)

单因素方差分析

也称完全随机设计的方差分析

Page 11: 方    差    分    析 (analysis of variance, ANOVA)

例 9.7 随机抽取 50-59 岁男性正常者、冠心病人、脂肪肝患者 11 人,测定空腹血糖值见表 9-3 ,试推断三类人群总体均值是否相同。

Page 12: 方    差    分    析 (analysis of variance, ANOVA)

假设检验的步骤

建立假设、确定检验水准: H0 : 1 = 2 = 3 ,即三类人群总体均值相同 H1 : 1 、 2 、 3 不等或不全相等,即三类人群总体均值不同或不全相同 =0.05选定检验方法和计算检验统计量: F= MS 组间 /MS 组内

Page 13: 方    差    分    析 (analysis of variance, ANOVA)

表 9-3 三组 50-59 岁男性的空腹血糖测定结果( 9mmol/L )

正常组( x1j

)冠心病组( x2j

)脂肪肝组( x3j

)4.75 6.26 5.78

4.75 4.36 6.68

4.77 5.24 5.44

4.61 4.67 5.86

4.49 4.55 5.67

4.02 5.18 5.24

5.03 4.61 5.42

4.57 5.12 5.14

4.21 5.26 6.09

4.88 4.83 5.74

4.62 5.59 5.72

50.70 55.67 62.78 169.15

ni 11 11 11 33 ( N )

xij 4.61 5.06 5.715.13 (x )

234.52 284.71 360.12 879.35

ijj

x

2ij

j

x 2ij

i j

x

iji j

x

Page 14: 方    差    分    析 (analysis of variance, ANOVA)

假设检验的步骤

确定概率 P 值、做出推断结论: 根据组间、组内的自由度,查 F 界值表 P17

9 附表 9-2 ,得 P<0.05 ,按 =0.05 的检验水准,拒绝 H0 ,接受 H1 ,差异有统计学意义,可认为三类人群总体均值不同或不全相同

表 9.5 例 9.7 的方差分析表变异来源 SS v MS F P

组间 6.7 2 3.35 17.63<0.01

组内 5.63 30 0.19

总 12.33

32

Page 15: 方    差    分    析 (analysis of variance, ANOVA)

经方差分析后各组均数间的差别有统计学意义时,只说明几个组的总体均数不同或不全相同。若要进一步了解哪两个组间的总体均数不同,应进行多个样本均数间的两两比较又称多重比较 (multiple comparison) 。

多个样本均数间的两两比较不能直接用两均数比较的 t 检验,因其会增加Ⅰ类错误的概率α。

Page 16: 方    差    分    析 (analysis of variance, ANOVA)

如有 4个样本均数,两两组合数为 6,若用 t 检验作 6 次比较,且每次比较的检验水准为 0.05 ,则每次比较不犯Ⅰ类错误的概率为(1-0.05)=0.95,6 次均不犯Ⅰ类错误的概率为0.956 ,这时总的检验水准为 1-0.956=0.26,比 0.05 大多了,因此多重比较不能用两样本均数比较的 t 检验

Page 17: 方    差    分    析 (analysis of variance, ANOVA)

多个样本均数间两两比较的方法有:

SNK-q 检验(适用于任意两组间的两两比较)

LSD-t 检验(适用于一对或几对临床上有特殊意义的两组间比较)

Dunnett-t 检验(适用于多个实验组与一个对照组的两组间比较)

Page 18: 方    差    分    析 (analysis of variance, ANOVA)

多个样本均数间两两比较的 SNK-q 检验

排序、编秩次、计算 q 值:

误差

误差

A B

1 1+( )

n n2

A B

A B

A B

x x

x x

x xq

S

MSS

查 q 界值表 P180 附表 9-3

Page 19: 方    差    分    析 (analysis of variance, ANOVA)

例 9.7 拒绝了 H0 ,进一步作各均数间的两两比较建立假设、确定检验水准: H0 : A = B

H1 : A B = 0.05选定检验方法和计算检验统计量:均数 5.71 5.06 4.61

秩次 1 2 3

组别 脂肪肝组 冠心病组 正常组

Page 20: 方    差    分    析 (analysis of variance, ANOVA)

因 MS 误差 =MS 组内 =0.19 , ni=11 ,故

1 与 3 、 1 与 2 、 2 与 3 组比较的 q 值分别为

0.190.13

2A Bx xS 1 1

( + )11 11

1 3

5.71 4.618.46

0.13q

q1-2=5.00 q2-3=3.46

Page 21: 方    差    分    析 (analysis of variance, ANOVA)

三个样本均数的两两比较表表 9-6 三个样本均数两两比较的 q值

对比组 两均数之差 标准误 q 值 组数 q界值P

A 与 B xA - xB SxA - xB (2)/(3) a0.05

0.01

( 1 ) ( 2 ) ( 3 ) (4) (5) (6) (7) (8)

1 与 3 1.10 0.13 8.46 33.49

4.45 <0.01

1 与 2 0.65 0.13 5.00 22.89

3.89 <0.01

2 与 3 0.45 0.13 3.46 22.89

3.89 <0.05

Page 22: 方    差    分    析 (analysis of variance, ANOVA)

确定概率 P 值、做出推断结论: 根据误差自由度及组数查 q界值表得 P 值见表 9-6,按 =0.05 的检验水准, P 均 < 0.05 ,三组都是拒绝 H0 ,接受 H1 ,三组均数差别均有统计学意义,可认为脂肪肝组和冠心病组的血糖均值均高于正常组,脂肪肝组的血糖均值高于冠心病组

确定概率 P 值、做出推断结论: 根据误差自由度及组数查 q界值表得 P 值见表 9-6,按 =0.05 的检验水准, P 均 < 0.05 ,三组都是拒绝 H0 ,接受 H1 ,三组均数差别均有统计学意义,可认为脂肪肝组和冠心病组的血糖均值均高于正常组,脂肪肝组的血糖均值高于冠心病组

Page 23: 方    差    分    析 (analysis of variance, ANOVA)

选择题:1 、当组数等于 2 时,对于同一资料,方差分析结果与 t 检验结果() A. 完全等价且 t=F2 B. 方差分析结果更准确 C.t 检验结果更准确 D. 完全等价且 F = t2

2 、方差分析结果, F 处理 >F0.05 ( 1 , 2 ) ,则统计结论为() A. 各样本均数间差别都有显著性 B. 各总体均数都不相等 C. 各样本均数都不相等 D. 各总体均数不全相等

选择题:1 、当组数等于 2 时,对于同一资料,方差分析结果与 t 检验结果() A. 完全等价且 t=F2 B. 方差分析结果更准确 C.t 检验结果更准确 D. 完全等价且 F = t2

2 、方差分析结果, F 处理 >F0.05 ( 1 , 2 ) ,则统计结论为() A. 各样本均数间差别都有显著性 B. 各总体均数都不相等 C. 各样本均数都不相等 D. 各总体均数不全相等

Page 24: 方    差    分    析 (analysis of variance, ANOVA)

SPSS 的应用:方差分析:analyze→compare means→one-way anova →dependent list:分析变量分析变量 →factor:分组变量分组变量 →post hoc…: 选择多重比较的方法选择多重比较的方法→ok

SPSS 的应用:方差分析:analyze→compare means→one-way anova →dependent list:分析变量分析变量 →factor:分组变量分组变量 →post hoc…: 选择多重比较的方法选择多重比较的方法→ok

Page 25: 方    差    分    析 (analysis of variance, ANOVA)

SPSS 的应用:t 检验:样本均数与总体均数的比较analyze→compare means→one-sample t test →test variable:分析变量分析变量 →test value:总体均数的值总体均数的值→ok

SPSS 的应用:t 检验:样本均数与总体均数的比较analyze→compare means→one-sample t test →test variable:分析变量分析变量 →test value:总体均数的值总体均数的值→ok

Page 26: 方    差    分    析 (analysis of variance, ANOVA)

SPSS 的应用:t 检验:配对 t 检验analyze→compare means→paried-samples t test →paried variables: 配对的两个变量配对的两个变量→ok

SPSS 的应用:t 检验:配对 t 检验analyze→compare means→paried-samples t test →paried variables: 配对的两个变量配对的两个变量→ok

Page 27: 方    差    分    析 (analysis of variance, ANOVA)

SPSS 的应用:t 检验:两样本均数的比较analyze→compare means→independent-samples t test →test variable:分析变量分析变量 →grouping variable:分组变量分组变量 →define groups: 分组变量的值分组变量的值→ok

SPSS 的应用:t 检验:两样本均数的比较analyze→compare means→independent-samples t test →test variable:分析变量分析变量 →grouping variable:分组变量分组变量 →define groups: 分组变量的值分组变量的值→ok

Page 28: 方    差    分    析 (analysis of variance, ANOVA)

作业: P511 第 5题作业: P511 第 5题