Upload
afi
View
158
Download
4
Embed Size (px)
DESCRIPTION
第七章 计数资料的假设检验. 某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?. 两个率 P 1 ( 14% ) , P 2 ( 25% )不同。. 总体率的 假设 检验. 当两个样本率不同时 , 有两种可能 : ▲ P 1 , P 2 所代表的总体率相同 , 由于抽样误差的存在 , 造成了样本率不同 , 这种差别在统计上叫 差别无统计学意义 。 ▲ P 1 , P 2 所代表的总体率不同 , 即两个样本来不同的总体 , 其差别有统计学意义 。 用统计学方法进行判断属于那种情况。(反证法). x 2 检验. 是一种假设检验的方法 - PowerPoint PPT Presentation
Citation preview
1
第七章 计数资料的假设检验
2
某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?
组 别 发 病 人 数 未 发 病人数 观察例数 发病率(%)实 验 组 14 86 100 14
对 照 组 30 90 120 25
合计 44 176 220 20
两个率 P1 ( 14% ) , P2 ( 25% )不同。
总体率的假设检验
当两个样本率不同时 , 有两种可能 :▲ P1 , P2 所代表的总体率相同 , 由于抽样误差的存
在 , 造成了样本率不同 , 这种差别在统计上叫差别无统计学意义。
▲ P1 , P2 所代表的总体率不同 , 即两个样本来不同的总体 , 其差别有统计学意义。
用统计学方法进行判断属于那种情况。(反证法)
4
x2 检验
是一种假设检验的方法符合假设检验的规律统计量(率或比)服从 x2 分布
5
某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?
组 别 发 病 人 数 未 发 病人数 观察例数 发病率(%)实 验 组 14 86 100 14
对 照 组 30 90 120 25
合计 44 176 220 20
1 4 8 6 3 0 9 0
A :观察例数
T :理论频数
6
x2 检验的基本公式
x2 = ( A-T ) 2/T▲ A :表示实际频数,即实际观察到的例数。▲ T :理论频数,即如果假设检验成立,应该观察
到的例数。▲ :求和符号,所有格子的值之和▲ 自由度: = ( R-1 ) x ( C-1 ) R 行数, C 列数 注意:是格子数,而不是例数。
7
如果假设检验成立, A 与 T 不应该相差太大。理论上可以证明 ( A-T ) 2/T 服从 x2 分布,计
算出 x2 值后,查表判断这么大的 x2 是否为小概率事件,以判断建设检验是否成立。
8
x2 分布规律
自由度一定时, P 值越小, x2 值越大,反比关系。当 P 值一定时,自由度越大, x2 越大。 =1 时, P=0.05 , x2 =3.84 P=0.01 , x2 =6.63 P=0.05 时, =1 , x2 =3.84 =2 , x2 =5.99
1 、四格表资料的 x2 检验
什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料。
组 别 发 病 人 数 未 发 病人数 观察例数 发病率(%)实 验 组 14 86 100 14
对 照 组 30 90 120 25
合计 44 176 220 20
1 4 8 63 0 9 0
某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效?
10
组 别 阳 性 阴 性 合计1 a b a+b2 c d c+d合计 a+c b+d a+b+c+d
四格表的一般形式
理论频数 T 计算公式为: TRC=NRxNC/N
NR :所在的行合计, NC :所在的列合计
四格表资料的专用公式
x2 =(ad-bc)2 xN/(a+b)(c+d)(a+c)(b+d)
该公式从基本公式推导而来,结果相同;计算较为简单。
适用条件:N>40 且T 5当不满足时用校正公式。x2 = ( |A-T|-0.5 ) 2/T或x2 =(|ad-bc|-n/2)2 xN(a+b)(c+d)(a+c)(b+d)
12
SPSS 计算程序
1.ANALYZE-DESCRIPTIVE STATISTICS-CROSSTABS
2.data-weight cases-frequency variable-ok
Chi-Square Tests
4.125b 1 .042
3.466 1 .063
4.224 1 .040
.044 .030
4.106 1 .043
220
Pearson Chi-Square
Continuity Correctiona
Likelihood Ratio
Fisher's Exact Test
Linear-by-LinearAssociation
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)Exact Sig.(2-sided)
Exact Sig.(1-sided)
Computed only for a 2x2 tablea.
0 cells (.0%) have expected count less than 5. The minimum expected count is 20.00.
b.
×é±ð * ½á¹û Crosstabulation
Count
14 86 100
30 90 120
44 176 220
ʵÑé×é
¶ÔÕÕ×é
×é±ð
Total
+ _
½á¹û
Total
14
例 题
上例:问此药是否有效。 第一步:建立假设 H0 : 1=2 =20%
H1 : 1 ‡ 2
第二步:确定显著性水平 =0.05 (x2 =3.84) 第三步:计算统计量: n =220>40 ,每格的 T 值大于 5 , x2 =4.125 第四步:确定 P 值 第五步:判断结果
15
2 、配对(列联表)资料的 2 检验
有 93 份咽喉涂抹标本,每份标本分别接种在甲乙两种培养基上,观察其生长情况,结果如下表,两种培养基的效果是否不同?
甲乙两种培养基的生长情况
乙培养法甲培养法
合计阳性 阴性
阳性 37 10 47
阴性 19 27 46
合计 56 37 93
16
SPSS 计算程序
1.data-weight cases 2.ANALYZE-nonparametric test-2 related s
amples-test pairs-Mcnemar-OK
¼×ÅàÑø»ù & ÒÒÅàÑø»ù
37 10
19 27
¼×ÅàÑø»ù1
2
1 2
ÒÒÅàÑø»ù
Test Statisticsb
93
2.207
.137
N
Chi-Squarea
Asymp. Sig.
¼×ÅàÑø»ù & ÒÒÅàÑø»ù
Continuity Correcteda.
McNemar Testb. =0.05, x2 =3.84
例:问两种培养基的效果是否不同第一步:建立假设 H0 : B=C=b+c/2 H1 : B‡C
第二步:确定显著性水平 =0.05第三步:计算统计量 : b+c>40 时,基本公式: x2 = ( A-T ) 2/T , 专用公式: x2 = ( b-c ) 2/ b+c b+c40 时, 校正公式: x2 = ( |A-T|-0.5 ) 2/T x2 = ( lb-cl-1 ) 2/ b+c自由度: = ( 2-1 ) x ( 2-1 ) =1第四步:确定 P 值第五步:判断结果
18
3 、行 x 列表的 x2 检验
四格表是指只有 2 行 2 列,当行数或列数超过 2 时,统称为行 x 列表。
行 x 列表的 x2 检验是对多个样本率(或构成比)的检验。 基本公式: x2 = ( A-T ) 2/T 专用公式: x2 =n x ( A2 /nR x nC
-1 ) 自由度: = ( R-1 ) x ( C-1 ) 适用条件:表中不宜有 1/5 以上格子的理论频数小于 5 ,
或有一个格子的理论频数小于 1 。
19
为了解花生黄曲霉素污染,随机观察了三个地区,结果见下表。试问这三个地区花生的黄曲霉素污染率是否不同?
三个地区花生的黄曲霉素污染情况
调查地区受检样品
合计 污染率(%)未污染 污染
甲 6 23 29 79.3
乙 30 14 44 31.8
丙 8 3 11 27.3
合计 44 40 84 47.6
20
µØÇø * ÊÇ·ñÊܵ½ÁË»ÆÇúù¶¾ËصÄÎÛȾ Crosstabulation
Count
6 23 29
30 14 44
8 3 11
44 40 84
1
2
3
µØÇø
Total
δÎÛȾ ÎÛȾÁË
ÊÇ·ñÊܵ½ÁË»ÆÇúù¶¾ËصÄÎÛȾ
Total
Chi-Square Tests
17.907a 2 .000
18.755 2 .000
14.315 1 .000
84
Pearson Chi-Square
Likelihood Ratio
Linear-by-LinearAssociation
N of Valid Cases
Value dfAsymp. Sig.
(2-sided)
0 cells (.0%) have expected count less than 5. Theminimum expected count is 5.24.
a.
=2, =0.05, x2 =5.99
21
主要内容(计数资料的统计分析)
一、相对数二、应用相对数的注意事项三、率的标准误四、率的可信区间五、 x2 检验:四格表,配对资料,行 × 列表
22
前半段课程 小 结
23
基本内容
统计描述 统计推断 (1) 统计推断 (2)计量资料 频数分布
集中趋势离散趋势
抽样误差标准误 t u F 检验秩和检验可信区间
直线相关与回归偏相关多元线性回归因子分析
计数资料 相对数(率、比)
率的标准误;可信区间;2 检验
Logistic 回归
24
思考:1. 均数与标准差适合用于什么资料的描述?2. 标准差和标准误有何区别和联系?3. 可信区间和参考(正常)值范围有何不同?4. 假设检验的基本思想是什么?步骤是什么?5. 计量资料假设检验的类型有哪些?6. 方差分析适用于什么样的设计?7. 相关与回归的区别与联系是什么?8. 相对数用于什么资料的描述?9. 计数资料的主要检验方法是什么?
25
分析计算
要求:
1. 选择合适的计算程序;
2. 在计算机上计算出结果;
3. 会看结果;
4. 完整的书写过程。
26
祝大家取得好成绩!
王晓莉