17
主主 主主主

中医药统计学

  • Upload
    faolan

  • View
    43

  • Download
    0

Embed Size (px)

DESCRIPTION

新世纪全国高等中医药院校规划教材. 中医药统计学. 主编 周仁郁. 8 调查设计. 8.1 调查设计的全过程. 8.1.1 调查设计的目的与方法. 不加任何干预措施 , 客观描述研究总体的统计设计 , 称为调查设计. 调查设计包括确定方案 , 组织调查 , 整理分析全过程. 调查方法可分为普查 , 抽样调查 , 典型调查 3 种. 设计方案. 确定目的及 调查对象. 定抽样方法 及样本容量. 定调查项目 及观测指标. 组织调查. 确定调查方 式及调查表. 宣传目的及培训调查员. 实施调查及 抽样复查. 整理分析. - PowerPoint PPT Presentation

Citation preview

Page 1: 中医药统计学

主编 周仁郁

Page 2: 中医药统计学

8.1 调查设计的全过程 8.1.1 调查设计的目的与方法 不加任何干预措施 , 客观描述研究总体的统计设计, 称为调查设计

调查设计包括确定方案 , 组织调查 , 整理分析全过程 调查方法可分为普查 , 抽样调查 , 典型调查 3 种

Page 3: 中医药统计学

定抽样方法及样本容量

设计方案 确定目的及调查对象

定调查项目及观测指标

组织调查 确定调查方式及调查表

宣传目的及培训调查员

实施调查及抽样复查

整理分析 数据录入汇总及复查

计算得统计及专业结论

普查称全面调查:就是对总体进行调查。普查一般用于了解总体在某一特定时点上的情况

抽样调查:从总体中抽取一定数量观察单位组成样本,然后根据样本信息来推断总体特征

典型调查:称案例调查。在对事物进行全面分析的基础上,选择典型的人或单位进行调查

Page 4: 中医药统计学

8.1.2 随机与系统抽样抽样调查的方法有单纯随机抽样、系统抽样、整群抽

样、分层抽样

单纯随机抽样,是把调查总体的全部观察单位进行编号,再用随机数表或抽签等方法随机抽取部分观察单位组成样本。总体例数为 N ,样本例数为 n ,样本均数及样本率的标准误分别为

n

S

N

nSX

2

1

1

ˆ1ˆ1ˆ

n

pp

N

nS p

Page 5: 中医药统计学

随机抽样时,样本容量估计使用 6.1 的方法,但要用有限总体公式进行校正。总体均数、总体率的样本容量估计校正式分别为

Nn

nnC /1

Nn

nnC /)1(1

整群抽样≥随机抽样≥系统抽样≥分层抽样

系统抽样又称为机械抽样或等距抽样,是把总体观察单位按一定顺序分为 n 个部分,从第一个部分随机抽取第 k 位次的观察单位,再从每一部分中抽取相同位次的观察单位,由这些观察单位组成样本

Page 6: 中医药统计学

例 1 某校 3000 学生用随机数表抽取 100 人,若乙肝表面抗原阳性样本率 10% ,求总体率 95% 置信区间 把全校学生编为 0 、 1 、…、 2999 号,查统计用表23 ,任意指定某行某列,以 4 个数字为一组,除以 3000 取余数为抽取的编号,后面出现与前面有相同的数字者弃去。如从第 9 行第 5 列顺序取 100 组数 1234 2978 6456 0782 5242 0744 3815 5100 1342 9966…

除以 3000 取余,随机抽样编号为1234 2978 0456 0782 2242 0744 0815 2100 1342 0966…

N = 3000 , n=100 为大样本,样本率 p=0.1 ,标准误为

Page 7: 中医药统计学

0296.099/9.01.0)3000/1001(ˆ pS

故总体率的 95% 置信区间为

pSup ˆ2/05.0ˆ = 0.1±1.96×0.0296 = (0.0419 , 0.1581) 例 2 欲调查某社区贫血患病情况,该社区有居民 10

00 人,试按系统抽样方法,抽取例数为 100 的样本

先将 1000 名居民按某一特征的顺序编号,总体例数N = 1000 ,样本例数 n = 100 ,抽样间隔 1000/100= 10 ,在 1~ 10 之间随机确定一个数字,比如 7 ,每间隔 10 个观察单位取一个,抽取 7 , 17 , 27 ,…, 997 组成样本

Page 8: 中医药统计学

8.1.3 整群与分层抽样整群抽样是把总体 N 个观察单位分为 K 个“群”,

每个群包含若干观察单位,随机抽取 k 个“群”,用这些群中的全部观察对象组成样本。整群抽样样本均数及其标准误分别为

iXNk

KX

k

iiX TT

kkK

k

N

KS

1

2)()1(

11

∑X 为各群观察单位之和, Ti 为第 i 群内观察值之和整群抽样时,样本率及其标准误分别为

Page 9: 中医药统计学

iaNk

Kp ˆ

k

iip aa

kkK

k

N

KS

1

2ˆ )(

1

11

其中,∑ ai 为各群阳性数之和

分层抽样又称分类抽样,是把总体按影响观察值变异较大的某种特征分为若干类型或组别,称为层,再从每一层随机抽取一定数量的观察单位合起来组成样本

分层设计时,先确定总样本容量 n ,再用按比例或最优法确定第 i 层样本容量 n

按比例分配,是由总体第 i 层的观察单位数 Ni 占总体所有观察单位数的比例 Ni/N 决定样本各层的容量 n

i

Page 10: 中医药统计学

N

nNn ii

最优分配,是由总体第 j 层观察单位数 Nj 和标准差的大小决定样本各层的容量 nj ,均数抽样和率抽样的公式分别为

ii

jjj N

Nnn

)1(

)1(

iii

jjj

jppN

ppNnn

分层抽样中,样本均数及其标准误分别为

N

XNX ii

N

SNNnS iXiii

X

22)/1(

Page 11: 中医药统计学

分层抽样中,样本率及其标准误分别为

N

pNp ii ˆˆ

N

SNNnS ipiii

p

2

ˆ

)/1(

例 3 在某校 40 个班 3000 学生中,随机抽查 4 个班,学生人数分别为 60 、 80 、 90 、 120 人,用锡克试验检查白喉易感情况,查得阳性人数分别为 12 、11 、 15 、 17 ,试以 α = 0.05 水准估计该校学生锡克试验阳性率 这是整群抽样, N = 3000 , K = 40 、 k = 4 、 a1

= 12 、 a2 = 11 、 a3 = 15 、 a4 = 17

a- = (12 + 11 + 15 + 17)/4 = 55/4 = 13.75

Page 12: 中医药统计学

= (12 - 13.75)2 + (11 - 13.75)2 + (15 - 13.75)2

2aai + (17 - 13.75)2 = 22.75

总体率 95% 的置信区间为

1833.05543000

40ˆ

p

0174.075.22)14(4

1

40

41

3000

40ˆ

pS

0.1833±1.96×0.0174 = (0.1492 , 0.2174)

例 4 某地 0 ~ 19 岁人群共 14 万人,欲调查其 HbsAg

Page 13: 中医药统计学

阳性率,已知各年龄组分组、人数及既往阳性率,若确定样本例数为 1000 人,试分别按比例分配和最优分配确定各年龄组的调查人数 这是分层抽样,按年龄组分为四层 按比例分配时, N = 140000 , N1 = 25000 、 N2 =31000, N3 = 38000 、 N4 = 46000

n1 = 1000×25000/140000 = 178.57

n2 = 221.43 , n3 = 271.43 , n4 = 328.57

最优分配时,以既往阳性率为各层总体率 pj 的估计值由 p1 = 0.03 、 p2 = 0.08 、 p3 = 0.10 、 p4 = 0.11 ,计算得

Page 14: 中医药统计学

)1( 111 ppN 6805.4264)03.01(03.025000

0892.8410)1( 222 ppN

0000.11400)1( 333 ppN

9288.14392)1( 444 ppN

)1( iii ppN =4264.68+8410.09+11400.00+14392.93=38467.6985

n1 = 1000×4264.6805/38467.6985 = 110.8639

n2 = 218.6273 , n3 = 296.3525 , n4 = 374.1562

Page 15: 中医药统计学

年龄组 人数 Nj比例分配 n

j

最 优 分 配

既往阳性率 pj nj

0 ~ 25000 179 0.03 4264.68 111

5 ~ 31000 221 0.08 8410.09 219

10 ~ 38000 271 0.10 11400.00 296

15 ~ 19

46000 329 0.11 14392.93 374

合计 140000 1000 38467.70 1000

)1( jjj ppN

8.1.4 调查误差的控制在设计阶段常见的非抽样误差及控制方法有下面 6 种

Page 16: 中医药统计学

⑴ 正确划分调查范围

⑵ 正确选择调查指标

⑶ 明确定义调查项目

⑷ 正确设置调查问题

⑸ 选择恰当的调查方式

⑹ 预调查

在调查阶段,常见非抽样误差及控制方法有下面 2 种

⑴ 调查人员的工作态度不好,专业知识欠缺,业务水平不足

Page 17: 中医药统计学

⑵ 被调查者不能很好配合,因故不在,故意躲避、拒查、有意隐瞒事情真相,记忆不清

在整理与分析阶段,非抽样误差主要源于计算机数据录入、汇总、计算等方面的错误,在条件许可时应当使用机读卡

调查质量一般使用效度与信度两个指标进行评价,应做到效度与信度的统一。效度是调查工具对调查对象测量的有效程度或准确程度,反映调查的真实性。信度是调查工具对调查对象测量的可靠程度,反映调查的稳定性或一致性。