71
卫 卫 卫 卫卫卫 卫卫

第九章 诊断试验的研究与评价

  • Upload
    mala

  • View
    245

  • Download
    0

Embed Size (px)

DESCRIPTION

第九章 诊断试验的研究与评价. (the Studies and Evaluations on Diagnostic Test). 卫 生 系 黄民主 教授. 本章学习要点. 诊断试验研究与评价的设计 评价真实性的常用指标及其计算方法 可靠性的评价指标及影响可靠性的因素 评价收益的常用指标,预测值的计算方法 似然比的应用 提高诊断质量的方法 — 串联和并联. 诊断试验定义 应用一定的诊断方法把病人与可疑有病但实际无病的人区别开来。. - PowerPoint PPT Presentation

Citation preview

Page 1: 第九章 诊断试验的研究与评价

卫 生 系

黄民主 教授

Page 2: 第九章 诊断试验的研究与评价

本章学习要点本章学习要点诊断试验研究与评价的设计诊断试验研究与评价的设计

评价真实性的常用指标及其计算方法评价真实性的常用指标及其计算方法

可靠性的评价指标及影响可靠性的因素可靠性的评价指标及影响可靠性的因素

评价收益的常用指标,预测值的计算方法评价收益的常用指标,预测值的计算方法

似然比的应用似然比的应用

提高诊断质量的方法 — 串联和并联提高诊断质量的方法 — 串联和并联

Page 3: 第九章 诊断试验的研究与评价

诊断试验定义诊断试验定义

应用一定的诊断方法把病人与可疑应用一定的诊断方法把病人与可疑

有病但实际无病的人区别开来。有病但实际无病的人区别开来。

Page 4: 第九章 诊断试验的研究与评价

4

诊断试验不仅可用于疾病诊断,也可用于诊断试验不仅可用于疾病诊断,也可用于疾病的筛检以及治疗和随访的监测。诊断试验疾病的筛检以及治疗和随访的监测。诊断试验与筛检试验与筛检试验 ((screening testscreening test)) 有一定区别,有一定区别,筛检试验是用快速简洁的试验或其它方法,从筛检试验是用快速简洁的试验或其它方法,从表面健康的人群中查出某病可疑患者的试验方表面健康的人群中查出某病可疑患者的试验方法,其目的是将可疑有病而实际无病的人与病法,其目的是将可疑有病而实际无病的人与病人区别开来,筛检试验并不等同于确诊试验,人区别开来,筛检试验并不等同于确诊试验,仅作为初步检查,是早期发现病人的一种方法。仅作为初步检查,是早期发现病人的一种方法。筛检试验的结果要经过诊断试验加以确诊,筛筛检试验的结果要经过诊断试验加以确诊,筛检试验主要用于社区人群的健康体检、普查、检试验主要用于社区人群的健康体检、普查、普治或某些特殊意义的研究。 普治或某些特殊意义的研究。

Page 5: 第九章 诊断试验的研究与评价

诊断试验评价的主要内容诊断试验评价的主要内容 是否选用了适宜的金标准作比较?选择的研究对象是否合理?样本量是否足够?是否使用了盲法收集试验结果?同时应评价诊断试验的真实性、可靠性和收益。

Page 6: 第九章 诊断试验的研究与评价

6

诊断试验研究与评价的主要内容包括:诊断试验研究与评价的主要内容包括: ※※ 选择适宜的金标准作比较;选择适宜的金标准作比较; ※※ 选择适合数量的研究对象;选择适合数量的研究对象; ※※ 盲法收集试验结果资料;盲法收集试验结果资料; ※※ 评价分析诊断试验的真实性、可靠性 评价分析诊断试验的真实性、可靠性 和收益;和收益; ※※ 掌握诊断试验评价的原则等掌握诊断试验评价的原则等 . .

Page 7: 第九章 诊断试验的研究与评价

7

主要评价指标包括主要评价指标包括灵敏度灵敏度、、特异度特异度、、似然比似然比、、预测值预测值、、符合率符合率等。 等。

Page 8: 第九章 诊断试验的研究与评价

诊断试验研究与评价的设计诊断试验研究与评价的设计

待评价方法

待评价方法

同步盲法比较

Page 9: 第九章 诊断试验的研究与评价

1 、确定金标准

金标准 (gold standard)—当前公认最好的、准确可靠的诊断方法(病理学检查、手术探查、特殊影像学检查等),或专家制定并得到公认的临床诊断标准。

Page 10: 第九章 诊断试验的研究与评价

22 、研究对象的选择、研究对象的选择 病例组和对照组人群选择应采用随机化病例组和对照组人群选择应采用随机化原则,以确保样本的代表性和试验结果对原则,以确保样本的代表性和试验结果对目标人群的可推论性。目标人群的可推论性。

Page 11: 第九章 诊断试验的研究与评价

11

病例组应该包括各型病人,如典型和不典型的、不同病情严重程度的、不同病程阶段的、有或无并发症的病例。只有综合选择各型病例进行诊断试验的评价,其结果才能具有广泛的推论性和临床诊断的适用价值。 对照组最好选择需要与研究疾病鉴别的其它疾病,即所选择的对照组与病例组具有许多相似的临床表现,而应慎用自愿者和其他健康人群。

Page 12: 第九章 诊断试验的研究与评价

12

3 、样本量的估计 诊断试验的评价需要选择足够的样本量。诊断试验的评价需要选择足够的样本量。样本量可用公式计算或查相应的样本量样本量可用公式计算或查相应的样本量表获得。在用公式进行计算时,要预先表获得。在用公式进行计算时,要预先设置诊断试验的灵敏度和特异度,显著设置诊断试验的灵敏度和特异度,显著

性水平性水平 以及允许误差以及允许误差 δδ 。。

Page 13: 第九章 诊断试验的研究与评价

13

当灵敏度和特异度接近 50%时,可用如下公式表达:

式中 u 指正态分布中累积概率为 /2时的 u值(如 u0.05/2=1.960, u0.01/2=2.576) 指允许误差,一般取总体率(灵敏度或特异度) 100(1-)%可信区间宽度的一半。 P为诊断试验预期的灵敏度或特异度。

( )2

/ 2 1aun p pd

æ ö÷ç= -÷ç ÷çè ø

Page 14: 第九章 诊断试验的研究与评价

14

当预期的灵敏度或特异度小于 20%或大于 80%时,资料呈偏态分布,需要对率采用平方根反正弦转换,可用如下公式表达:

( )

2

/ 2

1

57.3

sin1

aun

p p

d-

ì üï ïï ïï ïï ïï ïï ïï ï=í ýæ öï ï÷ï ïç ÷ï ïç ÷ï ïç ÷ï ïç ÷- ÷çï ïè øï ïî þ

Page 15: 第九章 诊断试验的研究与评价

4 、盲法判定和比较试验结果 要求判断试验结果者预先不知道病例被金标准划分为“有病”或“无病”的情况,可减少人为的主观偏差,保证比较结果的真实性。

Page 16: 第九章 诊断试验的研究与评价

16

5 、观察指标和判断标准的确定 任何诊断试验都要选择适宜的观察指标,指标本身的特性影响诊断试验的结果,通常观察指标有客观指标、主观指标以及介于两者之间的半主观指标。

Page 17: 第九章 诊断试验的研究与评价

17

( 1)客观指标:这些指标可用客观的仪器或试剂进行测量或测定,很少依赖医生的主观判断和病人的主诉。如体温、血压、血糖浓度、心电图、血与尿常规检查结果等。 ( 2)主观指标:这些指标主要是病人的主诉,如疼痛、不舒服、失眠等。 ( 3)半主观指标:此类指标主要凭借临床医生的主观感觉或判断,如判断肿块的硬度或大小等。

Page 18: 第九章 诊断试验的研究与评价

18

确定判断标准的方法主要有统计学方法、临床判断法和 ROC 曲线法

Page 19: 第九章 诊断试验的研究与评价

( 1 )统计学方法

1 )百分位数法:

适用于偏态分布、分布类型不确定或有极端数值的数据。

2 )正态分布法:

适用于呈正态分布的数据,通常用平均值加减 2 倍标准差作为标准值。

( 2 )临床判断法

Page 20: 第九章 诊断试验的研究与评价

( 3 ) ROC曲线法 ROC 曲线或称为受试者工作特征曲线,是用构图法揭示灵敏度和特异度的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列灵敏度和特异度,再以灵敏度为纵坐标、( 1-特异度)为横坐标绘制成曲线,图中对角线下的面积为随机诊断产生的曲线下面积。 ROC 曲线越向左上偏,曲线下面积越大,诊断准确性越高。

Page 21: 第九章 诊断试验的研究与评价
Page 22: 第九章 诊断试验的研究与评价

B/E 不同取值的灵敏度、特异度、约登指数

 

**:当 B/E 值为 1.010 时,灵敏度为 0.932 ,特异度为 0.925 ,约登指数为 0.857 (最大)

B/E 值 灵敏度 1- 特异度 特异度 约登指数

0.97 0.000 0.825 0.175 0.175

0.99 1.000 0.500 0.500 0.500

1.00 0.986 0.300 0.700 0.686

1.00 0.932 0.175 0.825 0.757

1.01 0.932 0.075 0.925 0.857**

1.01 0.905 0.050 0.950 0.855

1.02 0.770 0.000 1.000 0.770

1.03 0.608 0.000 1.000 0.608

1.08 0.176 0.000 1.000 0.176

Page 23: 第九章 诊断试验的研究与评价

ROC Curve

2--ROC图 曲线图

1 - Specificity

1.00.75.50.250.00

Sensi

tivi

ty

1.00

.75

.50

.25

0.00

Page 24: 第九章 诊断试验的研究与评价

6 、评价指标的统计分析和结果报告 全面分析、评价和报告诊断试验的真实性、可靠性和收益。

Page 25: 第九章 诊断试验的研究与评价

诊断试验的评价诊断试验的评价 疾病诊断试验的评价是指对其所使用的医疗试验进行的流行病学分析。诊断试验评价的基本方法是用金标准确诊区分某病的病人和非病人,再应用待评价的诊断试验或筛检方法同步、盲法测定这些研究对象,用某些指标对诊断试验的真实性、稳定性、实用性以及效益进行评价。

Page 26: 第九章 诊断试验的研究与评价

阴性 假阴性 C 真阴性 D C+D

试验结果 病人 非病人 合计

表 1 应用诊断试验检查某病患者和非患者的结果模式表

阳性 真阳性 A 假阳性 B A+B

合 计 A + C B + D A+B+C+D=N

一、真实性的评价 又称为效度,指一项诊断或筛检试验所获得的数值与实际值的符合程度。

评价真实性的指标有灵敏度、特异度、漏诊率、误诊率和正确诊断指数

Page 27: 第九章 诊断试验的研究与评价

1 、灵敏度

指一项诊断或筛检方法能将实际有病的

人正确地判断为患者的能力。

灵敏度 = ×100% 或 灵敏度 =1 - 假阴性率 灵敏度的标准误计算公式为

95%SenL , SenU=Sen±UaSsen

AA+C

(1 )Sen SenSE

n

-=

Page 28: 第九章 诊断试验的研究与评价

灵敏度越大,试验发现阳性的可能性越大。当试验结果为阴性时,灵敏度大的试验更容易排除被检查者患病的可能性。

Page 29: 第九章 诊断试验的研究与评价

2 、特异度 是指一项诊断或筛检方法将实际无病的人正确

地判断为非患者的能力。• 特异度 = ×100% 或 特异度 =1 -假阳性率

特异度的标准误计算公式为

D

B+D

( )

(1 )spe

Spe SpeSE

n

-=

Page 30: 第九章 诊断试验的研究与评价

特异度越大,实际无病的人被判断为阴性可能性越大。非常特异的试验通常被用于确定疾病的存在,其阳性结果可明确被检查者患有某种疾病。

Page 31: 第九章 诊断试验的研究与评价

漏诊率:指一项诊断试验将实际有病的人错误诊断为非病人的比例。也称假阴性率。灵敏度越高,漏诊越少。

漏诊率 =1- 灵敏度,

误诊率:指一项诊断试验将实际无病的人错误诊断为病人的比率。误诊率也称假阳性率。 误诊率 =1- 特异度 或

100%C

A C´

+漏诊率=

100%B

B D´

+误诊率=

Page 32: 第九章 诊断试验的研究与评价

正确诊断指数( Youden 指数) 一项诊断方法发现真正的病人和非病人的总能力。 约登指数 = (灵敏度 + 特异度 )- 1 或 约登指数 = + - 1

将灵敏度和特异度合并为一个指标,可更全面地评价、比较各种筛检试验的真实性。 指数愈大,反映的真实性也愈大。约登指数的标准误为

AA+C

DB+D

( )1 2

(1 ) (1 )r

Sen Sen Spe SpeSE

N N

- -= +

Page 33: 第九章 诊断试验的研究与评价

3 、符合率( percent agreement) :一项诊断试验正确诊断的病人数与非病人数之和占所有进行诊断人数的比率。符合率越高,可靠性越好

100%a d

a b c d

+ + +粗一致率=

1

4

a a d d

a b a c c d b d

æ ö÷ç + + + ÷ç ÷çè ø+ + + +调整一致率=

100%a d

a b c d

+ + +符合率=

Page 34: 第九章 诊断试验的研究与评价

4. 似然比( likelihood ratio LR )

综合了灵敏度和特异度的信息,其含义为:病人中出现某种检测结果的概率与非病人中出现相应结果的概率之比,它表明某项试验所确定的阳性界值(截点)能否良好地区分真阳性和假阳性。根据似然比可以判断诊断试验阳性或阴性时患病的概率,以助临床医生的诊断决策。

Page 35: 第九章 诊断试验的研究与评价

1. 阳性似然比( +LR ) 真阳性率与假阳性率之比,说明正确判断阳性的可能性是错判阳性可能性的倍数。

比值越大,试验结果阳性时为真阳性的概率越大,此诊断方法愈好。

+LR = 灵敏度 /(1- 特异度 )= 灵敏度 / 误诊率

)()(阳性似然比DBB

CAA

/

/

/

/

A A C

B B D

++

( )阳性似然比=

( )

Page 36: 第九章 诊断试验的研究与评价

2. 阴性似然比 ( -LR )

是假阴性率与真阴性率之比,表示错判阴性

的可能性是正确判断阴性的可能性的倍数,此值越小,试验结果为真阴性的可能性越大,该诊断方法愈好

-LR =(1- 灵敏度 )/ 特异度 = 漏诊率 / 特异度

即 /

/

C A C

D B D

++

( )阴性似然比=

( )

Page 37: 第九章 诊断试验的研究与评价

根据似然比判断试验阳性或阴性时患病概率的计算: 验前概率:检查前病人患某种疾病的可能性 。

验 前 比:检查前病人患某种疾病的机率。 验 后 比:检查后病人患某种疾病的机率。 验后概率:检查后病人患某种疾病的可能性。 ①将验前概率转换为验前比 验前比 = 验前概率 /(1 -验前概率 ) ②通过诊断试验的似然比计算验后比 验后比 = 验前比 × 似然比 (LR) ③将验后比转换为验后概率: 验后概率 = 验后比 /( 验后比 +1)

Page 38: 第九章 诊断试验的研究与评价

例:某 18 岁女性因面色苍白、乏力,被怀疑为严重贫血至某医院就诊,根据病史及外周血涂片检查,在该院该年龄段女性患缺铁性贫血的可能性为 40% 。在实验室进一步做血清铁蛋白检查,结果为 12mmol/L ,该院血液学实验室以骨髓铁染色作金标准,用 血清铁蛋白试验法诊断缺铁性贫血的阈值为 65mmol/L ,≤ 65mmol/L 为缺铁性贫血,该方法灵敏度为 90% ,特异度为 85% 。问该女患缺铁性贫血的概率是多少? 解:验前概率 = 0.40 验 前 比 = 0.40/ ( 1-0.40 ) =0.67 阳性似然比 = Sne/(1-Spe)=0.9/(1-0.85)=6 验 后 比 = 0.67×6=4.02 验后概率 = 4.02/ ( 1+4.02 ) =0.80

该病员患缺铁性贫血的概率为 80% 。

Page 39: 第九章 诊断试验的研究与评价

当了解许多症状、体征在某些病的似然比后,可以利用其进行多重试验检验。在进行诊断时,把前一次检验的验后概率作为下一次检验的验前概率,继续运用,直到可下结论为止。举例如下。 一位 45岁妇女主诉突发左侧胸痛月余,来门诊就医。该患者是否患冠心病? 查胸痛原因很多,如肺或胸膜疾患;上消化道疾病;冠心病;情绪影响;其他原因。仅只按其主诉,她患冠心病的可能(验前概率)仅为 0.01 。 验前比 = 验前概率 / ( 1- 验前概率) =0.01/ ( 1-0.01 ) =0.01 。1 )进一步询问其疼痛特点,有放射至左臂内侧的特点。其阳性似然比为 100 ,

其验后比 =0.01×100=1 。此时诊断冠心病的概率(验后概率) = 验后比 / ( 1+验后比) =1/ ( 1+ 1 ) =0.502 )再做心电图检查, ST段下降 2.2mm,其阳性似然比为 11 , 验前比 =0.5/ ( 1-0.5) =1 。验后比 =1×11=11 。( 0.5为前一项放射痛的验后概率) 验后概率 =11/ ( 1+ 11 ) =11/12=0.91673 )再检验其血清肌酸磷酸酶( CPK) >80单位,此时阳性似然比为 7.75。

其验前比 =0.9167/ ( 1-0.9167) =11.0048;验后比 =11.0048×7.75=85.25。验后概率 =85.25/ ( 1+85.25) =0.988经过询问症状,心电图检查及血清 CPK检查,该病人患冠心病的可能性为 98.8%,因此可以明确诊断该病人患冠心病。

Page 40: 第九章 诊断试验的研究与评价

二、诊断试验的可靠性评价 可靠性又称信度,指同一指标在同一受试者身上重复测量时,获得结果的一致性。结果愈恒定,诊断方法的可靠性愈高

Page 41: 第九章 诊断试验的研究与评价

1. 诊断试验的一致性分析— Kappa 分析 kappa 值为实际一致率与非机遇一致率的比,该值考虑了机遇因素对一致性的影响,表示不同人判断同一批结果,或同一人不同时间判断同一批结果的一致性强度

一般认为 Kappa 值在 0.4~ 0.75为中、高度一致, Kappa 值≥ 0.75为极好的一

致性。 K≤0.40 时,表明一致性差。

Page 42: 第九章 诊断试验的研究与评价

例:临床经验相似的甲乙二医生阅片结果如下 : 表 1 甲、乙医生阅读胸片诊断结果

甲医生诊断 乙医生诊断 肺门淋巴结核 正常 合 计

肺门淋巴结核 46( a ) 10 ( b) 56( r1 )

正 常 12 ( c) 32 ( d ) 44 ( r2 )

合 计 58( c1 ) 42 ( c2 ) 100 ( N )

两医生的观察一致率( PO )

0

46 320.78 78

100

a dp

N

´ ´= = = = %

Page 43: 第九章 诊断试验的研究与评价

机遇一致率( PC )

非机遇一致率 = 1 -机遇一致率= 100% - 51%= 49%

实际一致率= 观察一致率- 机遇一致率= 78% - 51%= 27%

Kappa 值也可直接求取

0 27%0.55

1 49%C

CP Pkappa

P

-= = =

-实际一致率

值=非机遇一致率

1 1 2 22

1 1 2 2

( ) ( )

( )

N A D RC R CKappa

N RC R C

+ - +=

- +

2

100 (46 32) (56 58 44 42)0.55

100 (56 58 44 42)Kappa

´ + - ´ + ´= =

- ´ + ´

1 1 2 2 56 58 44 42( ) / ( ) /100 0.51 51%

100 100C

rc r cP N

N N

× ×= + = + = =

Page 44: 第九章 诊断试验的研究与评价

2. 影响诊断试验可靠性的因素

1 )试验方法与条件的差异

2 )观察者的变异

3 )被观察者的变异

Page 45: 第九章 诊断试验的研究与评价

1 )试验方法与条件的差异 包括试验的环境条件,如温度、湿度等;试剂与药品的质量及配制方法;仪器是否校准以及 操作者的熟练程度等。因此,必须严格规定试验的环境条件以及试剂与药品的级别,仪器必须先校准, 才能保证试验的可靠性。

Page 46: 第九章 诊断试验的研究与评价

2 )观察者的变异 包括不同观察者之间的变异( inter-observer variability )和同一观察者变异( intra-observer variability ),即在不同时间、条件下重复检查同一样本时所得结果的不一致性。

Page 47: 第九章 诊断试验的研究与评价

3 )被观察者的变异 主要是指个体的生物学变异( biological variation ),即被观察者个体的各种生理、生化测量值均随测量时间、条件等变化而不断变化, 严格来讲,个体生物学变异影响的是可靠性评价的过程,确实的可靠性指标需要排除被测个体生物学变异的干扰。因此,要严格规定统一的测量时间和测量条件,以使被观察者在相同条件下进行比较。同时,临床医师应对个体的生物学变异给予足够的重视。

Page 48: 第九章 诊断试验的研究与评价

三、收益评价

收益指经诊断试验后能使多少原来未发现的病人得到及时诊断和治疗。以及因此而创造的经济和社会价值。评价收益的常用指标有预测值、成本 - 效益分析、成本 - 效果分析等。

Page 49: 第九章 诊断试验的研究与评价

1.预测值: 应用诊断试验结果来估计受检者患病可能性大小的指标。。是指在已知试验结果的条件下,表明有无疾病的概率。一个诊断方法有一定的灵敏度和特异度,但在诊断患病率不同的人群时,阳性(或阴性)结果所表示的意义却不同,如人群的患病率低,即使应用特异度高的试验也会出现相当多的假阳性。 因此,一项试验要有一个预测值。

Page 50: 第九章 诊断试验的研究与评价

阳性预测值——指试验阳性者真正患该病

的可能性。

阴性预测值——指试验阴性者未患该病的

可能性。

( ) 100%A

pvA B

+ = ´+

阳性结果预测值

( ) 100%D

pvC D

- = ´+

阴性结果预测值

Page 51: 第九章 诊断试验的研究与评价

195 例 运动后心电图与冠状动脉造影的比较

冠状动脉造影显示≥ 75%狭窄

运动后心

电图异常 + -合计

+ 55 (a) 7 (b) 62

- 49 (c) 84 (d) 133

合计 104 91 195

Page 52: 第九章 诊断试验的研究与评价

1.灵敏度= 55÷104×100% = 52.88% 2.假阴性率= 49÷104×100% = 47.12% 3.特异度= 84÷91×100% = 92.30% 4.假阳性率= 7÷91×100% = 7.70% 5 .约登指数=( 0.5288+0.923 )- 1 = 0.4518 6 .阳性预测值= 55÷62×100% = 89% 7 .阴性预测值= 84÷133×100% = 63% 8 .患病率= 104÷195×100% = 53%该作者在结论中说:“阳性结果预测男性显著的冠状动脉狭窄时是有用的,但阴性结果并不能用来排除显著的冠状动脉狭窄。”

Page 53: 第九章 诊断试验的研究与评价

表 3 :在患病率低的病人组中运动后心电图与冠状动脉造影的比较

运动后心 冠状动脉造影显示≥ 75%狭窄

电图异常 + -

+ 55 (a) 42 (b) 97

- 49 (c) 478 (d) 527

合 计 104 520 624

合 计

Page 54: 第九章 诊断试验的研究与评价

1.灵敏度= 55÷104×100%= 52.88% 2.假阴性率= 49÷104×100% = 47.12% 3.特异度= 84÷91×100% = 92.30% 4.假阳性率= 7÷91×100% = 7.70% 5 .约登指数=( 0.5288+0.923 )- 1= 0.4518 6 .阳性预测值= 55÷97×100% = 57% 7 .阴性预测值= 478÷527×100%= 91% 8 .患病率= 104÷624×100%= 17% 当患病率降至 17% 时,同一试验阳性预测值下降至 57% ,阴性预测值上升至 91% 。此时病人运动试验为阳性结果很难预测其有显著的冠状动脉狭窄,但阴性结果则很可能排除显著的冠状动脉狭窄。

Page 55: 第九章 诊断试验的研究与评价

预测值还与患病率的高低有关 灵敏度和特异度不变时,该病患病率低则阳性预测值较低,阳性预测值随患病率的增加而上升,故一般认为在患病率较高的人群中开展筛检的意义较大,将会有较高的收益

1 1

´´ + - ´ -

灵敏度 患病率阳性预测值=

灵敏度 患病率 ( 特异度)( 患病率)

1

1 1

´ -´ - + - ´特异度( 患病率)

阴性预测值=特异度( 患病率)( 灵敏度)患病率

Page 56: 第九章 诊断试验的研究与评价

灵敏度和特异度均为 99% 的试验在不同患病率人群中的阳性预测值

感染 受检 实际感 实际未 试验阳 试验假 总阳性 阳性预率 人数 染人数 感染人数 性人数 阳性人数 人数 测值 (%)

1/万 100000 10 99990 10 1000 1010 0.99 1‰ 100000 100 99900 99 999 1098 9.021% 100000 1000 99000 990 990 1980 50.00 10% 100000 10000 90000 9900 900 10800 91.67

Page 57: 第九章 诊断试验的研究与评价

诊断试验的预测值并非试验本身的唯一特征,预测值受到试验的灵敏度、特异度和患病率的影响。试验的灵敏度越高,阴性预测值越好,临床医生有更足的把握判断阴性结果为非病人;反之,试验的特异度越高,阳性预测值越好,临床医生越有理由判断阳性结果为病人。当试验的灵敏度和特异度一定时,受试人群的患病率越低,或个体患病的验前概率越小,阳性预测值越差。

Page 58: 第九章 诊断试验的研究与评价

临床医生在判断试验结果时,应综合考虑试验的灵敏度、特异度以及受试人群的患病率,否则,其判断结果将受到假阳性和假阴性的影响。由于人群患病率的波动范围远远大于试验本身的特异度和灵敏度的变化范围,因此临床医生更应该注意患病率对试验结果的影响。

Page 59: 第九章 诊断试验的研究与评价

2.经济效益 1 )成本 - 效益分析 成本指对一项诊断或筛检试验所花费的全部费用,包括试验所花费的人、财、物力及设备折旧。效益指通过筛检或诊断试验所取得的经济效益。

2 )成本 - 效果分析 效果是指通过筛检或诊断实验所取得的社会效益。如延长了寿命,提高了生活质量等

3 )成本 - 效应分析 指投入的成本与取得的生命质量改善之间的分析评价方法

Page 60: 第九章 诊断试验的研究与评价

影响试验效益的主要因素:

1.疾病的患病率 疾病的患病率一方面影响预测值,另一方面将影响新发现的病例数量。从效益的角度考虑,要尽量将试验用于患病率高的人群,以发现更多真正患病的人,减少误诊。

Page 61: 第九章 诊断试验的研究与评价

2.早期发现病例对预后的改善程度 一项诊断试验若能做到早期发现病例,并使之得到早期治疗,则有利于改善疾病预后,降低病死率和合并症发生率、提高生存率、减少医疗费用,取得良好的社会效益和经济效益。

Page 62: 第九章 诊断试验的研究与评价

3.灵敏度和特异度 试验本身的灵敏度和特异度不但影响诊断试验的预测值,而且也会直接影响试验的效益。但对效益的直接影响是复杂的。如灵敏度增加一方面将能发现更多的新病例,达到更早期的诊断和治疗,取得较好的效益,另一方面又可能使假阳性增加,加大进一步确诊的费用。

Page 63: 第九章 诊断试验的研究与评价

提高诊断试验效率的方法 由于一个诊断方法的诊断标准变动时,如果提高了灵敏度,必然以降低特异度为代价,反之亦然,如果既想提高灵敏度又不降低特异度,或提高特异度又不降低灵敏度,则可选择多种指标的联合试验。

Page 64: 第九章 诊断试验的研究与评价

1.并联(平行)试验 同时进行几项试验,只要有一项结果阳性就判为阳性,此种联合提高灵敏度,但特异度可有一定降低。此法可减少漏诊率。在漏诊病人可能导致严重后果时,可采取并联试验。

Page 65: 第九章 诊断试验的研究与评价

2.串联(系列)试验: 用二种以上筛检或诊断试验,只有全部结果均为阳性者才定为阳性,此种联合试验提高了特异度,可以减少误诊率,但却可增加漏诊率。当误诊可造成严重后果时,应采用串联(系列)试验

Page 66: 第九章 诊断试验的研究与评价

例 表 4 :联合试验筛检糖尿病的结果试 验 结 果 糖尿病人 非糖尿病人尿 糖 血 糖 + - 14 10 - + 33 11 + + 117 21 - - 35 7599 合 计 199 7641

Page 67: 第九章 诊断试验的研究与评价

血糖试验:灵敏度= ×100%= 75.38%

特异度= ×100%= 99.58%

尿糖试验:灵敏度= ×100%= 65.83%

特异度 = ×100%= 99.59%

并联试验:灵敏度= ×100%= 82.41%

特异度 = ×100%= 99.45%

串联试验:灵敏度= ×100%= 58.79%

特异度= ×100%= 99.73%

33+117199

10+75997641

14+117199

11+75997641

14+33+117199

75997641117199

10+11+7599

7641

Page 68: 第九章 诊断试验的研究与评价

其他提高诊断试验效率的方法 : 1.提高患病率(验前概率) 从前面所提到的患病率与灵敏度、特异度以及预测值和 Bayes 公式可知,当诊断试验的基本性质(灵敏度和特异度)不变时,阳性预测值随患病率的升高而加大。当似然比固定时,验前概率提高,验后概率也会加大。而阳性预测值越大,医生诊断疾病的把握性也越大。

Page 69: 第九章 诊断试验的研究与评价

2.联合试验的多元分析 临床疾病的表现复杂多样,两、三个试验不一定能完全描述清楚,因此,疾病诊断通常是综合临床症状、体征及化验、检测等多方面的结果做出的。临床医生可利用多元回归、Logistic回归、判别分析、综合评价(如评分法)等方法对疾病进行综合计量诊断。

Page 70: 第九章 诊断试验的研究与评价

Bayes概率法是指在患某病的条件下,计算一个病人具有多种症状和体征等出现的概率,依靠这些概率的大小来进行判别和诊断。若以 X1, X2,… , XM表示各种临床表现; A1, A2, …, AG表示病别,当一个病人各种症状或体征等的指标值分别为 S1, S2, …, Sm时,属于 AG病种的概率如下 :

式中 P(AG) 为事前概率 ,比较计算所得的 P(Ag/S1S2…Sm) 值 , 若 P(Af/S1S2…Sm) 最大,则判断为 Af病种,其值为判定 Af病种的事后概率。

1 21 2

1 21

( ) ( / ) ( / )... ( / )( / ... )

( ) ( / ) ( / )... ( / )

G G G m GG m g

G G G m GG

P A P S A P S A P S AP A S S S

P A P S A P S A P S A=

=

å

Page 71: 第九章 诊断试验的研究与评价

诊断试验的评价原则一、与金标准进行同步盲法比较二、观察对象的代表性三、样本量的大小四、诊断试验的重复性五、诊断试验的真实性六、诊断指标及判断标准的合 理性七、诊断试验的具体步骤八、诊断试验的实用性