57
[email protected] http://statdtedm.6to23.com ) December 13 2005

第十三章 诊断试验的评价

Embed Size (px)

DESCRIPTION

第十三章 诊断试验的评价. 循证医学的重要内容 及时取舍或灵活应用新的诊断试验(试剂、药物、方法) 提高业务素质,减少患者不必要的经济开支。. 为什么要学习诊断试验的评价. 第一节 贝叶斯定理 第二节 诊断试验中常用的评价指标 第三节 ROC 曲线. 目 录. 第一节 贝叶斯定理. 贝叶斯定理应用. 第二节 诊断试验中常用的评价指标. 例 13.2 表 13.2 ECG 诊断试验的结果. - PowerPoint PPT Presentation

Citation preview

Page 1: 第十三章 诊断试验的评价

宇传华( [email protected]://statdtedm.6to23.com )

December 13 , 2005

Page 2: 第十三章 诊断试验的评价

为什么要学习诊断试验的评价

循证医学的重要内容 及时取舍或灵活应用新的诊断试验

(试剂、药物、方法) 提高业务素质,减少患者不必要的

经济开支。

Page 3: 第十三章 诊断试验的评价

目 录第一节 贝叶斯定理第二节 诊断试验中常用的评价指标第三节 ROC 曲线

Page 4: 第十三章 诊断试验的评价

第一节 贝叶斯定理

Page 5: 第十三章 诊断试验的评价

贝叶斯定理应用

Page 6: 第十三章 诊断试验的评价

第二节 诊断试验中常用的评价指标例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)常用指标有(一)正确百分率、(二)灵敏度、(三)特异度、(四) Youden 指数、(五)阳性似然比、(六)阴性似然比、(七)阳性预报值、 (八)阴性预报值。

Page 7: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 8: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 9: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 10: 第十三章 诊断试验的评价
Page 11: 第十三章 诊断试验的评价

灵敏度与特异度的优缺点

优点:灵敏度与特异度不受患病率的影响,其取值范围均在( 0, 1 )之间,其值越接近于 1 ,说明其诊断准确性越好。

缺点:当比较两个诊断试验时,单独使用灵敏度或特异度,可能出现矛盾。

解决办法:将两指标结合: Youden 指数、阳性似然比、阴性似然比等

Page 12: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 13: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 14: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 15: 第十三章 诊断试验的评价

医生最关心的问题: 1. 试验阳性时患病的概率多大? 2. 试验阴性时不患病的概率多大?

Page 16: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

Page 17: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

Page 18: 第十三章 诊断试验的评价

例 13.2 表 13.2 ECG诊断试验的结果

ECG诊断结果

心肌梗塞

合 计出现 不出现

阳性 阴性合计

416(TP) 9( FP) 425

104(FN) 171( TN) 275

520 180 700(N)

Page 19: 第十三章 诊断试验的评价

阳性预报值与阴性预报值

Page 20: 第十三章 诊断试验的评价

第三节 ROC 曲线

Page 21: 第十三章 诊断试验的评价

ROC 【 receiver(relative) operating characteristic 的缩写,译为“接受者工作特征”】

ROC 曲线研究历史1950’s 雷达信号观测能力评价1960’s 中期 实验心理学、心理物理学1970’s 末与 1980’s 初 诊断医学

ROC 的涵义与起源

Page 22: 第十三章 诊断试验的评价

诊断试验:泛指血液生化、影像学、免疫学、细胞学、病理学、统计模型等检查。

重要性: 1. 循证医学的重要组成部分 2. 诊断试验评价方法可用于: 临床试验评价 临床检验评价 流行病学筛查试验评价 实验室检验评价 统计学模型评价……

ROC 曲线评价诊断试验的重要性

Page 23: 第十三章 诊断试验的评价

灵敏度 , 特异度 , 假阴性率 , 假阳性率

Test variable

Page 24: 第十三章 诊断试验的评价

不同诊断界值时灵敏度与特异度间的平衡 (trade off)

0

20

40

60

80

100

50 60 70 80 90 100

特异度灵敏度

百分率(%)

Test variable

Page 25: 第十三章 诊断试验的评价

完美诊断试验

0. 0

0. 2

0. 4

0. 6

0. 8

1. 0

0. 0 0. 2 0. 4 0. 6 0. 8 1. 0FPR

TPR

无用诊断试验

0. 0

0. 2

0. 4

0. 6

0. 8

1. 0

0. 0 0. 2 0. 4 0. 6 0. 8 1. 0FPR

TPR

完美与无用的 ROC 曲线

真阳性率

灵敏度 假阳性率 即 1 -特异度

机率线 (chance line)(diagonal reference line)

Page 26: 第十三章 诊断试验的评价

诊断准确度较低( <0.7 )

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0FPR

TPR

A =0.664

诊断准确度中等(0.7~0.9)

0. 0

0. 2

0. 4

0. 6

0. 8

1. 0

0. 0 0. 2 0. 4 0. 6 0. 8 1. 0FPR

TPR

A = 0.830

诊断准确度较高( > 0.9)

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0FPR

TPR

A = 0.938

ROC 曲线下面积( Area )与诊断准确度高低高 0.90-1.00 = excellent (A)

中 0.80-0.90 = good (B) 0.70-0.80 = fair (C)

低 0.60-0.70 = poor (D) 0.50-0.60 = fail (F)

Page 27: 第十三章 诊断试验的评价

似然比( LR )在 ROC 曲线空间的涵义

白细胞计数诊断白血病

LR = 7.5

LR = 0.7

LR = 2.3

LR = 25.0

Page 28: 第十三章 诊断试验的评价

基本概念小结 ROC 曲线反映了灵敏度与特异度间的平衡 ( 增加灵

敏度将降低特异度;增加特异度将降低灵敏度 ) 。 在 ROC 曲线空间,如果曲线沿着左边线,然后沿着

上边线越紧密,则试验准确度越高。 在 ROC 曲线空间,如果曲线沿着机会线( 45 度对

角线)越紧密,则试验准确度越低。 在诊断界值( cutpoint )处的正切线的斜率就是该

试验值对应的阳性似然比( likelihood ratio , LR)。在 ROC 曲线空间的左下角 LR+ 最大,随着曲线从左下往右上方移动, LR+ 逐渐减小。

ROC 曲线下面积是重要的试验准确度指标。

Page 29: 第十三章 诊断试验的评价

主要任务:

计算 ROC 曲线工作点( Coordinate point或 Operating point )( FPR, TPR )

连接相邻两点

一、 ROC 曲线工作点的计算与曲线绘制

Page 30: 第十三章 诊断试验的评价

连续型数据的ROC 曲线工作点( TPR , FPR )计算

将这 9 个数据从大到小排列,以前 8个数,分别作为诊断界值,大于等于诊断界值者判为阳性,小于该值者判为阴性。这样,可整理成 8 个四格表

表 13 - 3 假想的连续型数据

Page 31: 第十三章 诊断试验的评价

表13.4 表13.3资料不同诊断界值的FPR和TPR值

诊 断 界 值

16.5 13.5 12.8 11.2 8.5 6.4 5.0 4.6

FPR 0 0 0 0 1/4 2/4 2/4 3/4

TPR 1/5 2/5 3/5 4/5 4/5 4/5 5/5 5/5

Page 32: 第十三章 诊断试验的评价

有序分类数据的有序分类数据的ROCROC 曲线工作点(曲线工作点( TPRTPR ,, FPRFPR )计算)计算

将诊断分类数据按大到小排序,以前 4 个分类作为诊断界值,大于等于诊断界值者为阳性,小于该值者为阴性。这样,可整理出 4 个四格表,每个四格表对应的 ROC 曲线的工作点见下表。

某放射医生对 109份 CT影像的分类 诊 断 分 类金标准

1 2 3 4 5合计

异常 3 2 2 11 33 51

正常 33 6 6 11 2 58

该资料不同诊断界值的 FPR和 TPR值诊断界值(诊断分类)

5 4 3 2FPR 0.0345 0.2241 0.3296 0.4310TPR 0.6471 0.8627 0.9020 0.9412

10

0

1

1

Page 33: 第十三章 诊断试验的评价

ROC图 有序分类资料的未光滑 曲线

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0FPR

TPR

2

Page 34: 第十三章 诊断试验的评价

二、 ROC 曲线下面积的计算

ROC 曲线下面积 (Area)

部分 ROC 曲线下的面积 FPR 为某值对应的 TPR 值

Page 35: 第十三章 诊断试验的评价

( 一 ) Hanley 和 McNeil 非参数法非参数法

ROC曲线下面积 (Az)就是异常组观察值大于正常组观察值的概率

),(1

1 1ji

n a

na

n

j

n

inaZ xx

nnA

ji

ji

ji

ji

na

na

na

na

xx

xx

xx

xx

0

5.0

1

),(

AZ的标准误 )( ZASE 可采用公式

na

ZnZaZZZ nn

AQnAQnAAASE

))(1())(1()1()(

22

21

其中,1Q 是两个随机选择的异常组观察值比一个随机选

择的正常组观察值都有更大可能被判为异常的概率。

2Q 是一个随机选择的异常组观察值比两个随机选择的正

常组观察值都有更大可能被判为异常的概率。

Mann-Whitney U 统计量

Page 36: 第十三章 诊断试验的评价

Hanley 和 McNeil 法法 ROCROC 曲线下面积曲线下面积与Mann-Whitney U 检验

由秩和检验中的Mann-Whitney U统计量( SPSS 等软件均可计算)可计算 ROC 曲线下面积

零假设 H0:总体 ROC 面积 θ= 0.5的检验等价于Mann-Whitney U检验

Mann-Whitney U Mann-Whitney Umax ,1z

n a n a

An n n n

统计量 统计量

3

3

30.5

3

2

( 1) ( )1

12

0.5 0.5

( ) |( 1) ( )1

12

n a

n a i i

n a

Z Z

Zn a i in a

U n nZ

n n N t t

N N

n n

A AZ

SE An n N t tn n

N N

分子分母同除 有

SPSS 输出的 ROC 面积检验 P值即为上述 Z 值对应的概率

Page 37: 第十三章 诊断试验的评价

Hanley 和 McNeil 法法 ROCROC 曲线下面积曲线下面积与梯形规则( trapezoidal rule )

Hanley 和 McNeil 法 ROC曲线下面积等于等于所有曲线下梯形梯形(包括最左侧的三角形)面积之和

ROC图 有序分类资料的未光滑 曲线

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0FPR

TPR

Page 38: 第十三章 诊断试验的评价

(二)其他 ROC 曲线下面积计算方法

1. 双正态法 2. 有序回归模型 3. 其他模型 ( 如双 Gama 法、双

指数法 )

Page 39: 第十三章 诊断试验的评价

2

1 2

2 21 2 1 1

1 2

2 21 2

1. ROC 100 1

( )

2. ROC

( ) ( ) 2 ( ) ( )

( ) ( )

Z Z

Z Z

Z Z Z Z

Z Z

Z Z

A Z SE A

A AZ

SE A SE A rSE A SE A

r r

A AZ

SE A SE A

曲线下面积的 ( )%置信区间为

两 曲线下面积比较检验公式:

0,其中 为两面积间的相关系数,令 = 有:

Page 40: 第十三章 诊断试验的评价

单个连续型资料(实例 1 )单个有序分类资料(实例 2 )两个相关连续型资料(实例 3 )两个相关有序分类资料(实例 4 )

二、 ROC 分析的数据类型

Test variables

Page 41: 第十三章 诊断试验的评价

实例实例 11 ::采用骨髓诊断作为金标准,对 100 例缺铁性贫血疑似患者进行确诊,患该病者为异常组 (34 例 ) ,未患该病者为正常组 (66 例 ) 。为了考察红细胞平均容积( MCV)诊断缺铁性贫血的效果,测得每一个体的 MCV 值如下:

表 红细胞平均容积骨髓诊断 MCV结果

60 66 68 69 71 71 73 74 74 74 76 77 77 77 77 78 7879 79 80 80 81 81 81 82 82 83 83 83 83 83 83 83 8484 84 84 85 85 86 86 86 87 88 88 88 89 89 89 90 90正常组

91 91 92 93 93 93 94 94 94 94 96 97 98 100 10352 58 62 65 67 68 69 71 72 72 73 73 74 75 76 77 77

异常组78 79 80 80 81 81 81 82 83 84 85 85 86 88 88 90 92

注:资料来自 J R Beck, EK Shul tz, Arch Pathol Lab Med,1986.

State Variable

Test Variable

Page 42: 第十三章 诊断试验的评价

实例 1 : MCV 诊断缺铁性贫血

图 4 连续性资料的两组频率分布 0.3

0.2

0.1

0

0.1

0.2

0.3

55 60 65 70 75 80 85 90 95 100 105

组段上限值

异常组频率

正常组频率

Page 43: 第十三章 诊断试验的评价

实例实例 11 的的 SPSSSPSS 输入格式输入格式

State Variable

=骨髓诊断

Test Variable = MCV 结果

0 =正常组1 =异常组

Value of State Variable : 1

Page 44: 第十三章 诊断试验的评价

SPSS的 GraphsROC Curve 界面

如果试验测量值越小患病的可能性越大时应改变默认的Options…

Page 45: 第十三章 诊断试验的评价

SPSS输出结果

Case Processing Summary

34

66

¹ÇËèÕï¶ÏPositivea

Negative

Valid N(listwise)

Smaller values of the test result variable(s) indicatestronger evidence for a positive actual state.

The positive actual state is 1.a.

Page 46: 第十三章 诊断试验的评价

SPSS输出结果

Page 47: 第十三章 诊断试验的评价

SPSS输出结果Area Under the Curve

Test Result Variable(s): mcv½á¹û

.717 .053 .000 .614 .820Area Std. Errora

AsymptoticSig.b Lower Bound Upper Bound

Asymptotic 95% ConfidenceInterval

The test result variable(s): mcv½á¹û has at least one tie between thepositive actual state group and the negative actual state group. Statisticsmay be biased.

Under the nonparametric assumptiona.

Null hypothesis: true area = 0.5b.

Page 48: 第十三章 诊断试验的评价

SPSS输出结果Coordi nates of the CurveTest Resul t Vari abl e(s): mcv 结果

Posi ti ve i f Less Than or Equal To(a) Sensi ti vi ty 1 - Specifi ci ty51 0 055 0. 029 059 0. 059 0

… … …99 1 0. 97

101. 5 1 0. 985104 1 1

The test resul t vari abl e(s): mcv 结果 has at l east one t i e between the posi t i veactual state group and the negati ve actual state group.

The smal l est cutoff val ue i s the mi ni mum observed test val ue mi nus 1, and thel argest cutoff val ue i s the maxi mum observed test val ue pl us 1. Al l the othercutoff val ues are the averages of two consecuti ve ordered observed test val ues.

Page 49: 第十三章 诊断试验的评价

MCV诊断缺铁性贫血的 ROC 曲线

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0FPR

TPR

双正态机率线工作点

Page 50: 第十三章 诊断试验的评价

实例实例 22 ::某放射医生将已知实际分类的影像,按肯定正常、可能正常、疑似异常、可能异常、肯定异常,分别分为 1 、 2 、 3 、 4 、 5 五类。

表 单个诊断试验的有序分类资料分类 1 2 3 4 5 合计正常组 35 68 49 29 12 193= nn

异常组 2 3 8 16 12 41= na

State Variable

Test Variable

Frequency Variable

Page 51: 第十三章 诊断试验的评价

实例实例 22 :放射医生影像分类:放射医生影像分类

图 6 单个有序分类资料的两组频率分布-0.5

-0.4

-0.3

-0.2

-0.1

0

0.1

0.2

0.3

0.4

0.5

1 2 3 4 5 分类

异常组频率

正常组频率

Page 52: 第十三章 诊断试验的评价

实例实例 22 的的 SPSSSPSS 输入格式输入格式

State Variable =组别

Test Variable =诊断分类

0 =正常组1 =异常组

Value of State Variable : 1

Page 53: 第十三章 诊断试验的评价

SPSS的 GraphsROC Curve 界面

如果试验测量值越小患病的可能性越大时应改变默认的Options…

在调用 Graphs前,必须先用 DataWeight Cases…by…: 频数

Page 54: 第十三章 诊断试验的评价

图 7 放射医生影像分类的 ROC 曲线

0.0

0.2

0.4

0.6

0.8

1.0

0.0 0.2 0.4 0.6 0.8 1.0FPR

TPR

双正态机率线工作点

Page 55: 第十三章 诊断试验的评价

其他实例的 ROC 曲线 SPSS 计算

参见: http://statdtedm.6to23.com

( 诊断试验评价与数据挖掘 )

Page 56: 第十三章 诊断试验的评价

推荐两本国外最新著作

Zhou XH, McClish DK, Obuchowski NA. Statistical Methods in Diagnostic Medicine. John Wiley & Sons, Inc. July 2002.

(也见:宇传华译,《诊断医学统计学》人民卫生出版社, 2005年 2月)

Pepe MS. The Statistical Evaluation of Medical Tests for Classification and Prediction . Oxford Univ Press. May 2003 .

Page 57: 第十三章 诊断试验的评价

宇传华( [email protected]://statdtedm.6to23.com )

December 13 , 2005

THE END