临床预测模型的决策曲线分析(DCA):基于ggDCA包 决策曲线分析法(decision curve analysis,DCA)是一种评估临床预测模型、诊断试验和分子标记物的简单方法。 我们在传统的诊断试验指标如:敏感性,特异性和ROC曲线下面积仅测量预测模型的诊断准确性,未能考虑特定模型的临床效用,而DCA的优势在于它将患者或决策者的偏好整合到分析中。这种理念的提出满足了临床决策的实际需要,在临床分析中的应用日益广泛。
前 言
本文介绍使用ggDCA包
绘制多因素Cox回归模型的决策曲线分析(Decision curve analysis,DCA)。
ggDCA是目前能同时绘制Cox回归模型、logistic回归模型及广义线性模型的DCA曲线且其图形能用ggplot2美化。同时,该包还能计算DCA的曲线下面积、净获益及阈值概率的范围,如果把这些加入到文章中相信能增色不少!
1. 预测模型评估小结
2. ggDCA包的安装
3. Cox回归模型的DCA
4. 单个Cox模型多个时间点的DCA
5. 多个Cox回归模型的DCA比较
6. 多个模型在多个时间的DCA比较
7. DCA的曲线下面积(AUDC)
8. 其他回归模型的DCA
一、模型评估与比较小结
举例:某列线图(AUC/C-inde=0.8)预测某患者5年复发风险为70%。
1. 区分度 (Discrimination)
使用ROC曲线的曲线下面积(AUC)和C-index评估。
AUC/C-index=0.8,列线图对此结果的区分能力为80%,即有80%的把握确定复发率为70%。预测模型 | 6. 模型评估:ROC曲线-基于多因素Cox回归
2. 校准度 (Calibration)
使用校准图评估。
校准图用于解释列线图预测的70%复发率与实际复发率的接近程度,即准确性评估。详见:预测模型 | 5. 模型评估:校准曲线
3. 临床实用性
(Clinical usefulness)
使用决策曲线分析(DCA)评估。
多因素Cox回归的DCA曲线
#载入R包
ibrary(rms)
library(ggDCA)
library(survival)
#清理环境
rm(list = ls())
#2.载入数据,status=0为复发
aa<- read.csv('决策分析曲线.CSV')
#使用cph()函数时运行
#即报错:adjustment values not defined here or with datadist.....时
bb<-datadist(aa)
options(datadist='bb')
数据点击:https://mp.weixin.qq.com/s/VO3GiBZcL_kAoHrr6_dPAw获取
1、构建多因素Cox回归模型
数据中status,0为感兴趣事件,因此status==0
model1<-coxph(Surv(time,status==0)~AGE+N+ER+LVI+Grade+RT,
data=aa)
2、决策曲线分析 DCA
fig1<-dca(model1,
new.data = NULL,
times=60)
- 不写times=60,默认为times="median";
- 想看多个时间点DCA,times=c(36,48,60);
- 想看外部验证数据DCA曲线,载入外部数据后,new.data = NULLNULL变为外部数据名字。
3、DCA曲线绘制和美化
ggplot(dca1,
model.names="模型1",
linetype =F, #线型
lwd = 1.2) #线粗
2.png
4. 美化
library(ggprism)
ggplot(dca1,linetype =F,lwd = 1.2)+
#使用直线坐标系
theme_classic()+
#使用prism主题
theme_prism(base_size =17)+
#图例放在上方
theme(legend.position="top")+
#x轴范围并加入小刻度
scale_x_continuous(
limits = c(0, 1),
guide = "prism_minor") +
#y轴范围并加入小刻度
scale_y_continuous(
limits = c(-0.01, 0.2),
guide = "prism_minor")+
#颜色
scale_colour_prism(
palette = "candy_bright",
name = "Cylinders",
label = c("模型1", "ALL", "None"))+
#图形标题
labs(title = "5年DCA基于ggDCA包")
3.png
更多细节点击查看原文:https://t.1yb.co/nAm1
四、单个模型多个时间点的DCA
只需修改一下
times=c(36,48,60)
和图例名称即可
#第1步建模同上
#第2步同上,只需改时间即可
dca1<-dca(model1,
new.data = NULL,
times=c(36,48,60))
#第3步改标签
ggplot(dca1,
linetype =F,
lwd = 1.2)+
theme_classic()+
theme_prism(base_size =15)+
theme(legend.position=c(0.7,0.7))+
scale_x_continuous(
limits = c(0, 1),
guide = "prism_minor") +
scale_y_continuous(
limits = c(-0.01, 0.15),
guide = "prism_minor")+
scale_colour_prism(
palette = "candy_bright",
name = "Cylinders",
label = c("3年DCA","4年DCA","5年DCA",
"ALL-3年", "ALL-4年","ALL-5年",
"None"))+
labs(title = "3-5年DCA")
五、多个模型DCA比较
#再建两个模型
model2 <- coxph(Surv(time,status==0)~AGE+N+ER+PR+Grade,data=aa)
model3 <- coxph(Surv(time,status==0)~AGE+N+ER+LVI,data=aa)
#三模型DCA分析
#只需指明模型名字和时间即可,跟1个模型一样其实
dca2<- dca(model1,model2,model3,
times=60)
#绘图,跟单模型一样的代码
ggplot(dca2,
linetype =F,
lwd = 1.2)+theme_classic()+
theme_prism(base_size =17)+
theme(legend.position=c(0.8,0.6))+
scale_x_continuous(
limits = c(0, 1),
guide = "prism_minor"
) +
scale_y_continuous(
limits = c(-0.01, 0.15),
guide = "prism_minor"
)+
scale_colour_prism(
palette = "candy_bright",
name = "Cylinders",
label = c("模型1", "模型2", "模型3","ALL","None")
)+labs(title = "三模型DCA比较")
六、多模型多时间点DCA比较
#只需修改一下时间和标题
dca2<- dca(model1,model2,model3,times=c(36,48,60))
ggplot(dca2,
linetype =F,
lwd = 1.2)+theme_classic()+
theme_prism(base_size =17)+
theme(legend.position=c(0.9,0.6))+
scale_x_continuous(
limits = c(0, 1),
guide = "prism_minor"
) +
scale_y_continuous(
limits = c(-0.01, 0.15),
guide = "prism_minor"
)+
scale_colour_prism(
palette = "candy_bright",
name = "Cylinders",
label = c("模型1", "模型2", "模型3","ALL","None")
)+labs(title = "三个模型3-5年DCA比较")
七、曲线下面积及净获益范围
类似ROC曲线的曲线下面积,DCA曲线也有曲线下面积: Area under Decision Curve (AUDC)。
代码非常简单:
AUDC(x)
x=dca()函数的名称。净获益范围:
rFP.p100(x)
model1<-cph(Surv(time,status==0)~AGE+N+ER+LVI+Grade+RT,
data=aa)
dca1<-dca(model1,times=60)
AUDC(dca1)
#运行结果
# model1 All None
#0.06035219 0.01139759 0.00000000
rFP.p100(dca1)
#也可以直接输入dca1
dca1
基于这个数据框,我们可以比较各个模型在各个时间点的阈值概率范围,最大最小净获益。
在我读过的文章里,这些数据很少被报道。
这项结果也是ggDCA
包的一大特色。
这些数据将使我们的文章更具亮点和说服力。
八、其他回归模型的DCA曲线
ggDCA包
可以绘制coxph()和cph()Cox回归模型, lrm()逻辑回归模型以及glm()广义线型模型的DCA曲线。其原理与Cox回归模型一样,建模---dca()分析---绘图。
只不过,其他模型不需要加入时间变量。
这里使用逻辑回归模型简单举例
bb<-datadist(aa)
options(datadist='bb')
#建模
m1<- lrm(status~AGE+N+LVI+Grade,data = aa)
m2<- lrm(status~AGE,data = aa)
#dca分析
d<-dca(m1,m2 )
#绘图
ggplot(d)+
theme_classic()+
theme_prism(base_size =17)+
theme(legend.position=c(0.25,0.3))+
scale_x_continuous(
limits = c(0.2, 1),
guide = "prism_minor"
) +
scale_y_continuous(
limits = c(-0.05, 0.8),
guide = "prism_minor"
)+
scale_colour_prism(
palette = "candy_bright",
name = "Cylinders",
label = c("lrm模型1", "lrm模型2","ALL","None")
小结
基于
ggDCA
包的可以为我们绘制各种类型的DCA曲线。在文章中可使用的结果可以有:1、基于DCA分析,模型1比模型2有着更好的临床实用性,在相同的阈值概率下触发医疗干预时,使用模型1作为指导可以使患者有更多的净获益。----DCA图形看到的 ;
2、此外,模型1比模型2有着更广的阈值概率范围+结果----基于dca(x)结果;
3、不同时间点的模型比较可以看模型的在不同时间其临床实用性的变化情况。
在读过的文章中,常常只汇报了第1条结果,但是,现在我们可以通过
ggDCA
包挖掘更多的结果以此增加一下文章的亮点了。
ggDCA包参考手册:
https://cran.r-project.org/web/packages/ggDCA/index.html
https://mp.weixin.qq.com/s?__biz=Mzg2MjU2NDQwMg==&mid=100010922&idx=1&sn=eae80cc7ab9e3fd2d66864609520921b&chksm=4e0752f77970dbe170cf969ab9baaf1dbbca8953ff4c2502e54595db5cffec4dc17f76267226#rd
错误1
Error in model.frame.default(formula = Surv(time, event) ~ data + new_model_by_liang_guo, :
参数'data'的种类(list)不对
这个错误来源于
model_Liang_Guo <- coxph(Surv(time, event)~data$new_model_by_liang_guo,data=data)
summary(model_Liang_Guo)
去掉datas$ 即可
ggDCA的包报错
由于survival包版本问题,从CRAN安装的ggDCA会报错(如上图)。
因此,要从作者的github上下载ggDCA
。
ggDCA安装
#1.安装devtools
install.packages("devtools")
#2.从github安装ggDCA
devtools::install_github('yikeshu0611/ggDCA')
#注:若是devtools::install_github('yikeshu0611/ggDCA')也报错,可先运行:
options(unzip ='internal')