R語(yǔ)言實(shí)現(xiàn)漂亮的ROC圖效果
pROC是一個(gè)專(zhuān)門(mén)用來(lái)計(jì)算和繪制ROC曲線的R包,目前已被CRAN收錄,因此安裝也非常簡(jiǎn)單,同時(shí)該包也兼容ggplot2函數(shù)繪圖,本次就教大家怎么用pROC來(lái)快速畫(huà)出ROC圖。在醫(yī)學(xué)領(lǐng)域主要用于判斷某種因素對(duì)于某種疾病的診斷是否有診斷價(jià)值。什么是ROC曲線和AUC,以及如何去看ROC曲線的結(jié)果,可以這樣總結(jié):ROC曲線呢,其實(shí)就是每個(gè)對(duì)應(yīng)的cutoff值都有一個(gè)對(duì)應(yīng)的真陽(yáng)性率(縱坐標(biāo))和假陽(yáng)性率(橫坐標(biāo)),比如選擇了10個(gè)cutoff值,那就相當(dāng)于有個(gè)10個(gè)點(diǎn),把這些點(diǎn)連成一條線就是ROC曲線。AUC值就是ROC曲線下的面積,一般認(rèn)為AUC值在0.7~1之間,模型預(yù)測(cè)的結(jié)果才有效。TPR(真陽(yáng)性率) = TP(真陽(yáng))/(TP(真陽(yáng)) + FN(假陰)),F(xiàn)PR(假陽(yáng)性率) = FP(假陽(yáng)) / (FP(假陽(yáng)) + TN(真陰))。 比如下面的一個(gè)模型預(yù)測(cè)后的數(shù)據(jù)結(jié)果:

上圖中如果選cutoff值為0.5時(shí) TPR = 5 /(5 + 0)= 1, FPR = 2 / (2 + 3) = 0.4, 預(yù)測(cè)的準(zhǔn)確性 = (TP + TN )/ 總的樣本數(shù) = (5 + 3)/10 = 0.8
好了,話不多說(shuō),我們直接上代碼
1.讀取數(shù)據(jù)
library(openxlsx)
ROC <- read.xlsx("ROC曲線.xlsx")2.AUC和CI的計(jì)算
library(pROC)
## roc的計(jì)算,可以一次性批量計(jì)算a、b、c三組數(shù)據(jù)
res<-roc(outcome~a+b+c,data=ROC,aur=TRUE,
ci=TRUE, # 顯示95%CI
# percent=TRUE, ##是否需要以百分比顯示
levels=c('group1','group2'),direction=">" #設(shè)置分組方向
)
## 平滑曲線的ROC結(jié)果
smooth<-roc(outcome~a+b+c,data=ROC,aur=TRUE,
ci=TRUE, # 顯示95%CI
# percent=TRUE, ##是否需要以百分比顯示
smooth=TRUE,
levels=c('group1','group2'),direction=">" #設(shè)置分組方向
)顯示非平滑ROC曲線的結(jié)果
res
Call:
roc.formula(formula = outcome ~ a, data = ROC, aur = TRUE, ci = TRUE, levels = c("group1", "group2"), direction = ">")
Data: a in 40 controls (outcome group1) > 32 cases (outcome group2).
Area under the curve: 0.7328
95% CI: 0.6171-0.8485 (DeLong)
$b
Call:
roc.formula(formula = outcome ~ b, data = ROC, aur = TRUE, ci = TRUE, levels = c("group1", "group2"), direction = ">")
Data: b in 40 controls (outcome group1) > 32 cases (outcome group2).
Area under the curve: 0.8234
95% CI: 0.7303-0.9165 (DeLong)
$c
Call:
roc.formula(formula = outcome ~ c, data = ROC, aur = TRUE, ci = TRUE, levels = c("group1", "group2"), direction = ">")
Data: c in 40 controls (outcome group1) > 32 cases (outcome group2).
Area under the curve: 0.9242
95% CI: 0.8679-0.9805 (DeLong)3.利用ggplot2繪圖
library(ggplot2)
pa<- ggroc(smooth$a,
legacy.axes = TRUE # 將X軸改為0-1,(默認(rèn)是1-0)
)+
geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1),
color="darkgrey", linetype=4)+
theme_bw() +# 設(shè)置背景
ggtitle('a-ROC')
pb<- ggroc(smooth$b, legacy.axes = TRUE)+geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1), color="darkgrey", linetype=4)+theme_bw() +ggtitle('b-ROC')
pc<- ggroc(smooth$c, legacy.axes = TRUE)+geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1), color="darkgrey", linetype=4)+theme_bw() +ggtitle('c-ROC')
cowplot::plot_grid(pa,pb,pc,labels = "AUTO",nrow = 1)
4.合并多個(gè)ROC曲線結(jié)果
ggroc(smooth, legacy.axes = TRUE)+
geom_segment(aes(x = 0, xend = 1, y = 0, yend = 1), color="darkgrey", linetype=4)+
theme_bw()+ggtitle('ROC')+ggsci::scale_color_lancet()+
annotate("text",x=0.75,y=0.125,label=paste("a-AUC = ", round(res$a$auc,3)))+
annotate("text",x=0.75,y=0.25,label=paste("b-AUC = ", round(res$b$auc,3)))+
annotate("text",x=0.75,y=0.375,label=paste("c-AUC = ", round(res$c$auc,3)))
到此這篇關(guān)于R語(yǔ)言實(shí)現(xiàn)漂亮的ROC圖的文章就介紹到這了,更多相關(guān)R語(yǔ)言 ROC圖內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
R語(yǔ)言中data.frame的常用操作總結(jié)
這篇文章主要介紹了R語(yǔ)言中data.frame的常用操作總結(jié),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04
R語(yǔ)言如何將大型Excel文件轉(zhuǎn)為dta格式詳解
這篇文章主要給大家介紹了關(guān)于R語(yǔ)言如何將大型Excel文件轉(zhuǎn)為dta格式的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
詳解R語(yǔ)言實(shí)現(xiàn)前向逐步回歸(前向選擇模型)
本文主要介紹了詳解R語(yǔ)言實(shí)現(xiàn)前向逐步回歸,從實(shí)現(xiàn)原理開(kāi)始,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-08-08

