用R語言繪制ROC曲線的實(shí)例講解
1 roc曲線的意義
ROC曲線就是用來判斷診斷的正確性,最理想的就是曲線下的面積為1,比較理想的狀態(tài)就是曲線下的面積在0.8-0.9之間,0.5的話對實(shí)驗(yàn)結(jié)果沒有什么影響。
如圖:

2代碼部分
install.packages(“pROC”) install.packages(“ggplot2”) library(pROC) library(ggplot2) #建立曲線 data(aSAH) rocobj1<-roc(aSAHo u t c o m e , a S A H outcome,aSAHoutcome,aSAHs100b) rocobj2<-roc(aSAHo u t c o m e , a S A H outcome,aSAHoutcome,aSAHwfns) rocobj3<-roc(aSAHo u t c o m e , a S A H outcome,aSAHoutcome,aSAHndka) #計(jì)算full AUC auc(rocobj1) auc(rocobj2) auc(rocobj3) #繪制曲線 plot(rocobj1) #其他參數(shù)美化 plot(rocobj1,print.auc=TRUE,auc.polygon=TRUE,grid=c(0.1,0.2),grid.col=c(“green”,“red”),max.auc.polygon=TRUE,auc.polygon.col=“skyblue”,print.thres=TRUE) #計(jì)算partial AUC選擇關(guān)注一定范圍數(shù)據(jù) plot(rocobj1,print.auc=TRUE,auc.polygon=TRUE,partial.auc=c(0.8,0.4),partial.auc.focus=“sp”,grid=c(0.1,0.2),grid.col=c(“green”,“red”),max.auc.polygon=TRUE,auc.polygon.col=“skyblue”,print.thres=TRUE,reuse.auc=FALSE) #比較兩個(gè)曲線,pROC提供三種方法比較“delong”, “bootstrap”或“venkatraman” roc.test(rocobj1,rocobj2,method = “bootstrap”) #ggroc(功能仍在測試中)繪制Multiple curves g3<-ggroc(list(s100b=rocobj,wfns=rocobj2,ndka=rocobj3)) g3 install.packages(“pROC”) library(“pROC”)##roc data(aSAH) roc1<-roc(myDatal a b e l , m y D a t a label,myDatalabel,myDatascore) roc2<-roc(myData2l a b e l , m y D a t a 2 label,myData2label,myData2score) polt(roc1,col=“blue”) polt.roc(roc2,add=TRUE,col=“red”)
3 實(shí)驗(yàn)結(jié)果

補(bǔ)充:R語言proc包繪制多重ROC曲線(信用評分應(yīng)用,已有l(wèi)abel和相應(yīng)score)
數(shù)據(jù):好壞標(biāo)簽label、用四種model簡單計(jì)算出的每一個(gè)樣本的score,標(biāo)記為pre1至pre4,約1w樣本
目的:使用proc包繪制ROC曲線,并生成AUC值
1.讀入數(shù)據(jù)
data<-read.csv(file="D:/個(gè)人消費(fèi)信用/第三次上機(jī)/工作簿2.csv",header=T)
header=T 即在讀取中,將原有數(shù)據(jù)的第一行設(shè)置為變量名。
注意文件的分隔為 “ / ”,與默認(rèn)不同。
2.畫出最基本的ROC曲線
library(pROC) #加載pROC包 roc1<-roc(data$label,data$pre1) plot(roc1,print.auc=TRUE,plot=TRUE, print.thres=TRUE)

包含AUC的值和最優(yōu)臨界點(diǎn),下面把它美化一下~
(問題:為啥橫坐標(biāo)Specificity的范圍是1.5到-0.5,查了一下沒有找到原因,可能是因?yàn)樵瓟?shù)據(jù)本身的問題,以前以違約概率而非score的時(shí)候沒有出現(xiàn)這個(gè)問題,擇日探究……TvT)
3.美化ROC曲線
plot(roc2,print.auc=TRUE,print.auc.x=0.4,print.auc.y=0.4,auc.polygon=TRUE,auc.polygon.col="gray",
smooth=TRUE,
grid=c(0.5, 0.2),
grid.col=c("black", "black"),
max.auc.polygon=TRUE,
print.thres=TRUE,print.thres.cex=0.8,
lty=1,main=" ROC曲線",mfrow=c(1,1))

解釋在括號里面疊加命令的代碼:
print.auc.x=0.4,print.auc.y=0.4 #設(shè)置AUC值顯示出來的坐標(biāo) auc.polygon=TRUE,auc.polygon.col="gray" #設(shè)置ROC曲線下填充色,此處設(shè)定為灰色 smooth=TRUE #使ROC曲線變得光滑 max.auc.polygon=TRUE #整個(gè)圖像填充 print.thres.cex=0.8 #設(shè)置最優(yōu)臨界點(diǎn)字體的大小 lty=1,main=" ROC曲線",mfrow=c(1,1) #設(shè)置標(biāo)題啥的 mfrow貌似是圖形參數(shù),待查……
4.合并ROC曲線
由于共有4個(gè)model,所以要想比較模型的優(yōu)劣,可以將四個(gè)ROC曲線畫到一起。
roc1<- roc(data$label,data$pre1)
roc2<- roc(data$label,data$pre2)
roc3<- roc(data$label,data$pre3)
roc4<- roc(data$label,data$pre4)
plot(roc1, print.auc=TRUE,print.auc.x=0.4,print.auc.y=0.4, auc.polygon=TRUE,auc.polygon.col="gray", grid=c(0.5, 0.2),smooth=T,grid.col=c("black", "black"), max.auc.polygon=TRUE)
plot.roc(roc2,add=T,col="red", print.auc=TRUE,print.auc.x=0.3,print.auc.y=0.3)
plot.roc(roc3,add=T,col="blue",print.auc=TRUE,print.auc.x=0.5,print.auc.y=0.5)
plot.roc(roc4,add=T,col="yellow",print.auc=TRUE,print.auc.x=0.6,print.auc.y=0.6)
由于此處要顯示AUC值,且不要重合~所以在后面加上了print.auc=TRUE,print.auc.x=0.6,print.auc.y=0.6的命令。
如果不重合的話,直接在roc1下面加上下列代碼即可:
plot.roc(roc2,add=T,col="red")
由于原有數(shù)據(jù)的問題,這里的四條ROC曲線幾乎重合~但此處只是介紹pROC包繪制ROC曲線的用法。就不要太在意遼!

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
R語言安裝以及手動(dòng)安裝devtools的詳細(xì)圖文教程
R語言是一個(gè)強(qiáng)大的數(shù)據(jù)分析工具,其強(qiáng)大之處在于有各種各樣的R包幫助其實(shí)現(xiàn)各種各樣的功能,下面這篇文章主要給大家介紹了關(guān)于R語言安裝以及手動(dòng)安裝devtools的相關(guān)資料,需要的朋友可以參考下2022-08-08
R語言統(tǒng)計(jì)結(jié)果輸出至本地文件的幾種方法示例
這篇文章主要給大家介紹了關(guān)于R語言統(tǒng)計(jì)結(jié)果輸出至本地文件的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
R語言實(shí)現(xiàn)二進(jìn)制文件讀寫操作
這篇文章主要介紹了R語言實(shí)現(xiàn)二進(jìn)制文件讀寫操作,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
基于R/RStudio中安裝包“無法與服務(wù)器建立連接”的解決方案
這篇文章主要介紹了基于R/RStudio中安裝包“無法與服務(wù)器建立連接”的解決方案,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-04-04
R語言-生成頻數(shù)表和列聯(lián)表crosstable函數(shù)介紹
這篇文章主要介紹了R語言-生成頻數(shù)表和列聯(lián)表crosstable函數(shù)介紹,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-04-04

