R語(yǔ)言中na.fail和na.omit的用法
實(shí)際工作中,數(shù)據(jù)集很少是完整的,許多情況下樣本中都會(huì)包括若干缺失值NA,這在進(jìn)行數(shù)據(jù)分析和挖掘時(shí)比較麻煩。
R語(yǔ)言通過(guò)na.fail和na.omit可以很好地處理樣本中的缺失值
1、na.fail(<向量a>): 如果向量a內(nèi)包括至少1個(gè)NA,則返回錯(cuò)誤;如果不包括任何NA,則返回原有向量a
2、na.omit(<向量a>): 返回刪除NA后的向量a
3、attr( na.omit(<向量a>) ,”na.action”): 返回向量a中元素為NA的下標(biāo)
4、is.na:判斷向量?jī)?nèi)的元素是否為NA
example:
data<-c(1,2,NA,2,4,2,10,NA,9)
data.na.omit<-na.omit(data)
data.na.omit
[1] 1 2 2 4 2 10 9
attr(,"na.action")
[1] 3 8
attr(,"class")
[1] "omit"
attr(data.na.omit,"na.action")
[1] 3 8
attr(,"class")
[1] "omit"
另外還可以使用!x方式方便地刪除NA。
例如:
a<-c(1,2,3,NA,NA,2,NA,5)
a[!is.na(a)]
[1] 1 2 3 2 5
其中,is.na用于判斷向量?jī)?nèi)的元素是否為NA,返回結(jié)果:c(FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,TRUE,FALSE),即a內(nèi)元素為NA,其對(duì)應(yīng)的下標(biāo)元素是TRUE,反之是FALSE。
!x是取非邏輯運(yùn)算符,!is.na(a)表示a內(nèi)元素不為NA,其對(duì)應(yīng)的下標(biāo)元素是TRUE,反之是FALSE。
通過(guò)a[!is.na(a)]進(jìn)行索引后,即可取出a內(nèi)不為NA的元素,將其過(guò)濾。
其中,函數(shù)na.fail和 na.omit 不僅可以應(yīng)用于向量,也可以應(yīng)用于矩陣和數(shù)據(jù)框。
example:
data <- read.table(text=" a b c d e f NA 1 1 1 1 1 1 NA 1 1 1 1 1 1 NA 1 1 1 1 1 1 NA 1 1 1 1 1 1 NA 1 1 1 1 1 1 NA",header=T) na.omit(data) data >[1] a b c d e f <0 行> (或0-長(zhǎng)度的row.names)
補(bǔ)充:R語(yǔ)言移除缺失值 NA.RM
看代碼~
> a <- 2:12
> b <- seq(2,23,2)
> c <- c(1:11)^3
> d <- c(5:8, 30:36)
> df <- data.frame(a,b,c,d)
> df$a[df$a==8] <- NA
> df$b[df$b==8] <- NA
> df$c[df$c==8] <- NA
> df$d[df$d==8] <- NA
> df$d[df$d==32] <- NA
> df
a b c d
1 2 2 1 5
2 3 4 NA 6
3 4 6 27 7
4 5 NA 64 NA
5 6 10 125 30
6 7 12 216 31
7 NA 14 343 NA
8 9 16 512 33
9 10 18 729 34
10 11 20 1000 35
11 12 22 1331 36
// 只根據(jù)第四列,也就是d 的 NA,移除相應(yīng)的行
> bad.d <- is.na(df$d)
> bad.d
[1] FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE FALSE FALSE
> df[!bad.d,]
a b c d
1 2 2 1 5
2 3 4 NA 6
3 4 6 27 7
5 6 10 125 30
6 7 12 216 31
8 9 16 512 33
9 10 18 729 34
10 11 20 1000 35
11 12 22 1331 36
// 根據(jù)第二列和第三列的NA 移除相應(yīng)的行
> df[complete.cases(df[,2:3]),]
a b c d
1 2 2 1 5
3 4 6 27 7
5 6 10 125 30
6 7 12 216 31
7 NA 14 343 NA
8 9 16 512 33
9 10 18 729 34
10 11 20 1000 35
11 12 22 1331 36
// 根據(jù)第二列和 第四列的NA,移除相應(yīng)的行
> df[complete.cases(df[,c(2,4)]),]
a b c d
1 2 2 1 5
2 3 4 NA 6
3 4 6 27 7
5 6 10 125 30
6 7 12 216 31
8 9 16 512 33
9 10 18 729 34
10 11 20 1000 35
11 12 22 1331 36
// 根據(jù)所有列的NA,移除相應(yīng)的行
> df[complete.cases(df),]
a b c d
1 2 2 1 5
3 4 6 27 7
5 6 10 125 30
6 7 12 216 31
8 9 16 512 33
9 10 18 729 34
10 11 20 1000 35
11 12 22 1331 36
>
// 這個(gè)效果跟上面的df[complete.cases(df),] 相同
> na.omit(df)
a b c d
1 2 2 1 5
3 4 6 27 7
5 6 10 125 30
6 7 12 216 31
8 9 16 512 33
9 10 18 729 34
10 11 20 1000 35
11 12 22 1331 36
// 計(jì)算某一列的平均值, 移除NA值
> mean(df$d, na.rm=TRUE)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
- R語(yǔ)言實(shí)現(xiàn)用cbind合并兩列數(shù)據(jù)
- R語(yǔ)言中if(){}else{}語(yǔ)句和ifelse()函數(shù)的區(qū)別詳解
- R語(yǔ)言中ifelse、which、%in%的用法詳解
- 解決R語(yǔ)言中install_github中無(wú)法安裝遇到的問(wèn)題
- R語(yǔ)言ARMA模型的參數(shù)選擇說(shuō)明
- R語(yǔ)言-使用ifelse進(jìn)行數(shù)據(jù)分組
- R語(yǔ)言 實(shí)現(xiàn)選取某一行的最大值
- R語(yǔ)言-生成頻數(shù)表和列聯(lián)表crosstable函數(shù)介紹
相關(guān)文章
R語(yǔ)言實(shí)現(xiàn)LASSO回歸的方法
這篇文章主要介紹了R語(yǔ)言實(shí)現(xiàn)LASSO回歸的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
基于R語(yǔ)言賦值符號(hào)的區(qū)別說(shuō)明
這篇文章主要介紹了基于R語(yǔ)言賦值符號(hào)的區(qū)別說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04
R語(yǔ)言中其它對(duì)象知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家分享的是一篇關(guān)于R語(yǔ)言中其它對(duì)象知識(shí)點(diǎn)總結(jié)內(nèi)容,有需要的朋友們可以學(xué)習(xí)下。2021-03-03
R語(yǔ)言時(shí)間序列TAR閾值自回歸模型示例詳解
這篇文章主要介紹了R語(yǔ)言時(shí)間序列TAR閾值自回歸模型,本文通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03
R語(yǔ)言編程數(shù)學(xué)分析重讀微積分理解極限算法
這篇文章主要為大家介紹了R語(yǔ)言編程重讀微積分?jǐn)?shù)學(xué)分析理解極限算法的詳細(xì)過(guò)程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2021-10-10
R語(yǔ)言中set.seed()函數(shù)的作用詳解
set.seed()括號(hào)里面的參數(shù)可以是任意數(shù)字,是代表你設(shè)置的第幾號(hào)種子而已,不會(huì)參與運(yùn)算,是個(gè)標(biāo)記而已。,這篇文章主要介紹了R語(yǔ)言中set.seed()函數(shù)的作用,需要的朋友可以參考下2022-09-09
R語(yǔ)言繪圖數(shù)據(jù)可視化Ridgeline plot山脊圖畫(huà)法
這篇文章主要為大家介紹了R語(yǔ)言繪圖數(shù)據(jù)可視化Ridgeline plot山脊圖畫(huà)法的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助2022-02-02
R語(yǔ)言數(shù)據(jù)重塑知識(shí)點(diǎn)總結(jié)
在本篇文章里小編給大家整理的是一篇關(guān)于R語(yǔ)言數(shù)據(jù)重塑的相關(guān)知識(shí)點(diǎn)內(nèi)容,有興趣的朋友們可以跟著學(xué)習(xí)下。2021-03-03
R語(yǔ)言多元Logistic邏輯回歸應(yīng)用實(shí)例
這篇文章主要給大家介紹了關(guān)于R語(yǔ)言多元Logistic邏輯回歸應(yīng)用的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03

