使用R語(yǔ)言填補(bǔ)缺失值的方法
使用R語(yǔ)言填補(bǔ)缺失值
數(shù)據(jù)處理過(guò)程中,往往會(huì)存在缺失值,對(duì)于缺失值的處理,目前各大統(tǒng)計(jì)書(shū)提出的方法有剔除,用均數(shù)填補(bǔ),用眾數(shù)填補(bǔ),采用其他自變量進(jìn)行回歸,推算缺失值進(jìn)行填補(bǔ)等。在R語(yǔ)言中如何按要求進(jìn)行填補(bǔ)?下面將介紹如何進(jìn)行缺失值填補(bǔ)的各種方法
用某特定值替換缺失值
下面這段代碼表示使用0填補(bǔ)缺失值,x是需要填補(bǔ)的數(shù)據(jù)框的某行或某列,如果是其他值,將0改成需要的值即可。
FillNA <- function(x){
x[is.na(x )]<- 0;
x
}
使用均值,眾數(shù),中位數(shù)進(jìn)行填補(bǔ)
該過(guò)程函數(shù)是一樣的,只需要將后續(xù)填補(bǔ)要用的值進(jìn)行修正即可。
library(data.table)
library(dplyr)
library(tidyverse)
#data.table
setDT(data)
data[,names(data):=lapply(.SD,function(x){x[is.na(x)] <- getmode(x)
x})]
#dplyr
data %>%
mutate_all(function(x){x[is.na(x)] <- getmode(x)
x})
dplyr_if_else <- function(x) { mutate_all(x, ~if_else(is.na(.), 0, .)) }
#tidyverse
df %>%
select(Pclass, Sex, SibSp, Embarked) %>%
map_dfc(~ replace_na(.x, rstatix::get_mode(.x)[1]))
到此這篇關(guān)于使用R語(yǔ)言填補(bǔ)缺失值的方法的文章就介紹到這了,更多相關(guān)R語(yǔ)言填補(bǔ)缺失值內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
R語(yǔ)言數(shù)據(jù)框中的負(fù)索引介紹
這篇文章主要介紹了R語(yǔ)言數(shù)據(jù)框中的負(fù)索引介紹,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-04-04
R語(yǔ)言 實(shí)現(xiàn)list類(lèi)型數(shù)據(jù)轉(zhuǎn)換
這篇文章主要介紹了R語(yǔ)言 實(shí)現(xiàn)list類(lèi)型數(shù)據(jù)轉(zhuǎn)換,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03
R語(yǔ)言基本對(duì)象類(lèi)型知識(shí)點(diǎn)詳解
在本篇文章里小編給大家整理了一篇關(guān)于R語(yǔ)言基本對(duì)象類(lèi)型知識(shí)點(diǎn)詳解內(nèi)容,有興趣的朋友們學(xué)習(xí)下。2021-03-03
R語(yǔ)言統(tǒng)計(jì)結(jié)果輸出至本地文件的幾種方法示例
這篇文章主要給大家介紹了關(guān)于R語(yǔ)言統(tǒng)計(jì)結(jié)果輸出至本地文件的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
R語(yǔ)言基本畫(huà)圖函數(shù)與多圖多線的用法
這篇文章主要介紹了R語(yǔ)言基本畫(huà)圖函數(shù)與多圖多線的用法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03
R語(yǔ)言 實(shí)現(xiàn)data.frame 分組計(jì)數(shù)、求和等
這篇文章主要介紹了R語(yǔ)言 實(shí)現(xiàn)data.frame 分組計(jì)數(shù)、求和等操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03
解決R語(yǔ)言報(bào)錯(cuò):Error?in?y?+?1:non-numeric?argument?to?binary
R語(yǔ)言編程中的常見(jiàn)錯(cuò)誤有一些錯(cuò)誤是R的初學(xué)者和經(jīng)驗(yàn)豐富的R程序員都可能常犯的,下面這篇文章主要給大家介紹了關(guān)于解決R語(yǔ)言報(bào)錯(cuò):Error?in?y?+?1:non-numeric?argument?to?binary?operator的相關(guān)資料,需要的朋友可以參考下2022-11-11

