python缺失值填充方法示例代碼
1.找到缺失值
導入數(shù)據(jù)集
df=pd.read_csv("nba.csv")
df.head(10)
替換異常值(數(shù)據(jù)集中異常值為“-”)
把數(shù)據(jù)集中的異常值用“NaN”替換
# 將空值形式的缺失值轉換成可識別的類型
data = data.replace('-', np.NaN)
2.計算缺失值的數(shù)量
用# isnull() 函數(shù),確認各列是否有缺失值1.
null_all = df.isnull().sum() print(null_all)

.sum();表示可以顯示各個列的缺失值數(shù)量。
null_all = df.isnull.any(axis=1)#表示那些行具有缺失值,
.any()表示只要按行或列計算,有缺失值就算入
.all()表示所在行或列全為缺失值才計入
.sum()表示計算列缺失值時,一列有多個缺失值,同理,計算行缺失,計算有多少個行。
3.處理缺失值
3.1:df.dropna():直接刪除行列
df表示數(shù)據(jù)集的名稱
- dropna(axis=0, how=‘any’, thresh=None, subset=None, inplace=False)
括號內(nèi)上述參數(shù)都是函數(shù)默認。
axis=0:表示對行進行刪除操作,axis=1:對列刪除進行操作
how=‘any’:表示維度 存在“缺失值”就刪除相應行/列操作;how=‘all’:進行相關行或列刪除操作時,只有所有維度缺失才刪除。
thresh=None:等于幾表示有幾個缺失值存在才會刪除所在的行或列。
inplace=False:表示對原來的數(shù)據(jù)集不進行操作,True時表示對原來的數(shù)據(jù)集也進行操作。
3.2:df.fillna()填充缺失值
- fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)
axis : {0 or ‘index’, 1 or ‘columns’}
method : {‘backfill’, ‘bfill’, ‘pad’, ‘ffill’, None}
pad’, ‘ffill:將前面的值填充于后面位置。
backfill’, 'bfill:表示將后面的值填充于前面位置。
data.fillna(data.mean())#平均值填充 data.fillna(data.median())#中位數(shù)填充
3.3:KNN填充
from sklearn.impute import KNNImputer imputer = KNNImputer(n_neighbors=4)#鄰居樣本求平均數(shù) df1=imputer.fit_transform(df)
4.查看數(shù)據(jù)集的末尾
df.tail(10)
查看末尾10行
總結
到此這篇關于python缺失值填充方法的文章就介紹到這了,更多相關python缺失值填充方法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
- Python數(shù)據(jù)預處理時缺失值的不同處理方式總結
- Python?數(shù)據(jù)清洗刪除缺失值替換缺失值詳情
- python?sklearn與pandas實現(xiàn)缺失值數(shù)據(jù)預處理流程詳解
- Python處理缺失值的8種不同方法實例
- Python缺失值處理方法
- Python3?DataFrame缺失值的處理方法
- python如何去除異常值和缺失值的插值
- Python?Pandas中缺失值NaN的判斷,刪除及替換
- Python數(shù)據(jù)分析之缺失值檢測與處理詳解
- Python數(shù)據(jù)分析的八種處理缺失值方法詳解
- python缺失值的解決方法總結
- Python中查找缺失值的三種方法
相關文章
TensorFlow實現(xiàn)創(chuàng)建分類器
這篇文章主要為大家詳細介紹了TensorFlow實現(xiàn)創(chuàng)建分類器,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-02-02
基于np.arange與np.linspace細微區(qū)別(數(shù)據(jù)溢出問題)
這篇文章主要介紹了基于np.arange與np.linspace細微區(qū)別(數(shù)據(jù)溢出問題),具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-05-05
Python爬蟲數(shù)據(jù)處理模塊的安裝使用教程
這篇文章主要為大家介紹了Python爬蟲數(shù)據(jù)處理模塊的安裝使用教程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-06-06
關于python 的legend圖例,參數(shù)使用說明
這篇文章主要介紹了關于python 的legend圖例,參數(shù)使用說明,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04
基于python框架Scrapy爬取自己的博客內(nèi)容過程詳解
這篇文章主要介紹了基于python框架Scrapy爬取自己的博客內(nèi)容過程詳解,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下2019-08-08
Python3數(shù)據(jù)庫操作包pymysql的操作方法
這篇文章主要介紹了Python3數(shù)據(jù)庫操作包pymysql的操作方法,文章通過實例代碼相結合給大家介紹的非常詳細,需要的朋友可以參考下2018-07-07

