詳解pandas如何去掉、過濾數(shù)據(jù)集中的某些值或者某些行?
摘要在進(jìn)行數(shù)據(jù)分析與清理中,我們可能常常需要在數(shù)據(jù)集中去掉某些異常值。具體來說,看看下面的例子。

0.導(dǎo)入我們需要使用的包
import pandas as pd
pandas是很常用的數(shù)據(jù)分析,數(shù)據(jù)處理的包。anaconda已經(jīng)有這個(gè)包了,純凈版python的可以自行pip安裝。
1.去掉某些具體值
數(shù)據(jù)集df中,對(duì)于屬性appPlatform(最后一列),我們想刪除掉取值為2的那些樣本。如何做?非常簡單。
import pandas as pd
df[(True-df['appPlatform'].isin([2]))]

當(dāng)然,有時(shí)候我們需要去掉不止一個(gè)值,這個(gè)時(shí)候只需要在isin([])的列表中添加。更具體來說,例如,對(duì)于appID這個(gè)屬性,我們想去掉appID=278和appID=382的樣本。
df[(True-df['appID'].isin([278,382]))]

另外,我們有時(shí)候并不只是考慮某一列,還需要考慮另外若干列的情況。例如,我們需要過濾掉appPlatform=2而且appID=278和appID=382的樣本呢?非常簡單。
df[(True-df['appID'].isin([278,382]))&(True-df['appPlatform'].isin([2]))]
其實(shí),在這里我們看到,就是由兩部分組成的,第一部分就是appID中等于278和382的,另外一部分就是appPlatform中等于2的。兩者取邏輯關(guān)系 與(&)

2.過濾掉某個(gè)范圍的值
上面我們是了解了如何取掉某個(gè)具體值,下面,我們要看看如何過濾掉某個(gè)范圍的值。對(duì)于數(shù)據(jù)集df,我們想過濾掉creativeID(第一列)中ID值大于10000的樣本。
df[df['creativeID']<=10000]

另外,如果要考慮多列的話,其實(shí)和上面一樣,將兩種情況做邏輯與(&)就可以,不過值得注意的是,每個(gè)條件要用括號(hào)()括起來。
以上所述是小編給大家介紹的pandas如何去掉、過濾數(shù)據(jù)集中的某些值或者某些行詳解整合,希望對(duì)大家有所幫助,如果大家有任何疑問請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
相關(guān)文章
在Windows中定時(shí)執(zhí)行Python腳本的詳細(xì)教程
在Windows系統(tǒng)中,定時(shí)執(zhí)行Python腳本是一個(gè)常見需求,特別是在需要自動(dòng)化數(shù)據(jù)處理、監(jiān)控任務(wù)或周期性維護(hù)等場景中,本文將結(jié)合實(shí)際案例,詳細(xì)介紹如何在Windows中通過任務(wù)計(jì)劃程序(Task Scheduler)來實(shí)現(xiàn)定時(shí)執(zhí)行Python腳本的功能,需要的朋友可以參考下2024-08-08
精心整理總結(jié)的Python自動(dòng)化測試面試題
簡單來說,自動(dòng)化測試框架包含了所有的測試工作所需的測試框架,下面這篇文章主要給大家介紹了關(guān)于Python自動(dòng)化測試面試題的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-02-02
Python基礎(chǔ)之pandas數(shù)據(jù)合并
這篇文章主要介紹了Python基礎(chǔ)之pandas數(shù)據(jù)合并,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python基礎(chǔ)的小伙伴們有非常好的幫助,需要的朋友可以參考下2021-04-04
1 行 Python 代碼快速實(shí)現(xiàn) FTP 服務(wù)器
FTP 服務(wù)器,在此之前我都是使用Linux的vsftpd軟件包來搭建FTP服務(wù)器的,現(xiàn)在發(fā)現(xiàn)了利用pyftpdlib可以更加簡單的方法即可實(shí)現(xiàn)FTP服務(wù)器的功能。下面小編給大家?guī)砹? 行 Python 代碼快速實(shí)現(xiàn) FTP 服務(wù)器,需要的朋友參考下2018-01-01

