詳解pandas使用drop_duplicates去除DataFrame重復(fù)項(xiàng)參數(shù)
Pandas之drop_duplicates:去除重復(fù)項(xiàng)
方法
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
參數(shù)
這個drop_duplicate方法是對DataFrame格式的數(shù)據(jù),去除特定列下面的重復(fù)行。返回DataFrame格式的數(shù)據(jù)。
- subset : column label or sequence of labels, optional 用來指定特定的列,默認(rèn)所有列
- keep : {‘first', ‘last', False}, default ‘first' 刪除重復(fù)項(xiàng)并保留第一次出現(xiàn)的項(xiàng)
- inplace : boolean, default False 是直接在原來數(shù)據(jù)上修改還是保留一個副本
DataFrame中存在重復(fù)的行或者幾行中某幾列的值重復(fù),這時候需要去掉重復(fù)行,示例如下:
data.drop_duplicates(subset=['A','B'],keep='first',inplace=True)
代碼中subset對應(yīng)的值是列名,表示只考慮這兩列,將這兩列對應(yīng)值相同的行進(jìn)行去重。默認(rèn)值為subset=None表示考慮所有列。
keep='first'表示保留第一次出現(xiàn)的重復(fù)行,是默認(rèn)值。keep另外兩個取值為"last"和False,分別表示保留最后一次出現(xiàn)的重復(fù)行和去除所有重復(fù)行。
inplace=True表示直接在原來的DataFrame上刪除重復(fù)項(xiàng),而默認(rèn)值False表示生成一個副本。
將副本賦值給dataframe:
data=data.drop_duplicates(subset=None,keep='first',inplace=False)
這一行代碼與文章開頭提到的那行代碼效果等效,但是如果在該DataFrame上新增一列:
data['extra']=test_data['item_price_level']
就會報(bào)如下錯誤:
SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
所以如果想對DataFrame去重,最好采用開頭提到的那行代碼。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Pandas去除重復(fù)項(xiàng)函數(shù)詳解drop_duplicates()
- Pandas之使用drop_duplicates:去除重復(fù)項(xiàng)
- Pandas 中的 drop_duplicates()詳解
- pandas重復(fù)行刪除操作df.drop_duplicates和df.duplicated的區(qū)別
- Python?Pandas中DataFrame.drop_duplicates()刪除重復(fù)值詳解
- pandas.DataFrame.drop_duplicates 用法介紹
- Pandas之drop_duplicates:去除重復(fù)項(xiàng)方法
- pandas的drop_duplicates無法去重問題解決
相關(guān)文章
pandas讀取Excel批量轉(zhuǎn)換時間戳的實(shí)踐
本文主要介紹了pandas讀取Excel批量轉(zhuǎn)換時間戳的實(shí)踐,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02
python實(shí)現(xiàn)有序遍歷dict(字典)
這篇文章主要介紹了python實(shí)現(xiàn)有序遍歷dict(字典),具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-08-08
詳解基于django實(shí)現(xiàn)的webssh簡單例子
這篇文章主要介紹了基于 django 實(shí)現(xiàn)的 webssh 簡單例子,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2018-07-07
python 計(jì)算一個字符串中所有數(shù)字的和實(shí)例
今天小編就為大家分享一篇python 計(jì)算一個字符串中所有數(shù)字的和實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06
python安裝包出現(xiàn)Retrying?(Retry(total=4,?connect=None,?read=No
這篇文章主要給大家介紹了關(guān)于python安裝包出現(xiàn)Retrying?(Retry(total=4,?connect=None,?read=None,?redirect=None,?status=None))問題的解決方法,需要的朋友可以參考下2022-09-09

