使用Pandas修改DataFrame中某一列的值
寫這篇博客主要是因為在修改DataFrame列值的時候經(jīng)常遇到bug,但到目前還沒把這種錯誤復現(xiàn)出來。
DataFrame是Pandas中的主要數(shù)據(jù)結(jié)構(gòu)之一,本篇博客主要介紹如何DataFrame中某一列的值進行修改。
1 常規(guī)方法
這部分主要介紹修改DataFrame列值的常規(guī)方法。為了方便后續(xù)說明先構(gòu)建如下數(shù)據(jù):
import pandas as pd
import numpy as np
df=pd.DataFrame([['A',1],['B',2],['C',5],['D',4],['E',10],['F',13],['G',8]],
columns=['col_1','col_2'],
index=list('abcdefg'))
df結(jié)果如下:

- 使用常量修改DataFrame列的值
使用一個常量對DataFrame列中的數(shù)據(jù)進行修改時,代碼舉例如下:
df1=df.copy() df1['col_1']='H' df1.loc[['a','c','d'],'col_2']=100 #將指定索引的列值進行修改 df1.iloc[4:,-1]=200
df1的結(jié)果如下:

- 使用List\array修改DataFrame列的值
當需要對DataFrame列中的多個值進行修改時,可以使用List或array等變量型數(shù)據(jù)來對其進行修改。具體代碼如下:
df2=df.copy() df2['col_1']=list(range(7)) df2.loc[df2.index<='d','col_2']=np.array([15,20,25,30]) df2.iloc[4:,-1]=np.array([10,5,0])
df2的結(jié)果如下:

- 使用Series/DataFrame修改DataFrame列的值
除了以上兩種數(shù)據(jù)類型之外,還可以使用Series型數(shù)據(jù)來修改DataFrame列的值。但使用這種方法時,需要索引對齊,否則會出錯。具體舉例如下:
df3=df.copy()
df3['col_1']=pd.Series([1,2,3,4,5,6,7]) #索引不對齊時不會報錯,但沒有成功修改列值。
df3.loc[['a','b','c'],'col_2']=pd.Series([100,200,300],index=list('abc'))
df3.iloc[3:,-1]=pd.DataFrame([[4000],[5000],[6000],[7000]],index=list('cdef'))
其結(jié)果如下:

2. replace方法
DataFrame對象自帶的方法replace()也可以實現(xiàn)列值的修改。該方法中的參數(shù)主要有以下幾個:
| 參數(shù) | 作用 |
|---|---|
| to_replace | 確定需要修改列值的數(shù)據(jù)。可接受的數(shù)據(jù)類型有:str, regex, list, dict, Series, int, float, or None |
| value | 指定修改后的值??山邮艿臄?shù)據(jù)類型有:scalar, dict, list, str, regex, default None |
| inplace | 是否本地置換 |
| limit | 指定前后填充的最大次數(shù) |
| regex | 正則表達式符號。如果需要在to_replace中使用字符串形式的正則表達式對數(shù)據(jù)進行篩選的話,需要將其設(shè)置為True。 |
| method | 填充方式。‘pad’, ‘ffill’, ‘bfill’, None |
創(chuàng)建如下數(shù)據(jù),具體如下:
df=pd.DataFrame([['A','A'],['B','B'],['C',5],['D',4]],
columns=['col_1','col_2'],
index=list('abcd'))
df的結(jié)果如下:

- 對整個DataFrame中的指定數(shù)據(jù)進行替換
#A替換為aaa,B替換為bbb,4替換為100
df_1=df.replace(to_replace=['A','B',4],value=['aaa','bbb',100])
#將A替換為AAAA
df_2=df.replace(to_replace='A',value='AAAA')
#將A替換為AAAAA,5替換為2000
df_3=df.replace(to_replace={"A":'AAAAA',5:2000})
其結(jié)果如下:

- 對DataFrame中的不同列指定不同的替換方式
#對于col_1列:將A替換為1,B替換為2
#對于col_2列:將A替換為100,B替換為200
df_4=df.replace({"col_1":{'A':1,'B':2},"col_2":{"A":100,"B":200}})
其結(jié)果如下:

- 使用正則表達式篩選數(shù)據(jù)
#將A\B替換成new df_5=df.replace(to_replace=r'[AB]',value='new',regex=True)
其結(jié)果如下:

補充:DataFrame修改某一行某一列的值[坑點]
# df.iloc[index]['column_name'] = val 這種方式是錯誤的 df['column_name'].iloc[i] = val # 正確
總結(jié)
到此這篇關(guān)于使用Pandas修改DataFrame中某一列值的文章就介紹到這了,更多相關(guān)Pandas修改DataFrame某一列的值內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python實現(xiàn)RabbitMQ的消息隊列的示例代碼
這篇文章主要介紹了python實現(xiàn)RabbitMQ的消息隊列的示例代碼,總結(jié)了RabbitMQ中三種exchange模式的實現(xiàn),分別是fanout, direct和topic。感興趣的小伙伴們可以參考一下2018-11-11
OpenCV-Python直方圖均衡化實現(xiàn)圖像去霧
直方圖均衡化可以達到增強圖像顯示效果的目的。最常用的比如去霧。本文就來實現(xiàn)直方圖均衡化實現(xiàn)圖像去霧,感興趣的可以了解一下2021-06-06
Python+opencc庫實現(xiàn)簡體繁體字轉(zhuǎn)換
opencc就是一個非常好的中文字轉(zhuǎn)換庫,其中包含了非常豐富的對應(yīng)字詞表,本文主要介紹了如何使用opencc庫實現(xiàn)簡體繁體字轉(zhuǎn)換,感興趣的可以了解下2024-11-11
python數(shù)據(jù)可視化pygal模擬擲骰子實現(xiàn)示例
這篇文章主要為大家介紹了python數(shù)據(jù)可視化pygal模擬擲骰子實現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-06-06
python用selenium打開chrome瀏覽器保持登錄方式
大家好,本篇文章主要講的是python用selenium打開chrome瀏覽器保持登錄方式,感興趣的同學趕快來看一看吧,對你有幫助的話記得收藏一下2022-02-02

