Python Pandas中合并數(shù)據(jù)的5個(gè)函數(shù)使用詳解
前幾天在一個(gè)群里面,看到一位朋友,說(shuō)到自己的阿里面試,被問(wèn)了一些關(guān)于pandas的使用。其中一個(gè)問(wèn)題是:pandas中合并數(shù)據(jù)的5中方法。
今天借著這個(gè)機(jī)會(huì),就為大家盤點(diǎn)一下pandas中合并數(shù)據(jù)的5個(gè)函數(shù)。但是對(duì)于每個(gè)函數(shù),我這里不打算詳細(xì)說(shuō)明,具體用法大家可以參考pandas官當(dāng)文檔。
- join主要用于基于索引的橫向合并拼接;
- merge主要用于基于指定列的橫向合并拼接;
- concat可用于橫向和縱向合并拼接;
- append主要用于縱向追加;
- combine可以通過(guò)使用函數(shù),把兩個(gè)DataFrame按列進(jìn)行組合。
join
join是基于索引的橫向拼接,如果索引一致,直接橫向拼接。如果索引不一致,則會(huì)用Nan值填充。
索引一致
x = pd.DataFrame({'A': ['A0', 'A1', 'A2'],
'B': ['B0', 'B1', 'B2']},
index=[0, 1, 2])
y = pd.DataFrame({'C': ['C0', 'C2', 'C3'],
'D': ['D0', 'D2', 'D3']},
index=[0, 1, 2])
x.join(y)結(jié)果如下:

索引不一致
x = pd.DataFrame({'A': ['A0', 'A1', 'A2'],
'B': ['B0', 'B1', 'B2']},
index=[0, 1, 2])
y = pd.DataFrame({'C': ['C0', 'C2', 'C3'],
'D': ['D0', 'D2', 'D3']},
index=[1, 2, 3])
x.join(y)結(jié)果如下:

merge
merge是基于指定列的橫向拼接,該函數(shù)類似于關(guān)系型數(shù)據(jù)庫(kù)的連接方式,可以根據(jù)一個(gè)或多個(gè)鍵將不同的DatFrame連接起來(lái)。該函數(shù)的典型應(yīng)用場(chǎng)景是,針對(duì)同一個(gè)主鍵存在兩張不同字段的表,根據(jù)主鍵整合到一張表里面。
可以指定不同的how參數(shù),表示連接方式,有inner內(nèi)連、left左連、right右連、outer全連,默認(rèn)為inner;
x = pd.DataFrame({'姓名': ['張三', '李四', '王五'],
'班級(jí)': ['一班', '二班', '三班']})
y = pd.DataFrame({'專業(yè)': ['統(tǒng)計(jì)學(xué)', '計(jì)算機(jī)', '繪畫(huà)'],
'班級(jí)': ['一班', '三班', '四班']})
pd.merge(x,y,how="left")結(jié)果如下:

concat
concat函數(shù)既可以用于橫向拼接,也可以用于縱向拼接。
縱向拼接
x = pd.DataFrame([['Jack','M',40],['Tony','M',20]], columns=['name','gender','age']) y = pd.DataFrame([['Mary','F',30],['Bob','M',25]], columns=['name','gender','age']) z = pd.concat([x,y],axis=0) z
結(jié)果如下:

橫向拼接
x = pd.DataFrame({'姓名': ['張三', '李四', '王五'],
'班級(jí)': ['一班', '二班', '三班']})
y = pd.DataFrame({'專業(yè)': ['統(tǒng)計(jì)學(xué)', '計(jì)算機(jī)', '繪畫(huà)'],
'班級(jí)': ['一班', '三班', '四班']})
z = pd.concat([x,y],axis=1)
z結(jié)果如下:

append
append主要用于縱向追加數(shù)據(jù)。
x = pd.DataFrame([['Jack','M',40],['Tony','M',20]], columns=['name','gender','age']) y = pd.DataFrame([['Mary','F',30],['Bob','M',25]], columns=['name','gender','age']) x.append(y)
結(jié)果如下:

combine
conbine可以通過(guò)使用函數(shù),把兩個(gè)DataFrame按列進(jìn)行組合。
x = pd.DataFrame({"A":[3,4],"B":[1,4]})
y = pd.DataFrame({"A":[1,2],"B":[5,6]})
x.combine(y,lambda a,b:np.where(a>b,a,b))結(jié)果如下:

注:上述函數(shù),用于返回對(duì)應(yīng)位置上的最大值。
到此這篇關(guān)于Python Pandas中合并數(shù)據(jù)的5個(gè)函數(shù)使用詳解的文章就介紹到這了,更多相關(guān)Python Pandas合并數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
利用Python實(shí)現(xiàn)普通視頻變成動(dòng)漫視頻
這篇文章主要為大家詳細(xì)介紹了如何利用Python語(yǔ)言實(shí)現(xiàn)普通視頻變成動(dòng)漫視頻效果,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以了解一下2022-08-08
python pandas中對(duì)Series數(shù)據(jù)進(jìn)行軸向連接的實(shí)例
今天小編就為大家分享一篇python pandas中對(duì)Series數(shù)據(jù)進(jìn)行軸向連接的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-06-06
Jupyter Notebook讀取csv文件出現(xiàn)的問(wèn)題及解決
這篇文章主要介紹了Jupyter Notebook讀取csv文件出現(xiàn)的問(wèn)題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-01-01
python中的print()函數(shù)end=' '的使用及說(shuō)明
這篇文章主要介紹了python中的print()函數(shù)end=' '的使用及說(shuō)明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-02-02
python如何使用pywebview打造一個(gè)現(xiàn)代化的可視化GUI界面詳解
pywebview是一個(gè)輕量級(jí)的跨平臺(tái)庫(kù),它可以讓你在Python程序中嵌入一個(gè)瀏覽器窗口,下面這篇文章主要給大家介紹了關(guān)于python如何使用pywebview打造一個(gè)現(xiàn)代化的可視化GUI界面的相關(guān)資料,需要的朋友可以參考下2024-07-07
Go語(yǔ)言基于Socket編寫服務(wù)器端與客戶端通信的實(shí)例
這篇文章主要介紹了Go語(yǔ)言基于Socket編寫服務(wù)器端與客戶端通信的實(shí)例,包括實(shí)現(xiàn)基于自定義通訊協(xié)議的Socket通信,需要的朋友可以參考下2016-02-02

