Pandas數(shù)據(jù)連接pd.concat的實(shí)現(xiàn)

更新時間：2022年07月22日 15:55:31 作者：山茶花開時。

本文主要介紹了Pandas數(shù)據(jù)連接pd.concat的實(shí)現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

objs: 需要連接的數(shù)據(jù)，可以是多個DataFrame或者Series，它是必傳參數(shù)
axis: 連接軸的方法，默認(rèn)值為0，即按行連接，追加在行后面;值為1時追加到列后面(按列連接:axis=1)
join: 合并方式，其他軸上的數(shù)據(jù)是按交集(inner)還是并集(outer)進(jìn)行合并
ignore_index: 是否保留原來的索引
keys: 連接關(guān)系，使用傳遞的鍵作為最外層級別來構(gòu)造層次結(jié)構(gòu)索引，就是給每個表指定一個一級索引
names: 索引的名稱，包括多層索引
verify_integrity: 是否檢測內(nèi)容重復(fù);參數(shù)為True時，如果合并的數(shù)據(jù)與原數(shù)據(jù)包含索引相同的行，則會報(bào)錯
copy: 如果為False，則不要深拷貝

1.按行連接

pd.concat()的基本操作可以實(shí)現(xiàn)df.append()功能

操作中ignore_index和sort參數(shù)的作用是一樣的,axis默認(rèn)取值為0，即按行連接

import pandas as pd
df1 = pd.DataFrame({'x':[1,2],'y':[3,4]})
df2 = pd.DataFrame({'x':[5,6],'y':[7,8]})
res1 = pd.concat([df1,df2])
# 效果同上
res2 = df1.append(df2)

df1

df2

res1

res2

2.按列連接

如果要將多個DataFrame按列拼接在一起，可以傳入axis=1參數(shù)，這會將不同的數(shù)據(jù)追加到列的后面，索引無法對應(yīng)的位置上將值填充為NaN

import pandas as pd
df1 = pd.DataFrame({'x':[1,2],'y':[3,4]})
df2 = pd.DataFrame({'x':[5,6,0],'y':[7,8,0]})
res = pd.concat([df1,df2], axis=1)

df1

df2

res

該例子中，df2比df1多一行，合并后df1的部分為NaN

3.合并交集

上述兩個練習(xí)案例的連接操作會得到兩個表內(nèi)容的并集(默認(rèn)是join='outer')

合并交集需要將join參數(shù)進(jìn)行改變 join='inner'

import pandas as pd
df1 = pd.DataFrame({'x':[1,2],'y':[3,4]})
df2 = pd.DataFrame({'x':[5,6,0],'y':[7,8,0]})
# 按列合并交集
# 傳入join='inner'取得兩個DataFrame的共有部分，去除了df1沒有的第三行內(nèi)容
res = pd.concat([df1,df2], axis=1, join='inner')

df1

df2

res

擴(kuò)展

通過reindex()方法也可以實(shí)現(xiàn)取交集功能

# 兩種方法
res1 = pd.concat([df1,df2],axis=1).reindex(df1.index)
res2 = pd.concat([df1,df2.reindex(df1.index)],axis=1)

res1

res2

4.與序列合并

import pandas as pd
z = pd.Series([9,9],name='z')
df = pd.DataFrame({'x':[1,2],'y':[3,4]})
# 將序列加到新列
res = pd.concat([df,z],axis=1)

res

5.指定索引

import pandas as pd
df1 = pd.DataFrame({'x':[1,2],'y':[3,4]})
df2 = pd.DataFrame({'x':[5,6],'y':[7,8]})
# 指定索引名
res1 = pd.concat([df1,df2], keys=['a','b'])
# 以字典形式傳入
dict = {'a':df1, 'b':df2}
res2 = pd.concat(dict)
# 橫向合并，指定索引
res3 = pd.concat([df1,df2], axis=1, keys=['a','b'])

df1

df2

res1

res2

res3

到此這篇關(guān)于Pandas數(shù)據(jù)連接pd.concat的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Pandas數(shù)據(jù)連接pd.concat內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: