python進(jìn)行數(shù)據(jù)合并concat/merge
前言:
兩個(gè)表中的數(shù)據(jù),要根據(jù)關(guān)鍵字段,進(jìn)行合并。
在Excel中可以使用vlookup的方式,在python中可以使用concat或者是merge的方法。
1、pd.concat
pd.concat 函數(shù):
- 拼接的對象可以是series,還可以是dataframe
- 拼接對象的個(gè)數(shù)不受限axis 控制拼接方向(既支持上下拼接,也支持左右拼接)
- 左右拼接 axis=1,左右拼接的依據(jù)是行索引;上下拼接 axis =0 ,拼接依據(jù)是列名,默認(rèn)是上下拼接
- join 指定拼接方法
- join=“inner” 內(nèi)聯(lián),表示保留兩個(gè)表共有的行索引
- join=“outer” 外聯(lián),表示保留兩個(gè)表所有的行索引,默認(rèn)外聯(lián)
#導(dǎo)入需要的包 import pandas as pd
#創(chuàng)建需要的數(shù)據(jù)集:產(chǎn)品表
dict1={"產(chǎn)品編號":["CP13","CP14","CP15","CP16","CP17"],"產(chǎn)品名稱":["產(chǎn)品A003","產(chǎn)品A004","產(chǎn)品A005","產(chǎn)品A006","產(chǎn)品A007"]}
df1 = pd.DataFrame(dict1)
df1
#創(chuàng)建需要的數(shù)據(jù)集:詳情表
dict2={"訂單編號":["20220913","20220914","20220915","20220915"],
"產(chǎn)品編號":["CP13","CP14","CP15","CP16"],
"產(chǎn)品銷量":[13,24,45,32],
"負(fù)責(zé)人":["張三","趙六","李八","李八"]}
df2 = pd.DataFrame(dict2)
df2
pd.concat([df1,df2])#默認(rèn)上下拼接,拼接依據(jù)是列名;默認(rèn)外聯(lián),保留兩個(gè)表都有的索引信息

pd.concat([df1,df2],ignore_index=True)#重置行索引

#左右拼接的依據(jù)是行索引 axis默認(rèn)是0上下拼接,1為左右拼接;默認(rèn)外聯(lián)(join = 'outer') pd.concat([df1,df2],axis=1)

#join指定了拼接方法,內(nèi)聯(lián),表示保留兩個(gè)表共有的行索引 pd.concat([df1,df2],axis=1,join="inner")

2、 df.append
和concat上下拼接的結(jié)果類似
df1.append(df2)

3、 pd.merge()
- 拼接對象是dataframe或者series,左表必須是datafram
- 拼接的數(shù)量只能是兩個(gè)
- 拼接方向只能左右拼
#left_on寫左表進(jìn)行拼接的字段,right_on寫右表要進(jìn)行拼接的字段 pd.merge(df1,df2,left_on="產(chǎn)品編號",right_on="產(chǎn)品編號",how = 'right')
#若兩表拼接字段名完全一樣,可寫一個(gè)on pd.merge(df1,df2,on="產(chǎn)品編號")

4、 df.join
和concat左右拼接的結(jié)果類似
df1.join(df2, lsuffix='_b', rsuffix='_a')

總結(jié)

到此這篇關(guān)于python進(jìn)行數(shù)據(jù)合并concat/merge的文章就介紹到這了,更多相關(guān)python數(shù)據(jù)合并內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python使用Selenium批量自動(dòng)化獲取并下載圖片的方法
在現(xiàn)代的Web開發(fā)中,自動(dòng)化測試和數(shù)據(jù)抓取已經(jīng)成為不可或缺的一部分,Selenium作為一款強(qiáng)大的自動(dòng)化測試工具,可以用于批量獲取網(wǎng)頁上的圖片,所以本文給大家介紹了Python如何使用Selenium批量自動(dòng)化獲取并下載圖片的方法2024-11-11
Python循環(huán)中else,break和continue的用法實(shí)例詳解
這篇文章主要介紹了Python循環(huán)中else,break和continue的用法,結(jié)合實(shí)例形式詳細(xì)分析了Python for循環(huán)、while循環(huán)中else,break和continue的功能、用法及相關(guān)操作注意事項(xiàng),需要的朋友可以參考下2019-07-07
解決Tensorflow 使用時(shí)cpu編譯不支持警告的問題
今天小編就為大家分享一篇解決Tensorflow 使用時(shí)cpu編譯不支持警告的問題,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02
python用BeautifulSoup庫簡單爬蟲實(shí)例分析
文章給大家分享了關(guān)于python爬蟲的相關(guān)實(shí)例以及相關(guān)代碼,有興趣的朋友們參考下。2018-07-07
pythonfor循環(huán)中range與len區(qū)別
這篇文章主要介紹了pythonfor循環(huán)中range與len區(qū)別,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定參考價(jià)值,需要的小伙伴可以參考一下2022-06-06

