使用pandas忽略行列索引,縱向拼接多個dataframe
從wind上面搞到一批股票數(shù)據(jù)后發(fā)現(xiàn):本來是一個類型的數(shù)據(jù),但是由于季度不同,列名也不同,導(dǎo)致使用pandas合并多個報表的時候總是出現(xiàn)一大堆NaN,所以這里我寫了一個函數(shù),專門針對這樣的表
它的思路是:
生成一堆單詞,然后把這些表的列索引全部替換為這些單詞,然后調(diào)用 pd.concat() 把這些dataframe全部合并后再把列索引改回來,當(dāng)然,這里也可以手動指定列索引。
使用方法見代碼的最后一行,傳入一個dataframe的list就可以了。
import pandas as pd from random import Random # 隨機生成一堆單詞作為公共的列名 def random_list(random_str_count, randomlengtd=6): result_list = [] random = Random() chars = "qwertyuiopasdfghjklzxcvbnm" for str_count in range(random_str_count): ranstr = "" lengtd = len(chars) - 1 for str_lengtd in range(randomlengtd): ranstr += chars[random.randint(0, lengtd)] result_list.append(ranstr) return result_list def combine_as_data_location(pd_list, columns=''): if not pd_list: return None old_columns = pd_list[0].columns if columns: new_columns = columns else: new_columns = random_list(pd_list[0].shape[1]) for data_df in pd_list: # data is pandas Dataframe data_df.columns = new_columns result_df = pd.concat(pd_list, ignore_index=True) if columns: return result_df else: result_df.columns = old_columns return result_df result_df = combine_as_data_location([df1,df2,df3])
補充:pandas.concat實現(xiàn)豎著拼接、橫著拼接DataFrame
1、concat豎著拼接(默認的豎著,axis=0)
話不多說,直接看例子:
import pandas as pd df1=pd.DataFrame([10,12,13]) df2=pd.DataFrame([22,33,44,55]) df3=pd.DataFrame([90,94])
df1
| 0 | |
|---|---|
| 0 | 10 |
| 1 | 12 |
| 2 | 13 |
df2
| 0 | |
|---|---|
| 0 | 22 |
| 1 | 33 |
| 2 | 44 |
| 3 | 55 |
df3
| 0 | |
|---|---|
| 0 | 90 |
| 1 | 94 |
res= pd.concat([df1,df2,df3]) res
| 0 | |
|---|---|
| 0 | 10 |
| 1 | 12 |
| 2 | 13 |
| 0 | 22 |
| 1 | 33 |
| 2 | 44 |
| 3 | 55 |
| 0 | 90 |
| 1 | 94 |
如果要生成新索引,忽略原來索引怎么辦?
默認有個參數(shù)ignore_index= False,將其值改為True:
res2= pd.concat([df1,df2,df3], ignore_index=True) res2
| 0 | |
|---|---|
| 0 | 10 |
| 1 | 12 |
| 2 | 13 |
| 3 | 22 |
| 4 | 33 |
| 5 | 44 |
| 6 | 55 |
| 7 | 90 |
| 8 | 94 |
2、concat橫著拼接
用參數(shù)axis= 1,看例子:
res_heng= pd.concat([df1,df2,df3], axis=1) res_heng
| 0 | 0 | 0 | |
|---|---|---|---|
| 0 | 10.0 | 22 | 90.0 |
| 1 | 12.0 | 33 | 94.0 |
| 2 | 13.0 | 44 | NaN |
| 3 | NaN | 55 | NaN |
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
python網(wǎng)絡(luò)編程示例(客戶端與服務(wù)端)
這篇文章主要介紹了python網(wǎng)絡(luò)編程示例,提供了客戶端與服務(wù)端,需要的朋友可以參考下2014-04-04
Python實現(xiàn)TCP探測目標(biāo)服務(wù)路由軌跡的原理與方法詳解
這篇文章主要介紹了Python實現(xiàn)TCP探測目標(biāo)服務(wù)路由軌跡的原理與方法,結(jié)合實例形式分析了Python TCP探測目標(biāo)服務(wù)路由軌跡的原理、實現(xiàn)方法及相關(guān)操作注意事項,需要的朋友可以參考下2019-09-09
python通過apply使用元祖和列表調(diào)用函數(shù)實例
這篇文章主要介紹了python通過apply使用元祖和列表調(diào)用函數(shù),實例分析了python中apply方法的使用技巧,需要的朋友可以參考下2015-05-05

