pandas應(yīng)用實(shí)例之pivot函數(shù)詳解
1、pivot函數(shù)的定義
pivot(index=None,columns=None,values=None) -> DataFrame
2、pivot函數(shù)的說明
通過給定的索引(index)和列(column)的值重新生一個DataFrame對象。
根據(jù)列值對數(shù)據(jù)進(jìn)行整形(生成一個“透視”表)。從指定的索引/列中使用唯一的值來形成結(jié)果數(shù)據(jù)幀的軸。此函數(shù)不支持?jǐn)?shù)據(jù)聚合,多個值將導(dǎo)致列中的多索引。
3、pivo函數(shù)的參數(shù)
index:指定一列做為生成DataFrame對象的索引,如果為空則默認(rèn)為原來的索引。
columns:指定一列的值作為列名,必須傳值。
values:指定一列作為生成DataFrame對象的值??梢詾榭?。
4、pivot函數(shù)實(shí)例
df = pd.DataFrame({'foo': ['one', 'one', 'one', 'two', 'two', 'two'],
'bar': ['A', 'B', 'C', 'A', 'B', 'C'],
'baz': [1, 2, 3, 4, 5, 6],
'zoo': ['x', 'y', 'z', 'q', 'w', 't']})

# 指定foo的值為新dataframe的index,bar的值為columns,dataframe中對應(yīng)的值為baz df.pivot(index='foo', columns='bar', values='baz')

# 沒有指定value,列名最外層保留原來的列,如下結(jié)果baz和zoo為原dataframe中的列名,新指定的列名bar在里層(暫時這么理解)。 df.pivot(index='foo', columns='bar')

# 可以通過索引的方式取指定的列數(shù)據(jù) df.pivot(index='foo', columns='bar')['baz']

# 可以指定多個values df.pivot(index='foo', columns='bar', values=['baz', 'zoo'])

# 指定多個columns df.pivot(index='foo', columns=['bar','baz'], values=['zoo'])

# 指定多個index df.pivot(index=['foo','bar'], columns='baz', values='zoo')

# 指定多個index可以通過index名取當(dāng)個index的數(shù)據(jù) df.pivot(index=['foo','bar'], columns='baz', values='zoo').loc["one",:]

# 這兩行代碼運(yùn)行將會報錯。
# 報錯提示:ValueError: Index contains duplicate entries, cannot reshape
# 意思是指定的索引one有兩個列bar=A沖突了。
df = pd.DataFrame({"foo": ['one', 'one', 'two', 'two'],
"bar": ['A', 'A', 'B', 'C'],
"baz": [1, 2, 3, 4]})
df.pivot(index='foo', columns='bar', values='baz')
5、pivot函數(shù)在實(shí)際工作中解決的案例

現(xiàn)在要上圖中的不同code之間從2020-11-16到2020-11-18三天內(nèi)num序列數(shù)的相關(guān)性。
首先,dataframe對象可以直接調(diào)用函數(shù)corr()計(jì)算不同列之間的相關(guān)性,所以現(xiàn)在需要將原始的dataframe對象轉(zhuǎn)換成以code為列,date為索引,num為值的dataframe。
第一種比較笨的方法就是循環(huán),此方法不但代碼量較多而且在數(shù)據(jù)量很大時會比較耗時。不建議使用。
grouped = df.groupby(by=["code"])
df_num = pd.DataFrame()
for name,group in grouped:
d = pd.Series(data=group["num"].values,name=name)
df_num = pd.concat([df_num,d],axis=1)
df_close

第二種方法就是使用pivot函數(shù),一行代碼解決,運(yùn)行快速。
df_num = df.pivot(index='date',columns='code',values='num')

想要的形式的dataframe生成了就可以直接調(diào)用corr()函數(shù)直接求出code之間的相關(guān)性了
# 計(jì)算列之間的相關(guān)性 df_num.corr()

總結(jié)
到此這篇關(guān)于pandas應(yīng)用實(shí)例之pivot函數(shù)的文章就介紹到這了,更多相關(guān)pandas pivot函數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
重寫django的model下的objects模型管理器方式
這篇文章主要介紹了重寫django的model下的objects模型管理器方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-05-05
使用Python進(jìn)行SSH和文件傳輸實(shí)現(xiàn)方法實(shí)例
這篇文章主要為大家介紹了使用Python進(jìn)行SSH和文件傳輸實(shí)現(xiàn)方法實(shí)例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-12-12
python3.6.5基于kerberos認(rèn)證的hive和hdfs連接調(diào)用方式
這篇文章主要介紹了python3.6.5基于kerberos認(rèn)證的hive和hdfs連接調(diào)用方式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06
Python使用plt庫實(shí)現(xiàn)繪制動態(tài)曲線圖并導(dǎo)出為GIF或MP4
這篇文章主要為大家詳細(xì)介紹了Python如何使用plt庫實(shí)現(xiàn)繪制動態(tài)曲線圖并導(dǎo)出為GIF或MP4,文中的示例代碼講解詳細(xì),需要的可以了解一下2024-03-03
Django 博客實(shí)現(xiàn)簡單的全文搜索的示例代碼
這篇文章主要介紹了Django 博客實(shí)現(xiàn)簡單的全文搜索的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-02-02
詳解如何使用Python和正則表達(dá)式處理XML表單數(shù)據(jù)
在日常的Web開發(fā)中,處理表單數(shù)據(jù)是一個常見的任務(wù),而XML是一種常用的數(shù)據(jù)格式,用于在不同的系統(tǒng)之間傳遞和存儲數(shù)據(jù),本文通過闡述一個技術(shù)問題并給出解答的方式,介紹如何使用Python和正則表達(dá)式處理XML表單數(shù)據(jù),需要的朋友可以參考下2023-09-09
python實(shí)現(xiàn)監(jiān)控linux性能及進(jìn)程消耗性能的方法
這篇文章主要介紹了python實(shí)現(xiàn)監(jiān)控linux性能及進(jìn)程消耗性能的方法,需要的朋友可以參考下2014-07-07

