Python制作數(shù)據(jù)分析透視表的方法詳解
透視表是一種可以對數(shù)據(jù)動態(tài)排布并且分類匯總的表格格式,在常用的python的數(shù)據(jù)分析非標準庫pandas中體現(xiàn)為pivot_table模塊。
pivot_table數(shù)據(jù)透視表可以靈活的定制數(shù)據(jù)分析需求進行匯總,當然在Excel辦公操作中早就存在了數(shù)據(jù)透視表的工具。如今,數(shù)據(jù)透視表被應用在python語言中更是給我們帶來了大大地便利。
pivot_table有四個最重要的參數(shù)index、values、columns、aggfunc,通過設置不同的參數(shù)屬性從而完成不同的數(shù)據(jù)分析需求。
pivot_table是pandas非標準庫下面的數(shù)據(jù)透視表模塊,因此需要安裝pandas非標準庫。按照以往的慣例還是采用pip的方式來進行安裝即可。
pip?install?pandas?-i?https://pypi.tuna.tsinghua.edu.cn/simple/
首先,使用傳統(tǒng)的excel讀取函數(shù)read_excel將Excel文件中的數(shù)據(jù)讀取出來,讀取數(shù)據(jù)返回的是Dataframe格式的數(shù)據(jù)。
import?pandas?as?pd??#?導入pandas模塊
df?=?pd.read_excel('C:/test/data.xlsx')??#?讀取Excel數(shù)據(jù)文件
print(df.tail())??#?打印部分結(jié)果
#?????????????名稱??年齡????班級???成績??表現(xiàn)
#?21??Python?集中營??24??1739??111??A+
#?22??Python?集中營??25??1740??112??A+
#?23??Python?集中營??26??1741??113??A+
#?24??Python?集中營??27??1742??114??A+
#?25??Python?集中營??28??1743??115??A+
1、pivot_table函數(shù)index屬性
我們通過pandas的read_excel函數(shù)已經(jīng)將Excel數(shù)據(jù)文件讀取并返回DataFrame數(shù)據(jù)對象。接下來通過數(shù)據(jù)透視表的方式來進行數(shù)據(jù)匯總,先來看看使用index屬性是如何匯總結(jié)果的。
print(pd.pivot_table(df,?index=[u'名稱'])) #???????????????年齡?????成績??????班級 #?名稱 #?Python?集中營??15.5??102.5??1730.5
上面我們只指定了一個索引'名稱'字段,從結(jié)果可以看出pivot_table函數(shù)自動將名稱為'Python 集中營'的值匯總了一下,并且將其他的數(shù)字屬性的字段全部計算得到了均值。
print(pd.pivot_table(df,?index=[u'名稱',?u'表現(xiàn)'])) #??????????????????年齡?????成績??????班級 #?名稱?????????表現(xiàn) #?Python?集中營?A+??15.5??102.5??1730.5
若是我們使用了兩個或是兩個以上的字段作為index的值則實際上會進行兩次或兩次以上的分組,這里體現(xiàn)為先對'名稱'字段進行分組、其次再對'表現(xiàn)'字段進行分組。
2、pivot_table函數(shù)values屬性
values屬性即在使用時將指定的字段顯示出來,因為有的情況下并不需要將所有的字段都展示出來往往可能用到的是其中的幾個字段的值來參與運算。
print(pd.pivot_table(df,?index=[u'表現(xiàn)'],?values=[u'班級',?u'成績'])) #????????成績??????班級 #?表現(xiàn) #?A+??102.5??1730.5
需要注意的是values屬性只能用來指定具有數(shù)字屬性的字段,可能為了能夠更好的實現(xiàn)分組統(tǒng)計的效果吧!
3、pivot_table函數(shù)aggfunc屬性
aggfunc屬性則是對計算方式的設置,也可以同時設置好幾種計算方式將結(jié)果展示出來。在前面的統(tǒng)計中并沒有設置,默認則是使用均值的算法來統(tǒng)計匯總信息的。
下面設置兩種的計算方式來統(tǒng)計我們之前的結(jié)果,一種還是均值、另一種則是求和的方式將兩種計算模式下的結(jié)果都統(tǒng)計出來。
print(pd.pivot_table(df,?index=[u'名稱'],?values=[u'年齡',?u'成績'],?aggfunc=['mean',?'sum'])) #????????????mean?????????sum #???????????????年齡?????成績???年齡????成績 #?名稱 #?Python?集中營??15.5??102.5??403??2665
可以發(fā)現(xiàn)匯總結(jié)果分別匯總出來了年齡和成績的平均值、總和,效果還是相當理想的。
4、pivot_table函數(shù)columns屬性
columns屬性主要用來顯示字符類型的字段的,若是字段對應的所在行沒有值時則可以使用fill_value函數(shù)來填充默認值使數(shù)據(jù)變得完整,一般來說columns和fill_value是搭配使用的。
print(pd.pivot_table(df,?index=[u'名稱'],?values=[u'年齡',?u'成績'],?aggfunc=['mean',?'sum'],?columns=[u'表現(xiàn)'], ?????????????????????fill_value=0)) #?????????????mean?????????sum #???????????????年齡?????成績???年齡????成績 #?表現(xiàn)????????????A+?????A+???A+????A+ #?名稱 #?Python?集中營??15.5??102.5??403??2665
到此這篇關(guān)于Python制作數(shù)據(jù)分析透視表的方法詳解的文章就介紹到這了,更多相關(guān)Python透視表內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python pcm音頻添加頭轉(zhuǎn)成Wav格式文件的方法
今天小編就為大家分享一篇python pcm音頻添加頭轉(zhuǎn)成Wav格式文件的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01
Python實現(xiàn)日期字符串轉(zhuǎn)換為指定格式的日期
在Python編程中,日期處理是一個常見的任務,本文將詳細介紹如何在Python中將日期字符串轉(zhuǎn)換為指定格式的日期,感興趣的小伙伴可以學習一下2024-04-04
解決Python import docx出錯DLL load failed的問題
今天小編就為大家分享一篇解決Python import docx出錯DLL load failed的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02
keras實現(xiàn)theano和tensorflow訓練的模型相互轉(zhuǎn)換
這篇文章主要介紹了keras實現(xiàn)theano和tensorflow訓練的模型相互轉(zhuǎn)換,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-06-06

