Pandas中describe()函數(shù)的具體使用
先附上官方文檔:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.describe.html
describe()有三個參數(shù):
DataFrame.describe(percentiles=None, include=None, exclude=None) # return:Series or DataFrame. Summary statistics of the Series or Dataframe provided.
幾個要點(diǎn):
1.include=‘all’,代表對所有列進(jìn)行統(tǒng)計(jì),如果不加這個參數(shù),則只對數(shù)值列進(jìn)行統(tǒng)計(jì)
datafile.describe(include='all')
沒加參數(shù)的少了height列(height為離散型變量,其余為數(shù)值型):

加了參數(shù)include=‘all’,出現(xiàn)height變量:

2.統(tǒng)計(jì)變量說明:
- count:數(shù)量統(tǒng)計(jì),此列共有多少有效值
- unipue:不同的值有多少個
- std:標(biāo)準(zhǔn)差
- min:最小值
- 25%:四分之一分位數(shù)
- 50%:二分之一分位數(shù)
- 75%:四分之三分位數(shù)
- max:最大值
- mean:均值
3.僅僅顯示離散型變量:include=[‘O’]
df.describe(include=['O'])
只顯示了height列:

4.第一個percentiles,這個參數(shù)可以設(shè)定數(shù)值型特征的統(tǒng)計(jì)量,默認(rèn)[.25, .5, .75],返回25%,50%,75%時候的數(shù)據(jù),可修改參數(shù),**如:
df.describe(percentiles=[.10, .75, .8])

5.第三個參數(shù)可以指定不選擇哪些列。
例如
df.describe(exclude=['O'])
height列沒有了:

到此這篇關(guān)于Pandas中describe()函數(shù)的具體使用的文章就介紹到這了,更多相關(guān)Pandas describe()內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
詳解python的argpare和click模塊小結(jié)
這篇文章主要介紹了詳解python的argpare和click模塊小結(jié),小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2019-03-03
Python中join()函數(shù)多種操作代碼實(shí)例
這篇文章主要介紹了Python中join()函數(shù)多種操作代碼實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-01-01
基于scrapy實(shí)現(xiàn)的簡單蜘蛛采集程序
這篇文章主要介紹了基于scrapy實(shí)現(xiàn)的簡單蜘蛛采集程序,實(shí)例分析了scrapy實(shí)現(xiàn)采集程序的技巧,具有一定參考借鑒價值,需要的朋友可以參考下2015-04-04
Python實(shí)現(xiàn)將MySQL數(shù)據(jù)庫表中的數(shù)據(jù)導(dǎo)出生成csv格式文件的方法
這篇文章主要介紹了Python實(shí)現(xiàn)將MySQL數(shù)據(jù)庫表中的數(shù)據(jù)導(dǎo)出生成csv格式文件的方法,涉及Python針對mysql數(shù)據(jù)庫的連接、查詢、csv格式數(shù)據(jù)文件的生成等相關(guān)操作技巧,需要的朋友可以參考下2018-01-01

