pandas計數(shù) value_counts()的使用
在pandas里面常用value_counts確認數(shù)據(jù)出現(xiàn)的頻率。
1. Series 情況下:
pandas 的 value_counts() 函數(shù)可以對Series里面的每個值進行計數(shù)并且排序。
import pandas as pd
df = pd.DataFrame({'區(qū)域' : ['西安', '太原', '西安', '太原', '鄭州', '太原'],
'10月份銷售' : ['0.477468', '0.195046', '0.015964', '0.259654', '0.856412', '0.259644'],
'9月份銷售' : ['0.347705', '0.151220', '0.895599', '0236547', '0.569841', '0.254784']})
print(df)
統(tǒng)計每個區(qū)域出現(xiàn)多少次:
print(df['區(qū)域'].value_counts())

每個區(qū)域都被計數(shù),并且默認從高到低排序。
如果想升序排列,設置參數(shù) ascending = True:
print(df['區(qū)域'].value_counts(ascending=True))

如果想得出計數(shù)占比,可以加參數(shù) normalize=True
print(df['區(qū)域'].value_counts(normalize=True))

注:空值默認剔除掉的。value_counts()返回的結(jié)果是一個Series數(shù)組,可以跟別的數(shù)組進行計算。
2. DataFrame 情況下:
import pandas as pd
df = pd.DataFrame({'區(qū)域1' : ['西安', '太原', '西安', '太原', '鄭州', '太原'],
'區(qū)域2' : ['太原', '太原', '西安', '西安', '西安', '太原']})
print(df.apply(pd.value_counts))

區(qū)域2中沒有鄭州,所以是NaN。
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
python playwright--pytest-playwright、pytest-base-url插件編
這篇文章主要介紹了python playwright--pytest-playwright、pytest-base-url插件編寫用例,它提供上下文隔離,開箱即用地在多個瀏覽器配置上運行,它繼承了pytest框架,以及支持playwright的一些基礎使用,需要的朋友可以參考下2023-05-05
Python腳本實現(xiàn)datax全量同步mysql到hive
這篇文章主要和大家分享一下mysql全量同步到hive自動生成json文件的python腳本,文中的示例代碼講解詳細,有需要的小伙伴可以參加一下2024-10-10
用Python從0開始實現(xiàn)一個中文拼音輸入法的思路詳解
中文輸入法是一個歷史悠久的問題,但也實在是個繁瑣的活,不知道這是不是網(wǎng)上很少有人分享中文拼音輸入法的原因,接下來通過本文給大家分享使用Python從0開始實現(xiàn)一個中文拼音輸入法,需要的朋友可以參考下2019-07-07
Python數(shù)據(jù)結(jié)構(gòu)與算法(幾種排序)小結(jié)
這篇文章主要介紹了Python數(shù)據(jù)結(jié)構(gòu)與算法(幾種排序)的相關知識,本文給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2019-06-06

