Python中的pandas庫(kù)簡(jiǎn)介及其使用教程
pandas模塊
pandas是一個(gè)強(qiáng)大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集;它的使用基礎(chǔ)是Numpy(提供高性能的矩陣運(yùn)算);用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,同時(shí)也提供數(shù)據(jù)清洗功能。
- 便捷的數(shù)據(jù)處理能力
- 獨(dú)特的數(shù)據(jù)結(jié)構(gòu)
- 讀取文件方便
- 封裝了matplotlib的畫圖和numpy的計(jì)算
Pandas中常見的數(shù)據(jù)結(jié)構(gòu)有兩種:
| Series | DateFrame |
|---|---|
| 類似一維數(shù)組的對(duì)象, | 類似多維數(shù)組/表格數(shù)組;每列數(shù)據(jù)可以是不同的類型;索引包括列索引和行索引。 |
Series
- 構(gòu)建Series:
ser_obj = pd.Series(range(10)) - 由索引和數(shù)據(jù)組成(索引在左<自動(dòng)創(chuàng)建的>,數(shù)據(jù)在右)。
- 獲取數(shù)據(jù)和索引:
ser_obj.index; ser_obj.values - 預(yù)覽數(shù)據(jù):
ser_obj.head(n);ser_obj.tail(n)
DateFrame
- 獲取列數(shù)據(jù):
df_obj[col_idx]或df_obj.col_idx - 增加列數(shù)據(jù):
df_obj[new_col_idx] = data - 刪除列:
del df_obj[col_idx] - 按值排序:
sort_values(by = “label_name”)
常用方法
| Count | 非NA值得數(shù)量 |
|---|---|
| describe | 針對(duì)Series或各DataFrame列計(jì)算匯總統(tǒng)計(jì) |
| min\max | 計(jì)算最小值和最大值 |
| argmin\argmax | 計(jì)算能夠獲取到最大值或最小值的索引位置 |
| idxmin\idxmax | 計(jì)算能夠獲取到最小值和最大值的索引值 |
| quantile | 計(jì)算樣本的分位數(shù)(0-1) |
| sum | 值得總和 |
| mean | 值得平均值 |
| median | 值的算術(shù)中位數(shù)(50%分位數(shù)) |
| mad | 根據(jù)平均值計(jì)算平均絕對(duì)離差 |
| var | 樣本值得方差 |
| std | 樣本值得標(biāo)準(zhǔn)差 |
| skew | 樣本值的偏度(三階距) |
| kurt | 樣本值的峰度(四階距) |
| cumsum | 樣本值的累計(jì)和 |
| cummin\cummax | 樣本值的累計(jì)最大值和累計(jì)最小值 |
| cumprod | 樣本值的累計(jì)積 |
| diff | 計(jì)算一階差分(對(duì)時(shí)間序列很有用) |
| pct_change | 計(jì)算百分?jǐn)?shù)變化 |
處理缺失數(shù)據(jù)
- Dropna()丟棄缺失數(shù)據(jù)
- Fillna()填充缺失數(shù)據(jù)
數(shù)據(jù)過濾
Df[filter_condition]依據(jù)filter_condition(條件)對(duì)Df(數(shù)據(jù))進(jìn)行過濾。
繪圖功能
Plot(kind,x,y,title,figsize) Kind(繪制什么形式的圖),x(x軸內(nèi)容),y(y軸內(nèi)容),title(圖標(biāo)題),figsize(圖大?。?/pre>
保存圖片:plt.savefig()
("The fool doth think he is wise, but the wise man knows himself to be a fool." --威廉·莎士比亞)
到此這篇關(guān)于Python中的pandas庫(kù)簡(jiǎn)介及其使用的文章就介紹到這了,更多相關(guān)Python pandas庫(kù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python安裝numpy&安裝matplotlib& scipy的教程
下面小編就為大家?guī)?lái)一篇python安裝numpy&安裝matplotlib& scipy的教程。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過來(lái)看看吧2017-11-11
Python 3.8中實(shí)現(xiàn)functools.cached_property功能
這篇文章主要介紹了Python 3.8中實(shí)現(xiàn)functools.cached_property功能,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2019-05-05
Pytorch使用DataLoader實(shí)現(xiàn)批量加載數(shù)據(jù)
這篇文章主要介紹了Pytorch使用DataLoader實(shí)現(xiàn)批量加載數(shù)據(jù)方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-02-02
Pytorch教程內(nèi)置模型源碼實(shí)現(xiàn)
本文是關(guān)于Pytorch教程文章,本篇主要為教大家Pytorch內(nèi)置模型源碼實(shí)現(xiàn),有需要的朋友可以借鑒參考下,希望可以有所幫助,祝大家多多進(jìn)步,早日升職加薪2021-09-09
利用python實(shí)現(xiàn)全屏愛心雨向喜歡的人表白
馬上520了,教大家用Python做一個(gè)下愛心雨的特效,這篇文章主要給大家介紹了關(guān)于利用python實(shí)現(xiàn)全屏愛心雨向喜歡的人表白的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-05-05
Python讀寫文件模式和文件對(duì)象方法實(shí)例詳解
這篇文章主要介紹了Python讀寫文件模式和文件對(duì)象方法,結(jié)合實(shí)例形式詳細(xì)分析了Python文件操作常用技巧與相關(guān)注意事項(xiàng),需要的朋友可以參考下2019-09-09

