pandas的相關(guān)系數(shù)與協(xié)方差實例
1、輸出百分比變化以及前后指定的行數(shù)
a = np.arange(1,13).reshape(6,2)
data = DataFrame(a)
#計算列的百分比變化,如果想計算行設(shè)置axis=1
print(data.pct_change())
'''
0 1
0 NaN NaN
1 2.000000 1.000000
2 0.666667 0.500000
3 0.400000 0.333333
4 0.285714 0.250000
5 0.222222 0.200000
'''
#輸出前五行,默認是5,可以通過設(shè)置n參數(shù)來設(shè)置輸出的行數(shù)
print(data.head())
'''
0 1
0 1 2
1 3 4
2 5 6
3 7 8
4 9 10
'''
#輸出最后五行
print(data.tail())
'''
0 1
1 3 4
2 5 6
3 7 8
4 9 10
5 11 12
'''
2、計算DataFrame列與列的相關(guān)系數(shù)和協(xié)方差
a = np.arange(1,10).reshape(3,3)
data = DataFrame(a,index=["a","b","c"],columns=["one","two","three"])
print(data)
'''
one two three
a 1 2 3
b 4 5 6
c 7 8 9
'''
#計算第一列和第二列的相關(guān)系數(shù)
print(data.one.corr(data.two))
#1.0
#返回一個相關(guān)系數(shù)矩陣
print(data.corr())
'''
one two three
one 1.0 1.0 1.0
two 1.0 1.0 1.0
three 1.0 1.0 1.0
'''
#計算第一列和第二列的協(xié)方差
print(data.one.cov(data.two))
#9.0
#返回一個協(xié)方差矩陣
print(data.cov())
'''
one two three
one 9.0 9.0 9.0
two 9.0 9.0 9.0
three 9.0 9.0 9.0
'''
3、計算DataFrame與列或者Series的相關(guān)系數(shù)
a = np.arange(1,10).reshape(3,3)
data = DataFrame(a,index=["a","b","c"],columns=["one","two","three"])
print(data)
'''
one two three
a 1 2 3
b 4 5 6
c 7 8 9
'''
#計算data與第三列的相關(guān)系數(shù)
print(data.corrwith(data.three))
'''
one 1.0
two 1.0
three 1.0
'''
#計算data與Series的相關(guān)系數(shù)
#在定義Series的時候,索引一定要去DataFrame的索引一樣
s = Series([5,3,1],index=["a","b","c"])
print(data.corrwith(s))
'''
one -1.0
two -1.0
three -1.0
'''
注意:在使用DataFrame或Series在計算相關(guān)系數(shù)或者協(xié)方差的時候,都會計算索引重疊的、非NA的、按照索引對齊原則,對于無法對齊的索引會使用NA值進行填充。在使用DataFrame與指定的行或列或Series計算協(xié)方差和相關(guān)系數(shù)的時候,默認都是與DataFrame的列進行計算,如果想要計算行,設(shè)置axis參數(shù)為1即可。
以上這篇pandas的相關(guān)系數(shù)與協(xié)方差實例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
使用Python將PDF表格提取到文本,CSV和Excel文件中
本文將介紹如何使用簡單的Python代碼從PDF文檔中提取表格數(shù)據(jù)并將其寫入文本、CSV和Excel文件,從而輕松實現(xiàn)PDF表格的自動化提取,有需要的可以參考下2024-11-11
用python刪除java文件頭上版權(quán)信息的方法
在使用他人代碼時,為不保留文件頭部版權(quán)信息,需要一個個刪掉,下面是用python刪除java文件頭上的版權(quán)信息的方法2014-07-07

