Python 馬氏距離求取函數(shù)詳解
更新時間:2021年11月16日 15:24:55 作者:蘇蘇與阿言
這篇文章主要為大家介紹了Python 馬氏距離求取函數(shù),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
馬氏距離區(qū)別于歐式距離,如百度知道中所言:
馬氏距離(Mahalanobis distance)是由印度統(tǒng)計(jì)學(xué)家馬哈拉諾比斯(P. C. Mahalanobis)提出的,表示點(diǎn)與一個分布之間的距離。它是一種有效的計(jì)算兩個未知樣本集的相似度的方法。與 歐氏距離不同的是,它考慮到各種特性之間的聯(lián)系(例如:一條關(guān)于身高的信息會帶來一條關(guān)于體重的信息,因?yàn)閮烧呤怯嘘P(guān)聯(lián)的),并且是尺度無關(guān)的(scale-invariant),即獨(dú)立于測量尺度。對于一個均值為μ, 協(xié)方差矩陣為Σ的多變量向量,其馬氏距離為sqrt( (x-μ)'Σ^(-1)(x-μ) )。
因此,對于馬氏距離最終的定義式為:

上代碼,將馬氏距離求取式,封裝為Python函數(shù),拷貝即可使用:
from numpy import *
import numpy
def get_mahalanobis(x, i, j):
xT = x.T # 求轉(zhuǎn)置
D = numpy.cov(xT) # 求協(xié)方差矩陣
invD = numpy.linalg.inv(D) # 協(xié)方差逆矩陣
assert 0 <= i < x.shape[0], "點(diǎn) 1 索引超出樣本范圍。"
assert -1 <= j < x.shape[0], "點(diǎn) 2 索引超出樣本范圍。"
x_A = x[i]
x_B = x.mean(axis=0) if j == -1 else x[j]
tp = x_A - x_B
return numpy.sqrt(dot(dot(tp, invD), tp.T))
使用方式如下:
if __name__ == '__main__':
# 初始化數(shù)據(jù)點(diǎn)集,或者從其它地方加載
x = numpy.array([[3, 4], [5, 6], [2, 2], [8, 4]])
# 求第0個點(diǎn)到均值之間的馬氏距離(j為-1時代表均值)
print(get_mahalanobis(x, 0, -1))
# 求第0個點(diǎn)到第1個點(diǎn)之間的馬氏距離
print(get_mahalanobis(x, 0, 1))
# 求第2個點(diǎn)到第3個點(diǎn)之間的馬氏距離(索引從0開始算起)
print(get_mahalanobis(x, 2, 3))
運(yùn)行結(jié)果貼圖

總結(jié)
本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關(guān)注腳本之家的更多內(nèi)容!
相關(guān)文章
多線程爬蟲批量下載pcgame圖片url 保存為xml的實(shí)現(xiàn)代碼
用Python寫的多線程爬蟲批量下載pcgame的圖片url并保存為xml格式,主要是邏輯代碼,喜歡的朋友可以測試下2013-01-01
Pytorch搭建YoloV5目標(biāo)檢測平臺實(shí)現(xiàn)過程
這篇文章主要為大家介紹了Pytorch搭建YoloV5目標(biāo)檢測平臺實(shí)現(xiàn)過程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-04-04
Python警察與小偷的實(shí)現(xiàn)之一客戶端與服務(wù)端通信實(shí)例
這篇文章主要介紹了Python警察與小偷的實(shí)現(xiàn)之一客戶端與服務(wù)端通信實(shí)例,并附有難點(diǎn)及易錯點(diǎn)的分析與說明,需要的朋友可以參考下2014-10-10
Python+selenium破解拼圖驗(yàn)證碼的腳本
很多網(wǎng)站在登錄或者注冊時都會遇到拼圖驗(yàn)證碼,這種拼圖驗(yàn)證碼實(shí)際上是多個小碎片經(jīng)過重新組合成的一張整體。本文將和大家分享一個基于Python selenium的破解拼圖驗(yàn)證碼的腳本,需要的可以參考一下2022-02-02

