Python sklearn中的.fit與.predict的用法說明

更新時間：2020年06月28日 11:10:42 作者：冽夫

這篇文章主要介紹了Python sklearn中的.fit與.predict的用法說明，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

我就廢話不多說了，大家還是直接看代碼吧~

clf=KMeans(n_clusters=5) #創(chuàng)建分類器對象
fit_clf=clf.fit(X) #用訓練器數(shù)據(jù)擬合分類器模型
clf.predict(X) #也可以給新數(shù)據(jù)數(shù)據(jù)對其預(yù)測

print(clf.cluster_centers_) #輸出5個類的聚類中心

y_pred = clf.fit_predict(X) #用訓練器數(shù)據(jù)X擬合分類器模型并對訓練器數(shù)據(jù)X進行預(yù)測

print(y_pred) #輸出預(yù)測結(jié)果

補充知識：sklearn中調(diào)用某個機器學習模型model.predict(x)和model.predict_proba(x)的區(qū)別

model.predict_proba(x)不同于model.predict()，它返回的預(yù)測值為獲得所有結(jié)果的概率。（有多少個分類結(jié)果，每行就有多少個概率，對每個結(jié)果都有一個概率值，如0、1兩分類就有兩個概率）

我們直接上代碼，通過具體例子來進一步講解：

python3 代碼實現(xiàn)：

# -*- coding: utf-8 -*-
"""
Created on Sat Jul 27 21:25:39 2019

@author: ZQQ
"""
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
import numpy as np
import warnings
warnings.filterwarnings("ignore")
# 這個方法只是解決了表面，沒有根治

# 數(shù)據(jù)（特征，屬性）
x_train = np.array([[1,2,3], 
          [1,5,4], 
          [2,2,2], 
          [4,5,6], 
          [3,5,4], 
          [1,7,2]]) 
# 數(shù)據(jù)的標簽
y_train = np.array([1, 0, 1, 1, 0, 0]) 
 
# 測試數(shù)據(jù)
x_test = np.array([[2,1,2], 
          [3,2,6], 
          [2,6,4]]) 
 
# 導(dǎo)入模型
model = LogisticRegression() 
 
#model = RandomForestClassifier()

#model=XGBClassifier()

model.fit(x_train, y_train)

# 返回預(yù)測標簽 
print(model.predict(x_test)) 
 
print('---------------------------------------')

# 返回預(yù)測屬于某標簽的概率 
print(model.predict_proba(x_test))

運行結(jié)果：