Python 確定多項(xiàng)式擬合/回歸的階數(shù)實(shí)例

更新時(shí)間：2018年12月29日 11:03:54 作者：薛定諤的DBA

今天小編就為大家分享一篇Python 確定多項(xiàng)式擬合/回歸的階數(shù)實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

通過 1至10 階來擬合對(duì)比均方誤差及R評(píng)分，可以確定最優(yōu)的“最大階數(shù)”。

import numpy as np
import matplotlib.pyplot as plt
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression,Perceptron
from sklearn.metrics import mean_squared_error,r2_score
from sklearn.model_selection import train_test_split
 
X = np.array([-4,-3,-2,-1,0,1,2,3,4,5,6,7,8,9,10]).reshape(-1, 1)
y = np.array(2*(X**4) + X**2 + 9*X + 2)
#y = np.array([300,500,0,-10,0,20,200,300,1000,800,4000,5000,10000,9000,22000]).reshape(-1, 1)
 
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
rmses = []
degrees = np.arange(1, 10)
min_rmse, min_deg,score = 1e10, 0 ,0
 
for deg in degrees:
	# 生成多項(xiàng)式特征集(如根據(jù)degree=3 ,生成 [[x,x**2,x**3]] )
	poly = PolynomialFeatures(degree=deg, include_bias=False)
	x_train_poly = poly.fit_transform(x_train)
 
	# 多項(xiàng)式擬合
	poly_reg = LinearRegression()
	poly_reg.fit(x_train_poly, y_train)
	#print(poly_reg.coef_,poly_reg.intercept_) #系數(shù)及常數(shù)
	
	# 測(cè)試集比較
	x_test_poly = poly.fit_transform(x_test)
	y_test_pred = poly_reg.predict(x_test_poly)
	
	#mean_squared_error(y_true, y_pred) #均方誤差回歸損失,越小越好。
	poly_rmse = np.sqrt(mean_squared_error(y_test, y_test_pred))
	rmses.append(poly_rmse)
	# r2 范圍[0，1]，R2越接近1擬合越好。
	r2score = r2_score(y_test, y_test_pred)
	
	# degree交叉驗(yàn)證
	if min_rmse > poly_rmse:
		min_rmse = poly_rmse
		min_deg = deg
		score = r2score
	print('degree = %s, RMSE = %.2f ,r2_score = %.2f' % (deg, poly_rmse,r2score))
		
fig = plt.figure()
ax = fig.add_subplot(111)
ax.plot(degrees, rmses)
ax.set_yscale('log')
ax.set_xlabel('Degree')
ax.set_ylabel('RMSE')
ax.set_title('Best degree = %s, RMSE = %.2f, r2_score = %.2f' %(min_deg, min_rmse,score)) 
plt.show()

Python 確定多項(xiàng)式擬合/回歸的階數(shù)

因?yàn)橐蜃兞?Y = 2*(X**4) + X**2 + 9*X + 2 ，自變量和因變量是完整的公式，看圖很明顯，degree >=4 的都符合，擬合函數(shù)都正確。（RMSE 最小，R平方非負(fù)且接近于1，則模型最好）

如果將 Y 值改為如下：

y = np.array([300,500,0,-10,0,20,200,300,1000,800,4000,5000,10000,9000,22000]).reshape(-1, 1)

Python 確定多項(xiàng)式擬合/回歸的階數(shù)

degree=3 是最好的，且 r 平方也最接近于1（注意：如果 R 平方為負(fù)數(shù)，則不準(zhǔn)確，需再次測(cè)試。因樣本數(shù)據(jù)較少，可能也會(huì)判斷錯(cuò)誤）。

以上這篇Python 確定多項(xiàng)式擬合/回歸的階數(shù)實(shí)例就是小編分享給大家的全部?jī)?nèi)容了，希望能給大家一個(gè)參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

Python實(shí)現(xiàn)網(wǎng)站表單提交和模板
今天小編就為大家分享一篇關(guān)于Python實(shí)現(xiàn)網(wǎng)站表單提交和模板，小編覺得內(nèi)容挺不錯(cuò)的，現(xiàn)在分享給大家，具有很好的參考價(jià)值，需要的朋友一起跟隨小編來看看吧
2019-01-01
python實(shí)現(xiàn)Oracle查詢分組的方法示例
這篇文章主要介紹了python實(shí)現(xiàn)Oracle查詢分組的方法,結(jié)合實(shí)例形式分析了python使用group by子句及having子句實(shí)現(xiàn)Oracle查詢分組的相關(guān)操作技巧,需要的朋友可以參考下
2020-04-04
淺談python opencv對(duì)圖像顏色通道進(jìn)行加減操作溢出
這篇文章主要介紹了淺談python opencv對(duì)圖像顏色通道進(jìn)行加減操作溢出，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
2020-06-06
Python安裝spark的詳細(xì)過程
這篇文章主要介紹了Python安裝spark的詳細(xì)過程，本文通過圖文實(shí)例代碼相結(jié)合給大家介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
2021-10-10
利用Python抓取網(wǎng)頁數(shù)據(jù)的多種方式與示例詳解
在數(shù)據(jù)科學(xué)和網(wǎng)絡(luò)爬蟲領(lǐng)域,網(wǎng)頁數(shù)據(jù)抓取是非常重要的一項(xiàng)技能,Python 是進(jìn)行網(wǎng)頁抓取的流行語言,因?yàn)樗鼡碛袕?qiáng)大的第三方庫,能夠簡(jiǎn)化網(wǎng)頁解析和數(shù)據(jù)提取的過程,本篇文章將介紹幾種常見的網(wǎng)頁數(shù)據(jù)抓取方法,需要的朋友可以參考下
2025-04-04
python實(shí)現(xiàn)MongoDB的雙活示例
本文主要介紹了python實(shí)現(xiàn)MongoDB的雙活示例，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2023-02-02
分享十個(gè)Python超級(jí)好用提高工作效率的自動(dòng)化腳本
在這個(gè)自動(dòng)化時(shí)代，我們有很多重復(fù)無聊的工作要做。?想想這些你不再需要一次又一次地做的無聊的事情，讓它自動(dòng)化，讓你的生活更輕松。本文分享了10個(gè)Python自動(dòng)化腳本，希望對(duì)大家有所幫助
2022-11-11
pyenv切換不同的python版本的實(shí)現(xiàn)步驟
pyenv是一個(gè)流行的Python版本管理工具,支持在同一臺(tái)機(jī)器上安裝和切換多個(gè)Python版本,本文就來介紹一下pyenv切換不同的python版本,感興趣的可以了解一下
2024-12-12
python生成xml時(shí)規(guī)定dtd實(shí)例方法
在本篇文章里小編給大家整理的是關(guān)于python生成xml時(shí)規(guī)定dtd實(shí)例方法，需要的朋友們學(xué)習(xí)參考下。
2020-09-09
Python函數(shù)值傳遞引用傳遞及形式參數(shù)和實(shí)際參數(shù)的區(qū)別
這篇文章主要介紹了Python函數(shù)值傳遞引用傳遞及形式參數(shù)和實(shí)際參數(shù)的區(qū)別，具有一定的參考價(jià)值，需要的小伙伴可以參考一下，希望對(duì)你的學(xué)習(xí)有所幫助
2022-05-05