Python實現(xiàn)K折交叉驗證法的方法步驟
學(xué)習(xí)器在測試集上的誤差我們通常稱作“泛化誤差”。要想得到“泛化誤差”首先得將數(shù)據(jù)集劃分為訓(xùn)練集和測試集。那么怎么劃分呢?常用的方法有兩種,k折交叉驗證法和自助法。介紹這兩種方法的資料有很多。下面是k折交叉驗證法的python實現(xiàn)。
##一個簡單的2折交叉驗證
from sklearn.model_selection import KFold
import numpy as np
X=np.array([[1,2],[3,4],[1,3],[3,5]])
Y=np.array([1,2,3,4])
KF=KFold(n_splits=2) #建立4折交叉驗證方法 查一下KFold函數(shù)的參數(shù)
for train_index,test_index in KF.split(X):
print("TRAIN:",train_index,"TEST:",test_index)
X_train,X_test=X[train_index],X[test_index]
Y_train,Y_test=Y[train_index],Y[test_index]
print(X_train,X_test)
print(Y_train,Y_test)
#小結(jié):KFold這個包 劃分k折交叉驗證的時候,是以TEST集的順序為主的,舉例來說,如果劃分4折交叉驗證,那么TEST選取的順序為[0].[1],[2],[3]。
#提升
import numpy as np
from sklearn.model_selection import KFold
#Sample=np.random.rand(50,15) #建立一個50行12列的隨機數(shù)組
Sam=np.array(np.random.randn(1000)) #1000個隨機數(shù)
New_sam=KFold(n_splits=5)
for train_index,test_index in New_sam.split(Sam): #對Sam數(shù)據(jù)建立5折交叉驗證的劃分
#for test_index,train_index in New_sam.split(Sam): #默認第一個參數(shù)是訓(xùn)練集,第二個參數(shù)是測試集
#print(train_index,test_index)
Sam_train,Sam_test=Sam[train_index],Sam[test_index]
print('訓(xùn)練集數(shù)量:',Sam_train.shape,'測試集數(shù)量:',Sam_test.shape) #結(jié)果表明每次劃分的數(shù)量
#Stratified k-fold 按照百分比劃分數(shù)據(jù)
from sklearn.model_selection import StratifiedKFold
import numpy as np
m=np.array([[1,2],[3,5],[2,4],[5,7],[3,4],[2,7]])
n=np.array([0,0,0,1,1,1])
skf=StratifiedKFold(n_splits=3)
for train_index,test_index in skf.split(m,n):
print("train",train_index,"test",test_index)
x_train,x_test=m[train_index],m[test_index]
#Stratified k-fold 按照百分比劃分數(shù)據(jù)
from sklearn.model_selection import StratifiedKFold
import numpy as np
y1=np.array(range(10))
y2=np.array(range(20,30))
y3=np.array(np.random.randn(10))
m=np.append(y1,y2) #生成1000個隨機數(shù)
m1=np.append(m,y3)
n=[i//10 for i in range(30)] #生成25個重復(fù)數(shù)據(jù)
skf=StratifiedKFold(n_splits=5)
for train_index,test_index in skf.split(m1,n):
print("train",train_index,"test",test_index)
x_train,x_test=m1[train_index],m1[test_index]
Python中貌似沒有自助法(Bootstrap)現(xiàn)成的包,可能是因為自助法原理不難,所以自主實現(xiàn)難度不大。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
python中字符串數(shù)組逆序排列方法總結(jié)
在本篇文章里小編給大家整理了關(guān)于python中字符串數(shù)組如何逆序排列的相關(guān)知識點,需要的朋友們學(xué)習(xí)下。2019-06-06
Python生命游戲?qū)崿F(xiàn)原理及過程解析(附源代碼)
這篇文章主要介紹了Python生命游戲?qū)崿F(xiàn)原理及過程解析(附源代碼),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-08-08
每個 Python 開發(fā)者都應(yīng)該知道的7種好用工具(效率翻倍)
Python 從一種小的開源語言開始,到現(xiàn)在,它已經(jīng)成為開發(fā)者很受歡迎的編程語言之一。這篇文章主要介紹了每個 Python 開發(fā)者都應(yīng)該知道的7種好用工具(效率翻倍),需要的朋友可以參考下2021-03-03
TensorFlow人工智能學(xué)習(xí)數(shù)據(jù)合并分割統(tǒng)計示例詳解
這篇文章主要為大家介紹了TensorFlow人工智能學(xué)習(xí)數(shù)據(jù)合并分割及統(tǒng)計的示例詳解有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步2021-11-11
python圖片由RGB空間轉(zhuǎn)成LAB空間的實現(xiàn)方式
這篇文章主要介紹了python圖片由RGB空間轉(zhuǎn)成LAB空間的實現(xiàn)方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-10-10
Python+PIL實現(xiàn)批量在圖片上寫上自定義文本
Pillow 是一個 Python 的圖像處理庫,它是 Python Imaging Library (PIL) 的一個分支,并且增加了更多的功能,下面我們看看如何利用它實現(xiàn)批量在圖片上寫上自定義的文本吧2024-11-11
解決python3中自定義wsgi函數(shù),make_server函數(shù)報錯的問題
下面小編就為大家分享一篇解決python3中自定義wsgi函數(shù),make_server函數(shù)報錯的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2017-11-11

