python中如何實現(xiàn)將數(shù)據(jù)分成訓(xùn)練集與測試集的方法
更新時間:2019年09月13日 11:03:54 作者:DeepRunning
這篇文章主要介紹了python中如何實現(xiàn)將數(shù)據(jù)分成訓(xùn)練集與測試集的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
接下來,直接給出大家響應(yīng)的代碼,并對每一行進行標(biāo)注,希望能夠幫到大家。
需要用到的是庫是。numpy 、sklearn。
#導(dǎo)入相應(yīng)的庫(對數(shù)據(jù)庫進行切分需要用到的庫是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
#首先,讀取.CSV文件成矩陣的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
#對于矩陣而言,將矩陣倒數(shù)第一列之前的數(shù)值給了X(輸入數(shù)據(jù)),將矩陣大最后一列的數(shù)值給了y(標(biāo)簽)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
#利用train_test_split方法,將X,y隨機劃分問,訓(xùn)練集(X_train),訓(xùn)練集標(biāo)簽(X_test),測試卷(y_train),
測試集標(biāo)簽(y_test),安訓(xùn)練集:測試集=7:3的
概率劃分,到此步驟,可以直接對數(shù)據(jù)進行處理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
#此步驟,是為了將訓(xùn)練集與數(shù)據(jù)集的數(shù)據(jù)分別保存為CSV文件
#np.column_stack將兩個矩陣進行組合連接
train= np.column_stack((X_train,y_train))
#numpy.savetxt 將txt文件保存為。csv結(jié)尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')
完整沒解釋的代碼部分為
import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
python?基于aiohttp的異步爬蟲實戰(zhàn)詳解
這篇文章主要為大家介紹了python?基于aiohttp的異步爬蟲實戰(zhàn)詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-09-09
Python Pygame實戰(zhàn)之憤怒的小鳥游戲?qū)崿F(xiàn)
《憤怒的小鳥》其實活得還不錯,盡管我們一直在嘲笑它的IP帝國夢做得太大。但要知道,把休閑益智游戲的生意做到這個份上的,恐怕也就獨此一家了。本文將利用Pygame實現(xiàn)這一游戲,需要的可以參考一下2022-04-04
Python生成器next方法和send方法區(qū)別詳解
這篇文章主要介紹了Python生成器next方法和send方法區(qū)別詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-05-05
Python中str.format()和f-string的使用
本文主要介紹了Python中str.format()和f-string的使用,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02

