Python分割訓練集和測試集的方法示例
更新時間:2019年09月19日 10:30:50 作者:積微成著
這篇文章主要介紹了Python分割訓練集和測試集的方法示例,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
數據集介紹
使用數據集Wine,來自UCI 。包括178條樣本,13個特征。
import pandas as pd
import numpy as np
df_wine = pd.read_csv('https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data', header=None)
df_wine.columns = ['Class label', 'Alcohol',
'Malic acid', 'Ash',
'Alcalinity of ash', 'Magnesium',
'Total phenols', 'Flavanoids',
'Nonflavanoid phenols',
'Proanthocyanins',
'Color intensity', 'Hue',
'OD280/OD315 of diluted wines',
'Proline']
分割訓練集和測試集
隨機分割
分為訓練集和測試集
方法:使用scikit-learn中model_selection子模塊的train_test_split函數
from sklearn.model_selection import train_test_split X, y = df_wine.ix[:, 1:].values, df_wine.ix[:, 0].values X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=0)#隨機選擇25%作為測試集,剩余作為訓練集
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
Pandas統(tǒng)計計數value_counts()的使用
本文主要介紹了Pandas統(tǒng)計計數value_counts()的使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-07-07

