python Pandas如何對(duì)數(shù)據(jù)集隨機(jī)抽樣
摘要:有時(shí)候我們只需要數(shù)據(jù)集中的一部分,并不需要全部的數(shù)據(jù)。這個(gè)時(shí)候我們就要對(duì)數(shù)據(jù)集進(jìn)行隨機(jī)的抽樣。pandas中自帶有抽樣的方法。
應(yīng)用場(chǎng)景:

我有10W行數(shù)據(jù),每一行都11列的屬性。
現(xiàn)在,我們只需要隨機(jī)抽取其中的2W行。
實(shí)現(xiàn)方法很簡(jiǎn)單:
利用Pandas庫中的sample。
DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
n是要抽取的行數(shù)。(例如n=20000時(shí),抽取其中的2W行)
frac是抽取的比列。(有一些時(shí)候,我們并對(duì)具體抽取的行數(shù)不關(guān)系,我們想抽取其中的百分比,這個(gè)時(shí)候就可以選擇使用frac,例如frac=0.8,就是抽取其中80%)
replace:是否為有放回抽樣,取replace=True時(shí)為有放回抽樣。
weights這個(gè)是每個(gè)樣本的權(quán)重,具體可以看官方文檔說明。
random_state這個(gè)在之前的文章已經(jīng)介紹過了。
axis是選擇抽取數(shù)據(jù)的行還是列。axis=0的時(shí)是抽取行,axis=1時(shí)是抽取列(也就是說axis=1時(shí),在列中隨機(jī)抽取n列,在axis=0時(shí),在行中隨機(jī)抽取n行)
具體用法:
假設(shè)DataFrame為df
import pandas as pd df.sample(n=20000)

另外,介紹一種不是Pandas中的方法。如果想用Numpy這個(gè)庫進(jìn)行也可以。
import numpy as np np.random.sample(Your_index)
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python中的map()函數(shù)和reduce()函數(shù)的用法
這篇文章主要介紹了Python中的map()函數(shù)和reduce()函數(shù)的用法,代碼基于Python2.x版本,需要的朋友可以參考下2015-04-04
代碼講解Python對(duì)Windows服務(wù)進(jìn)行監(jiān)控
本篇文章給大家分享了通過Python對(duì)Windows服務(wù)進(jìn)行監(jiān)控的實(shí)例代碼,對(duì)此有興趣的朋友可以學(xué)習(xí)參考下。2018-02-02
使用Python獲取網(wǎng)段IP個(gè)數(shù)以及地址清單的方法
今天小編就為大家分享一篇使用Python獲取網(wǎng)段IP個(gè)數(shù)以及地址清單的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11
Python 內(nèi)置函數(shù)之隨機(jī)函數(shù)詳情
這篇文章主要介紹了Python 內(nèi)置函數(shù)之隨機(jī)函數(shù),文章將圍繞Python 內(nèi)置函數(shù)、隨機(jī)函數(shù)的相關(guān)資料展開內(nèi)容,需要的朋友可以參考一下,希望對(duì)你有所幫助2021-11-11
python GUI庫圖形界面開發(fā)之PyQt5單選按鈕控件QRadioButton詳細(xì)使用方法與實(shí)例
這篇文章主要介紹了python GUI庫圖形界面開發(fā)之PyQt5單選按鈕控件QRadioButton詳細(xì)使用方法與實(shí)例,需要的朋友可以參考下2020-02-02
Python樹的序列化與反序列化的實(shí)現(xiàn)
在本文中,我們將深入討論如何實(shí)現(xiàn)樹的序列化與反序列化算法,提供Python代碼實(shí)現(xiàn),并詳細(xì)說明算法的原理和步驟,感興趣的可以了解一下2023-11-11
Python wxPython庫使用wx.ListBox創(chuàng)建列表框示例
這篇文章主要介紹了Python wxPython庫使用wx.ListBox創(chuàng)建列表框,結(jié)合實(shí)例形式分析了wxPython庫使用wx.ListBox創(chuàng)建列表框的簡(jiǎn)單實(shí)現(xiàn)方法及ListBox函數(shù)相關(guān)選項(xiàng)的功能,需要的朋友可以參考下2018-09-09

