Pandas數(shù)據(jù)離散化原理及實例解析

更新時間：2019年11月16日 12:03:45 作者：太虛真人

這篇文章主要介紹了Pandas數(shù)據(jù)離散化原理及實例解析,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下

為什么要離散化

連續(xù)屬性離散化的目的是為了簡化數(shù)據(jù)結(jié)構(gòu)，數(shù)據(jù)離散化技術(shù)可以用來減少給定連續(xù)屬性值的個數(shù)。離散化方法經(jīng)常作為數(shù)據(jù)挖掘的工具
扔掉一些信息,可以讓模型更健壯,泛化能力更強

什么是數(shù)據(jù)的離散化

連續(xù)屬性的離散化就是在連續(xù)屬性的值域上，將值域劃分為若干個離散的區(qū)間，最后用不同的符號或整數(shù) 值代表落在每個子區(qū)間中的屬性值

分箱

案例

1.先讀取股票的數(shù)據(jù)，篩選出p_change數(shù)據(jù)

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.將股票漲跌幅數(shù)據(jù)進(jìn)行分組

使用的工具：

pd.qcut(data, bins)——等深分箱：
- 對數(shù)據(jù)進(jìn)行分組將數(shù)據(jù)分組一般會與value_counts搭配使用，統(tǒng)計每組的個數(shù)
series.value_counts()：統(tǒng)計分組次數(shù)

# 自行分組
qcut = pd.qcut(p_change, 10)
# 計算分到每個組數(shù)據(jù)個數(shù)
qcut.value_counts()

自定義區(qū)間分組：

pd.cut(data, bins)——等寬分箱：
- bins是整數(shù)—等寬
- bins是列表--自定義分箱

# 自己指定分組區(qū)間
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

python爬蟲之自制英漢字典
這篇文章主要為大家詳細(xì)介紹了python爬蟲之自制英漢字典的相關(guān)資料，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2019-06-06
基于Python實現(xiàn)圖像文字識別OCR工具
在工作、生活中常常會用到，比如票據(jù)、漫畫、掃描件、照片的文本提取。本文主要介紹了基于PyQt + PaddleOCR實現(xiàn)的一個桌面端的OCR工具，用于快速實現(xiàn)圖片中文本區(qū)域自動檢測+文本自動識別，需要的朋友可以參考一下
2021-12-12
淺談python中的錯誤與異常
寫Python代碼的小伙伴不可避免地會遇到代碼執(zhí)行錯誤和異常，這次就來詳細(xì)的總結(jié)一下python中的錯誤和異常
2021-06-06
python根據(jù)出生日期獲得年齡的方法
這篇文章主要介紹了python根據(jù)出生日期獲得年齡的方法,涉及Python操作日期的技巧,具有一定參考借鑒價值,需要的朋友可以參考下
2015-03-03
Python安裝Bs4及使用方法
這篇文章主要介紹了Python安裝Bs4及使用方法，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2021-04-04
pandas中的DataFrame按指定順序輸出所有列的方法
下面小編就為大家分享一篇pandas中的DataFrame按指定順序輸出所有列的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-04-04
通過自學(xué)python能找到工作嗎
在本篇內(nèi)容里小編給大家分享的是一篇關(guān)于通過自學(xué)python能找到工作嗎的分析內(nèi)容，對此有興趣的朋友們可以參考下。
2020-06-06
SpringBoot調(diào)用python接口的實現(xiàn)步驟
本文主要介紹如何利用Springboot框架調(diào)用python腳本，文中通過示例代碼介紹的非常詳細(xì)，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-12-12
解決Pycharm運行時找不到文件的問題
今天小編就為大家分享一篇解決Pycharm運行時找不到文件的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-10-10
python3獲取控制臺輸入的數(shù)據(jù)的具體實例
在本篇內(nèi)容里小編給大家分享的是一篇關(guān)于python3獲取控制臺輸入的數(shù)據(jù)的具體實例內(nèi)容，需要的朋友們可以學(xué)習(xí)下。
2020-08-08