pandas factorize實現將字符串特征轉化為數字特征
更新時間:2019年12月19日 14:19:08 作者:很吵請安青爭
今天小編就為大家分享一篇pandas factorize實現將字符串特征轉化為數字特征,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
將原始數據中的字符串特征轉化為模型可以識別的數字特征可是使用pandas自帶的factorzie方法。
原始數據的job特征值如下

都是字符串特征,無法用于訓練,當然可以單獨建立map硬編碼處理,但是pandas已經封裝好了相應的方法。
data = pd.read_csv("data/test_set.csv")
data["job"] = pd.factorize(data["job"])[0].astype(np.uint16)

以上這篇pandas factorize實現將字符串特征轉化為數字特征就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
Python Pytest裝飾器@pytest.mark.parametrize詳解
本文主要介紹了Python Pytest裝飾器@pytest.mark.parametrize詳解,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-08-08

