Pandas.DataFrame重置列的行名實(shí)現(xiàn)(set_index)
pandas.DataFrame中的現(xiàn)有列分配給索引index(行名,行標(biāo)簽)。為索引指定唯一的名稱很方便,因?yàn)槭褂胠oc,at選擇(提?。┰貢r(shí)很容易理解。
將描述以下內(nèi)容。
set_index()的使用方法
- 基本用法
- 將指定的列保留為數(shù)據(jù):參數(shù)drop
- 分配多索引
- 將索引更改為另一列(重置)
- 更改原始對(duì)象:參數(shù)inplace
讀取csv文件等時(shí)指定索引
使用索引(行名)提取(選擇)行和元素
了解如何更改索引的一部分或?qū)⒄麄€(gè)列表替換為列表等,而不是將現(xiàn)有列分配給索引。
請(qǐng)參考以下文章,
以下面的數(shù)據(jù)為例。
import pandas as pd
df = pd.read_csv('./data/22/sample_pandas_normal.csv')
print(df)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57set_index()的使用方法
基本用法
在第一個(gè)參數(shù)鍵中指定用作索引的列的列名(列標(biāo)簽)。指定的列設(shè)置為索引。
df_i = df.set_index('name')
print(df_i)
# age state point
# name
# Alice 24 NY 64
# Bob 42 CA 92
# Charlie 18 CA 70
# Dave 68 TX 70
# Ellen 24 CA 88
# Frank 30 NY 57
將指定的列保留為數(shù)據(jù):參數(shù)drop
默認(rèn)情況下,如上例所示,從數(shù)據(jù)列中刪除指定的列。如果參數(shù)drop = False,則指定的列將設(shè)置為index,并且也將保留在data列中。
df_id = df.set_index('name', drop=False)
print(df_id)
# name age state point
# name
# Alice Alice 24 NY 64
# Bob Bob 42 CA 92
# Charlie Charlie 18 CA 70
# Dave Dave 68 TX 70
# Ellen Ellen 24 CA 88
# Frank Frank 30 NY 57
分配多索引
如果在第一個(gè)參數(shù)鍵中指定了列名列表(列標(biāo)簽),則將多列分配為多索引。
df_mi = df.set_index(['state', 'name']) print(df_mi) # age point # state name # NY Alice 24 64 # CA Bob 42 92 # Charlie 18 70 # TX Dave 68 70 # CA Ellen 24 88 # NY Frank 30 57
使用sort_index()排序時(shí),它可以整齊顯示。
df_mi.sort_index(inplace=True) print(df_mi) # age point # state name # CA Bob 42 92 # Charlie 18 70 # Ellen 24 88 # NY Alice 24 64 # Frank 30 57 # TX Dave 68 70
使用sort_values()對(duì)行進(jìn)行排序以進(jìn)行說(shuō)明。有關(guān)排序的詳細(xì)信息,請(qǐng)參見(jiàn)以下文章。
pandas.DataFrame,Series排序(sort_values,sort_index)
默認(rèn)情況下,如果在set_index()中指定一列,則原始索引將被刪除。
print(df_i)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57
df_ii = df_i.set_index('state')
print(df_ii)
# ? ? ? ?age ?point
# state ? ? ? ? ? ?
# NY ? ? ?24 ? ? 64
# CA ? ? ?42 ? ? 92
# CA ? ? ?18 ? ? 70
# TX ? ? ?68 ? ? 70
# CA ? ? ?24 ? ? 88
# NY ? ? ?30 ? ? 57如果將參數(shù)append設(shè)置為True,則除了原始索引之外,還將將指定的列添加為新的層次結(jié)構(gòu)索引。
df_mi = df_i.set_index('state', append=True)
print(df_mi)
# age point
# name state
# Alice NY 24 64
# Bob CA 42 92
# Charlie CA 18 70
# Dave TX 68 70
# Ellen CA 24 88
# Frank NY 30 57
添加的列是最底層。使用swaplevel()切換圖層。
print(df_mi.swaplevel(0, 1)) # age point # state name # NY Alice 24 64 # CA Bob 42 92 # Charlie 18 70 # TX Dave 68 70 # CA Ellen 24 88 # NY Frank 30 57
將索引更改為另一列(重置)
與前面的示例一樣,如果使用set_index()指定列,則原始索引將被刪除。
如果要保留原始索引,請(qǐng)使用reset_index(),它會(huì)從0開(kāi)始按順序?qū)λ饕匦戮幪?hào)。
print(df_i) # ? ? ? ? ?age state ?point # name ? ? ? ? ? ? ? ? ? ?? # Alice ? ? 24 ? ?NY ? ? 64 # Bob ? ? ? 42 ? ?CA ? ? 92 # Charlie ? 18 ? ?CA ? ? 70 # Dave ? ? ?68 ? ?TX ? ? 70 # Ellen ? ? 24 ? ?CA ? ? 88 # Frank ? ? 30 ? ?NY ? ? 57 df_ri = df_i.reset_index() print(df_ri) # ? ? ? name ?age state ?point # 0 ? ?Alice ? 24 ? ?NY ? ? 64 # 1 ? ? ?Bob ? 42 ? ?CA ? ? 92 # 2 ?Charlie ? 18 ? ?CA ? ? 70 # 3 ? ? Dave ? 68 ? ?TX ? ? 70 # 4 ? ?Ellen ? 24 ? ?CA ? ? 88 # 5 ? ?Frank ? 30 ? ?NY ? ? 57
如果要將索引更改(重置)到另一列,請(qǐng)?jiān)趓eset_index()之后使用set_index()。如果一次性全部編寫,將如下所示。
df_change = df_i.reset_index().set_index('state')
print(df_change)
# name age point
# state
# NY Alice 24 64
# CA Bob 42 92
# CA Charlie 18 70
# TX Dave 68 70
# CA Ellen 24 88
# NY Frank 30 57
請(qǐng)注意,為方便起見(jiàn),在此示例中將具有重疊值的列設(shè)置為索引,但是如果索引值不重疊(每個(gè)值都是唯一的),則更容易選擇數(shù)據(jù)。
另請(qǐng)參見(jiàn)以下有關(guān)reset_index()的文章。
Pandas.DataFrame,重置Series的索引index(reset_index)
更改原始對(duì)象:參數(shù)inplace
默認(rèn)情況下,set_index()不會(huì)更改原始對(duì)象并返回新對(duì)象,但是如果inplace參數(shù)為True,則原始對(duì)象將被更改。
df.set_index('name', inplace=True)
print(df)
# age state point
# name
# Alice 24 NY 64
# Bob 42 CA 92
# Charlie 18 CA 70
# Dave 68 TX 70
# Ellen 24 CA 88
# Frank 30 NY 57
讀取csv文件等時(shí)指定索引
從csv文件等中讀取并生成pandas.DataFrame或pandas.Series時(shí),如果原始文件包含要用作索引的列,則可以在讀取時(shí)指定該列。
使用read_csv()讀取文件時(shí),在參數(shù)index_col中指定一個(gè)列號(hào),該列即成為索引。
df = pd.read_csv('./data/22/sample_pandas_normal.csv', index_col=0)
print(df)
# age state point
# name
# Alice 24 NY 64
# Bob 42 CA 92
# Charlie 18 CA 70
# Dave 68 TX 70
# Ellen 24 CA 88
# Frank 30 NY 57
有關(guān)讀取csv和tsv文件的詳細(xì)信息,請(qǐng)參見(jiàn)以下文章。
Pandas讀取csv/tsv文件(read_csv,read_table)
使用索引(行名)提?。ㄟx擇)行和元素
與前面的示例一樣,如果在索引(行名,行標(biāo)簽)中指定唯一的字符串,則可以按名稱提取(選擇)行或元素。
print(df) # ? ? ? ? ?age state ?point # name ? ? ? ? ? ? ? ? ? ?? # Alice ? ? 24 ? ?NY ? ? 64 # Bob ? ? ? 42 ? ?CA ? ? 92 # Charlie ? 18 ? ?CA ? ? 70 # Dave ? ? ?68 ? ?TX ? ? 70 # Ellen ? ? 24 ? ?CA ? ? 88 # Frank ? ? 30 ? ?NY ? ? 57 print(df.loc['Bob']) # age ? ? ?42 # state ? ?CA # point ? ?92 # Name: Bob, dtype: object print(df.at['Bob', 'age']) # 42
有關(guān)loc和at的信息,請(qǐng)參見(jiàn)以下文章。
Pandas獲取和修改任意位置的值(at,iat,loc,iloc)
到此這篇關(guān)于Pandas.DataFrame重置列的行名實(shí)現(xiàn)(set_index)的文章就介紹到這了,更多相關(guān)Pandas.DataFrame重置列的行名內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
用python代碼將tiff圖片存儲(chǔ)到j(luò)pg的方法
今天小編就為大家分享一篇用python代碼將tiff圖片存儲(chǔ)到j(luò)pg的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-12-12
Python使用psutil庫(kù)對(duì)系統(tǒng)數(shù)據(jù)進(jìn)行采集監(jiān)控的方法
利用psutil庫(kù)可以獲取系統(tǒng)的一些信息,如cpu,內(nèi)存等使用率,從而可以查看當(dāng)前系統(tǒng)的使用情況,實(shí)時(shí)采集這些信息可以達(dá)到實(shí)時(shí)監(jiān)控系統(tǒng)的目的。本文給大家介紹Python psutil系統(tǒng)監(jiān)控的相關(guān)知識(shí),感興趣的朋友一起看看吧2021-08-08
Python實(shí)現(xiàn)的微信公眾號(hào)群發(fā)圖片與文本消息功能實(shí)例詳解
這篇文章主要介紹了Python實(shí)現(xiàn)的微信公眾號(hào)群發(fā)圖片與文本消息功能,結(jié)合實(shí)例形式詳細(xì)分析了Python調(diào)用微信接口實(shí)現(xiàn)微信公眾號(hào)群發(fā)圖片與文本消息的具體操作步驟與相關(guān)注意事項(xiàng),需要的朋友可以參考下2017-06-06
Python解析網(wǎng)頁(yè)源代碼中的115網(wǎng)盤鏈接實(shí)例
這篇文章主要介紹了Python解析網(wǎng)頁(yè)源代碼中的115網(wǎng)盤鏈接實(shí)例,主要采用了正則表達(dá)式re模塊來(lái)實(shí)現(xiàn)該功能,需要的朋友可以參考下2014-09-09
使用pandas中的DataFrame.rolling方法查看時(shí)間序列中的異常值
Pandas是Python中最受歡迎的數(shù)據(jù)分析和處理庫(kù)之一,提供了許多強(qiáng)大且靈活的數(shù)據(jù)操作工具,在Pandas中,DataFrame.rolling方法是一個(gè)強(qiáng)大的工具,在本文中,我們將深入探討DataFrame.rolling方法的各種參數(shù)和示例,以幫助您更好地理解和應(yīng)用這個(gè)功能2023-12-12
Django項(xiàng)目的創(chuàng)建全過(guò)程
本文介紹了如何在Windows系統(tǒng)上安裝和配置Python解釋器、切換默認(rèn)版本、使用虛擬環(huán)境安裝Django,并通過(guò)PyCharm創(chuàng)建和管理Django項(xiàng)目2025-01-01
基于python實(shí)現(xiàn)動(dòng)態(tài)煙霧效果
動(dòng)態(tài)煙霧效果常用于游戲和動(dòng)畫中,為場(chǎng)景增添 逼真的視覺(jué)效果,在這篇博客中,我們將使用Python和Pygame庫(kù)來(lái)創(chuàng)建一個(gè)逼真的煙霧動(dòng)畫效果,感興趣的小伙伴跟著小編一起來(lái)看看吧2024-09-09
python爬蟲(chóng)分布式獲取數(shù)據(jù)的實(shí)例方法
在本篇內(nèi)容里小編給大家整理的是一篇關(guān)于python爬蟲(chóng)分布式獲取數(shù)據(jù)的實(shí)例方法,有興趣的朋友們可以參考下。2020-11-11

