Pandas.DataFrame重置列的行名實(shí)現(xiàn)(set_index)

更新時(shí)間：2023年02月23日 09:54:45 作者：餃子大人

本文主要介紹了Pandas.DataFrame重置列的行名實(shí)現(xiàn)(set_index)，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

import pandas as pd

df = pd.read_csv('./data/22/sample_pandas_normal.csv')
print(df)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

set_index（）的使用方法

基本用法

在第一個(gè)參數(shù)鍵中指定用作索引的列的列名（列標(biāo)簽）。指定的列設(shè)置為索引。

df_i = df.set_index('name')
print(df_i)
#          age state  point
# name                     
# Alice     24    NY     64
# Bob       42    CA     92
# Charlie   18    CA     70
# Dave      68    TX     70
# Ellen     24    CA     88
# Frank     30    NY     57

將指定的列保留為數(shù)據(jù)：參數(shù)drop

默認(rèn)情況下，如上例所示，從數(shù)據(jù)列中刪除指定的列。如果參數(shù)drop = False，則指定的列將設(shè)置為index，并且也將保留在data列中。

df_id = df.set_index('name', drop=False)
print(df_id)
#             name  age state  point
# name                              
# Alice      Alice   24    NY     64
# Bob          Bob   42    CA     92
# Charlie  Charlie   18    CA     70
# Dave        Dave   68    TX     70
# Ellen      Ellen   24    CA     88
# Frank      Frank   30    NY     57

分配多索引

如果在第一個(gè)參數(shù)鍵中指定了列名列表（列標(biāo)簽），則將多列分配為多索引。

df_mi = df.set_index(['state', 'name'])
print(df_mi)
#                age  point
# state name               
# NY    Alice     24     64
# CA    Bob       42     92
#       Charlie   18     70
# TX    Dave      68     70
# CA    Ellen     24     88
# NY    Frank     30     57

使用sort_index（）排序時(shí)，它可以整齊顯示。

df_mi.sort_index(inplace=True)
print(df_mi)
#                age  point
# state name               
# CA    Bob       42     92
#       Charlie   18     70
#       Ellen     24     88
# NY    Alice     24     64
#       Frank     30     57
# TX    Dave      68     70

使用sort_values（）對(duì)行進(jìn)行排序以進(jìn)行說(shuō)明。有關(guān)排序的詳細(xì)信息，請(qǐng)參見(jiàn)以下文章。

pandas.DataFrame，Series排序（sort_values，sort_index）

默認(rèn)情況下，如果在set_index（）中指定一列，則原始索引將被刪除。

print(df_i)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57

df_ii = df_i.set_index('state')
print(df_ii)
# ? ? ? ?age ?point
# state ? ? ? ? ? ?
# NY ? ? ?24 ? ? 64
# CA ? ? ?42 ? ? 92
# CA ? ? ?18 ? ? 70
# TX ? ? ?68 ? ? 70
# CA ? ? ?24 ? ? 88
# NY ? ? ?30 ? ? 57

如果將參數(shù)append設(shè)置為True，則除了原始索引之外，還將將指定的列添加為新的層次結(jié)構(gòu)索引。

df_mi = df_i.set_index('state', append=True)
print(df_mi)
#                age  point
# name    state            
# Alice   NY      24     64
# Bob     CA      42     92
# Charlie CA      18     70
# Dave    TX      68     70
# Ellen   CA      24     88
# Frank   NY      30     57

添加的列是最底層。使用swaplevel（）切換圖層。

print(df_mi.swaplevel(0, 1))
#                age  point
# state name               
# NY    Alice     24     64
# CA    Bob       42     92
#       Charlie   18     70
# TX    Dave      68     70
# CA    Ellen     24     88
# NY    Frank     30     57

將索引更改為另一列（重置）

與前面的示例一樣，如果使用set_index（）指定列，則原始索引將被刪除。

如果要保留原始索引，請(qǐng)使用reset_index（），它會(huì)從0開(kāi)始按順序?qū)λ饕匦戮幪?hào)。

print(df_i)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57

df_ri = df_i.reset_index()
print(df_ri)
# ? ? ? name ?age state ?point
# 0 ? ?Alice ? 24 ? ?NY ? ? 64
# 1 ? ? ?Bob ? 42 ? ?CA ? ? 92
# 2 ?Charlie ? 18 ? ?CA ? ? 70
# 3 ? ? Dave ? 68 ? ?TX ? ? 70
# 4 ? ?Ellen ? 24 ? ?CA ? ? 88
# 5 ? ?Frank ? 30 ? ?NY ? ? 57

如果要將索引更改（重置）到另一列，請(qǐng)?jiān)趓eset_index（）之后使用set_index（）。如果一次性全部編寫，將如下所示。

df_change = df_i.reset_index().set_index('state')
print(df_change)
#           name  age  point
# state                     
# NY       Alice   24     64
# CA         Bob   42     92
# CA     Charlie   18     70
# TX        Dave   68     70
# CA       Ellen   24     88
# NY       Frank   30     57

請(qǐng)注意，為方便起見(jiàn)，在此示例中將具有重疊值的列設(shè)置為索引，但是如果索引值不重疊（每個(gè)值都是唯一的），則更容易選擇數(shù)據(jù)。

另請(qǐng)參見(jiàn)以下有關(guān)reset_index（）的文章。

Pandas.DataFrame,重置Series的索引index(reset_index)

更改原始對(duì)象：參數(shù)inplace

默認(rèn)情況下，set_index（）不會(huì)更改原始對(duì)象并返回新對(duì)象，但是如果inplace參數(shù)為True，則原始對(duì)象將被更改。

df.set_index('name', inplace=True)
print(df)
#          age state  point
# name                     
# Alice     24    NY     64
# Bob       42    CA     92
# Charlie   18    CA     70
# Dave      68    TX     70
# Ellen     24    CA     88
# Frank     30    NY     57

讀取csv文件等時(shí)指定索引

從csv文件等中讀取并生成pandas.DataFrame或pandas.Series時(shí)，如果原始文件包含要用作索引的列，則可以在讀取時(shí)指定該列。

使用read_csv（）讀取文件時(shí)，在參數(shù)index_col中指定一個(gè)列號(hào)，該列即成為索引。

df = pd.read_csv('./data/22/sample_pandas_normal.csv', index_col=0)
print(df)
#          age state  point
# name
# Alice     24    NY     64
# Bob       42    CA     92
# Charlie   18    CA     70
# Dave      68    TX     70
# Ellen     24    CA     88
# Frank     30    NY     57

有關(guān)讀取csv和tsv文件的詳細(xì)信息，請(qǐng)參見(jiàn)以下文章。

Pandas讀取csv/tsv文件（read_csv，read_table）

使用索引（行名）提?。ㄟx擇）行和元素

與前面的示例一樣，如果在索引（行名，行標(biāo)簽）中指定唯一的字符串，則可以按名稱提取（選擇）行或元素。

print(df)
# ? ? ? ? ?age state ?point
# name ? ? ? ? ? ? ? ? ? ??
# Alice ? ? 24 ? ?NY ? ? 64
# Bob ? ? ? 42 ? ?CA ? ? 92
# Charlie ? 18 ? ?CA ? ? 70
# Dave ? ? ?68 ? ?TX ? ? 70
# Ellen ? ? 24 ? ?CA ? ? 88
# Frank ? ? 30 ? ?NY ? ? 57

print(df.loc['Bob'])
# age ? ? ?42
# state ? ?CA
# point ? ?92
# Name: Bob, dtype: object

print(df.at['Bob', 'age'])
# 42

有關(guān)loc和at的信息，請(qǐng)參見(jiàn)以下文章。

Pandas獲取和修改任意位置的值（at,iat,loc,iloc）

到此這篇關(guān)于Pandas.DataFrame重置列的行名實(shí)現(xiàn)(set_index)的文章就介紹到這了,更多相關(guān)Pandas.DataFrame重置列的行名內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: