python pandas 組內排序、單組排序、標號的實例
摘要:本文主要是講解一下,如何進行排序。分為兩種情況,不分組進行排序和組內進行排序。什么意思呢?具體來說,我舉個栗子。
****注意****
如果只是單純想對某一列進行排序,而不進行打序號的話直接使用.sort_values就可以了。下文是關于如何把序號也打上的
————————————————————————————
我們有一個數(shù)據(jù)集如下:

我們下面想進行兩種排序。先說第一種比較簡單的也是很常用的,簡單的對某一列進行排序然后添加一列序號。
例如,我們隊comment_num這一列進行從大到小的排序,然后給出序號。如下圖:

可以看到,sort_num這一列就是我們隊comment_num的排序。
如何實現(xiàn)呢?很簡單,代碼如下(數(shù)據(jù)集為data):
data['sort_num']=data['comment_num'].rank(ascending=0,method='dense')
這里,我們用到了兩個參數(shù),第一個很好理解 ascending,就是選擇是升序還是降序排列。
另外一個參數(shù)method,這個參數(shù)很重要。我下面詳細講一下。
有時候,我們排序的時候會遇到相同大小,這個時候怎么處理呢?method其實就是讓我們選擇如何處理。
有以下幾種處理方案:
第一種情況,如果出現(xiàn)相等,則序號一樣,之后序號照常遞增。這種情況就是上圖的,我們看到comment_num等于4的有2個,序號為1。comment_num等于3的時候,序號為2,這個叫做正常按1依次遞增。這和時候method='dense'
第二種情況,如果出現(xiàn)相等,則取最先出現(xiàn)的值序號為“最小”,其他相同值依次按1遞增,如果把上面代碼method='first',就是實現(xiàn)這種效果,效果如下圖:
data['sort_num']=data['comment_num'].rank(ascending=0,method='first')

comment_num中,4最大,并且第1行中的4最先出現(xiàn),故序號為1。
第三種情況和第四種情況比較復雜。文字不好說明,下面直接放代碼和效果。
當method='min'時
data['sort_num']=data['comment_num'].rank(ascending=0,method='min')

當method='max'時
data['sort_num']=data['comment_num'].rank(ascending=0,method='max')

--------------------------------分割線--------------------------------------
上面只是某一列的排序,下面是組內排序。什么是意思?同樣看下面的例子

假如,我想對cate為7的comment_num進行排序,同樣也對,cate為8的comment_num進行排序。也就是說,對comment_num排序的時候,只考慮相同的cate,這個就是對組內進行排序。
實現(xiàn)的效果應該如下圖:

實現(xiàn)代碼也很簡單。
data['group_sort']=data['comment_num'].groupby(data['cate']).rank(ascending=0,method='dense')
以上這篇python pandas 組內排序、單組排序、標號的實例就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
anaconda升級sklearn版本的實現(xiàn)方法
這篇文章主要介紹了anaconda升級sklearn版本的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2021-02-02
基于Pytorch的神經網絡之Regression的實現(xiàn)
本文主要介紹了基于Pytorch的神經網絡之Regression的實現(xiàn),文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-03-03

