分享python數(shù)據(jù)統(tǒng)計(jì)的一些小技巧
最近在用python做數(shù)據(jù)統(tǒng)計(jì),這里總結(jié)了一些最近使用時(shí)查找和總結(jié)的一些小技巧,希望能幫助在做這方面時(shí)的一些童鞋。有些技巧是很平常的用法,平時(shí)我們沒有注意,但是在特定場景,這些小方法還是能帶來很大的幫助。
1.在字典中將鍵映射到多個(gè)值上面
{'b': [4, 5, 6],
'a': [1, 2, 3]}
有時(shí)候我們在統(tǒng)計(jì)相同key值的時(shí)候,希望把所有相同key的條目添加到以key為鍵的一個(gè)字典中,然后再進(jìn)行各種操作,這時(shí)候我們就可以使用下面的代碼進(jìn)行操作:
from collections import defaultdict
d = defaultdict(list)
print(d)
d['a'].append(1)
d['a'].append(2)
d['a'].append(3)
d['b'].append(4)
d['b'].append(5)
d['b'].append(6)
print(d)
print(d.get("a"))
print(d.keys())
print([d.get(i) for i in d])
這里是使用了collections中的方法,這里面還擁有很多有用的方法,我們有時(shí)間在繼續(xù)進(jìn)行深入了解。
上面代碼運(yùn)行結(jié)果:
defaultdict(, {})
defaultdict(, {'b': [4, 5, 6], 'a': [1, 2, 3]})
[1, 2, 3]
dict_keys(['b', 'a'])
[[4, 5, 6], [1, 2, 3]]
我們將數(shù)據(jù)填入之后,相當(dāng)于進(jìn)行快速分組,然后遍歷每個(gè)組就可以統(tǒng)計(jì)一些我們需要的數(shù)據(jù)。
2.迅速轉(zhuǎn)換字典鍵值對
data = {...}
zip(data.values(), data.keys())
data是我們的格式數(shù)據(jù),使用zip后進(jìn)行快速鍵值轉(zhuǎn)換,然后可以使用max,min之類函數(shù)進(jìn)行數(shù)據(jù)操作。
3.通過公共鍵對字典進(jìn)行排序
from operator import itemgetter
data = [
{'name': "bran", "uid": 101},
{'name': "xisi", "uid": 102},
{'name': "land", "uid": 103}
]
print(sorted(data, key=itemgetter("name")))
print(sorted(data, key=itemgetter("uid")))
數(shù)據(jù)格式就是data,我們想要對name或者uid進(jìn)行排序我們就是用代碼中的方法。
運(yùn)行結(jié)果:
[{'name': 'bran', 'uid': 101}, {'name': 'land', 'uid': 103}, {'name': 'xisi', 'uid': 102}]
[{'name': 'bran', 'uid': 101}, {'name': 'xisi', 'uid': 102}, {'name': 'land', 'uid': 103}]
正如我們期望中的一樣
4.對列表中的多個(gè)字典根據(jù)某一字段進(jìn)行分組
注意注意,在進(jìn)行分組前要首先對數(shù)據(jù)進(jìn)行排序處理,排序字段根據(jù)實(shí)際要求來選擇
即將處理的數(shù)據(jù):
rows = [
{'name': "bran", "uid": 101, "class": 13},
{'name': "xisi", "uid": 101, "class": 11},
{'name': "land", "uid": 103, "class": 10}
]
期望處理結(jié)果:
{
101: [{'name': 'xisi', 'class': 11, 'uid': 101},{'name': 'bran', 'class': 13, 'uid': 101}],
103: [{'name': 'land', 'class': 10, 'uid': 103}]
}
我們按照uid進(jìn)行分組,這里只是演示,uid一般也不會(huì)重復(fù)。
這個(gè)比較復(fù)雜一點(diǎn),我們一部一步來分解
some = [('a', [1, 2, 3]), ('b', [4, 5, 6])]
print(dict(some))
結(jié)果:
{'b': [4, 5, 6], 'a': [1, 2, 3]}
這里我們的目的是將元組轉(zhuǎn)換成字典,這個(gè)很簡單,應(yīng)該都能看懂。接著我們來下一步對待處理數(shù)據(jù)進(jìn)行排序:
data_one = sorted(rows, key=itemgetter("class"))
print(data_one)
data_two = sorted(rows, key=lambda x: (x["uid"], x["class"]))
print(data_two)
這里我們提供兩種排序方式原理相同,只是樣式稍有區(qū)別,第一種data_one是直接使用itemgetter,按照我們前面使用過得,直接按照某一字段進(jìn)行排序,可是有時(shí)候我們會(huì)有另一種要求:
先按照某一字段排序,當(dāng)?shù)谝蛔侄沃貜?fù)時(shí),再按照另一字段排序。
這時(shí)我們就用第二種方法,進(jìn)行多字段值排序。
排序結(jié)果如下:
[{'name': 'land', 'class': 10, 'uid': 103}, {'name': 'xisi', 'class': 11, 'uid': 101}, {'name': 'bran', 'class': 13, 'uid': 101}]
[{'name': 'xisi', 'class': 11, 'uid': 101}, {'name': 'bran', 'class': 13, 'uid': 101}, {'name': 'land', 'class': 10, 'uid': 103}]
結(jié)果大家慢慢看一下,還是略有差別。
接下來就進(jìn)行最后一步了,將我們剛才講的兩種方式結(jié)合起來使用:
data = dict([(g, list(k)) for g, k in groupby(data_two, key=lambda x: x["uid"])]) print(data)
我們對排序好的數(shù)據(jù)進(jìn)行分組,然后生成元組列表,最后將其轉(zhuǎn)換成字典,這里大功告成,我們成功將數(shù)據(jù)進(jìn)行分組。
python數(shù)據(jù)統(tǒng)計(jì)的一些小技巧就分享到這,有需要的可以參考學(xué)習(xí)。
相關(guān)文章
Python?常用模塊threading和Thread模塊之線程池
這篇文章主要介紹了Python?threading和Thread模塊之線程池,線程池如消費(fèi)者,負(fù)責(zé)接收任務(wù),并將任務(wù)分配到一個(gè)空閑的線程中去執(zhí)行。并不關(guān)心是哪一個(gè)線程執(zhí)行的這個(gè)任務(wù),具體介紹需要的小伙伴可以參考下面文章詳細(xì)內(nèi)容2022-06-06
Python基于Floyd算法求解最短路徑距離問題實(shí)例詳解
這篇文章主要介紹了Python基于Floyd算法求解最短路徑距離問題,結(jié)合完整實(shí)例形式詳細(xì)分析了Python使用Floyd算法求解最短路徑距離問題的相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下2018-05-05
Python筆記之a(chǎn) = [0]*x格式的含義及說明
這篇文章主要介紹了Python筆記之a(chǎn) = [0]*x格式的含義及說明,具有很好的參考價(jià)值,希望對大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-05-05
Python中pycharm編輯器界面風(fēng)格修改方法
這篇文章主要介紹了Python中pycharm編輯器界面風(fēng)格修改方法,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03
python中實(shí)現(xiàn)精確的浮點(diǎn)數(shù)運(yùn)算詳解
計(jì)算機(jī)智能處理可數(shù)集合的運(yùn)算,但是全體實(shí)數(shù)是不可數(shù)的,所以計(jì)算機(jī)只能用一些奇怪的方法來擬合他,于是就產(chǎn)生了浮點(diǎn)數(shù)。下面這篇文章主要給大家介紹了關(guān)于python中實(shí)現(xiàn)精確浮點(diǎn)數(shù)運(yùn)算的相關(guān)資料,需要的朋友可以參考借鑒,下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧。2017-11-11
pytorch張量和numpy數(shù)組相互轉(zhuǎn)換
在使用pytorch作為深度學(xué)習(xí)的框架時(shí),經(jīng)常會(huì)遇到張量tensor和矩陣numpy的類型的相互轉(zhuǎn)化的問題,本文主要介紹了pytorch張量和numpy數(shù)組相互轉(zhuǎn)換,感興趣的可以了解一下2024-02-02

