python用字典統(tǒng)計單詞或漢字詞個數(shù)示例
有如下格式的文本文件
/“/請/!/”/“/請/!/”/兩名/劍士/各自/倒轉(zhuǎn)/劍尖/,/右手/握/劍柄/,
/左手/搭于/右手/手背/,/躬身行禮/。/兩/人/身子/尚未/站/直/,
/突然/間/白光閃/動/,/跟著/錚的/一/聲響/,
/雙劍相/交/,/兩/人/各/退一步/。
/旁/觀眾/人/都/是/“/咦/”/的/一聲/輕呼/。/青衣/劍士/連/劈/三/劍/
將這段話進(jìn)行詞頻統(tǒng)計,結(jié)果是 詞—詞數(shù) 的形式,比如 請 2 ,并把結(jié)果放到txt文件中。
這樣的問題利用詞或單詞作為字典的key,循環(huán)判斷有不有這個key,沒有新增一個,有的話,將這個key對應(yīng)的value加1
#coding:utf-8
word_lst = []
word_dict = {}
with open("中文.txt","r") as f1 ,open("詞次數(shù).txt",'w') as f2:
for line in f1:
word_lst.append(line.split('/'))
for item in word_lst:
for item2 in item:
if item2.strip() not in ",!?!啊? :
if item2 not in word_dict:
word_dict[item2] = 1
else :
word_dict[item2] += 1
for key in word_dict:
print key,word_dict[key]
f2.write(key+' '+str(word_dict[key]))
- Python統(tǒng)計列表中的重復(fù)項出現(xiàn)的次數(shù)的方法
- python統(tǒng)計文本字符串里單詞出現(xiàn)頻率的方法
- python實現(xiàn)簡單中文詞頻統(tǒng)計示例
- Python實現(xiàn)統(tǒng)計單詞出現(xiàn)的個數(shù)
- python統(tǒng)計文本文件內(nèi)單詞數(shù)量的方法
- Python實現(xiàn)對excel文件列表值進(jìn)行統(tǒng)計的方法
- Python3讀取UTF-8文件及統(tǒng)計文件行數(shù)的方法
- python統(tǒng)計一個文本中重復(fù)行數(shù)的方法
- python統(tǒng)計字母、空格、數(shù)字等字符個數(shù)的實例
- 使用coverage統(tǒng)計python web項目代碼覆蓋率的方法詳解
相關(guān)文章
關(guān)于python爬蟲應(yīng)用urllib庫作用分析
這篇文章主要介紹了關(guān)于python爬蟲應(yīng)用urllib庫作用分析,想要進(jìn)行python爬蟲首先我們需要先將網(wǎng)頁上面的信息給獲取下來,這就是utllib庫的作用,有需要的朋友可以借鑒參考下2021-09-09
pandas將Series轉(zhuǎn)成DataFrame的實現(xiàn)
本文主要介紹了pandas將Series轉(zhuǎn)成DataFrame的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01
Django框架中數(shù)據(jù)的連鎖查詢和限制返回數(shù)據(jù)的方法
這篇文章主要介紹了Django框架中數(shù)據(jù)的連鎖查詢和限制返回數(shù)據(jù)的方法,Django是Python重多高人氣框架中最為著名的一個,需要的朋友可以參考下2015-07-07
Python如何解決secure_filename對中文不支持問題
最近使用到了secure_filename,然后悲劇的發(fā)現(xiàn)中文居然不展示出來,本文就詳細(xì)的介紹一下解決方法,感興趣的可以了解一下2021-07-07
R語言 vs Python對比:數(shù)據(jù)分析哪家強?
R語言和Python在數(shù)據(jù)分析方法都各有所長,兩者現(xiàn)在可以說是都非常熱門的,那么這篇文章就來給大家總結(jié)介紹關(guān)于R語言和Python數(shù)據(jù)分析的相關(guān)資料,并給大家推薦了一些相關(guān)的書籍學(xué)習(xí),需要的朋友可以參考借鑒,下面隨著小編來一起看看吧。2017-11-11

