Python實(shí)現(xiàn)統(tǒng)計(jì)單詞出現(xiàn)的個(gè)數(shù)
最近在看python腳本語(yǔ)言,腳本語(yǔ)言是一種解釋性的語(yǔ)言,不需要編譯,可以直接用,由解釋器來(lái)負(fù)責(zé)解釋。python語(yǔ)言很強(qiáng)大,而且寫(xiě)起來(lái)很簡(jiǎn)潔。下面的一個(gè)例子就是用python統(tǒng)計(jì)單詞出現(xiàn)的個(gè)數(shù)。
import sys
import string
#import collections
if len(sys.argv) == 1 or sys.argv[1] in {"-h", "--help"}:
print("usage: uniqueword filename_1 filename_2 ... filename_n")
sys.exit()
else:
words = {}
# words = collections.defaultdict(int)
strip = string.whitespace + string.punctuation + string.digits + "\"'"
for filename in sys.argv[1:]:
for line in open(filename):
for word in line.split():
word = word.strip(strip)
if len(word) >= 2:
words[word] = words.get(word, 0) + 1
# words[word] += 1
for word in sorted(words):
print("'{0}' occurs {1} times".format(word,words[word]))
假設(shè)文件名是 uniqueword.py,在命令行下輸入: uniqueword.py filename_1 filename_2 ... filename_n中單詞出現(xiàn)的次數(shù)可以被統(tǒng)計(jì)出來(lái)。
第四行和第五行判斷是否有輸入?yún)?shù),如果輸入?yún)?shù)為空或者為-h, -help,則輸出幫助信息。
從第七行到第14行是核心部分,逐一打開(kāi)參數(shù)中指定的文件,并讀取每一行,再用字符串的split方法把讀取的行抽取出一個(gè)一個(gè)的單詞,但單詞長(zhǎng)度大于2的時(shí)候,把此單詞加入到字典words中。 其中words.get(word, 0)的意思是取出key等于word的value,如果key為空,則把value置為默認(rèn)值0. 最后打印出結(jié)果。
- Python統(tǒng)計(jì)列表中的重復(fù)項(xiàng)出現(xiàn)的次數(shù)的方法
- python實(shí)現(xiàn)簡(jiǎn)單中文詞頻統(tǒng)計(jì)示例
- Python實(shí)現(xiàn)對(duì)excel文件列表值進(jìn)行統(tǒng)計(jì)的方法
- python統(tǒng)計(jì)一個(gè)文本中重復(fù)行數(shù)的方法
- 用Python中的字典來(lái)處理索引統(tǒng)計(jì)的方法
- Python中統(tǒng)計(jì)函數(shù)運(yùn)行耗時(shí)的方法
- python統(tǒng)計(jì)cpu利用率的方法
- python數(shù)據(jù)結(jié)構(gòu)之二叉樹(shù)的統(tǒng)計(jì)與轉(zhuǎn)換實(shí)例
- python高斯分布概率密度函數(shù)的使用詳解
- python實(shí)現(xiàn)beta分布概率密度函數(shù)的方法
- Python實(shí)現(xiàn)的概率分布運(yùn)算操作示例
- Python統(tǒng)計(jì)分析模塊statistics用法示例
相關(guān)文章
Python中xmltodict模塊對(duì)XML的用法詳解
這篇文章主要介紹了Python中xmltodict模塊對(duì)XML的用法詳解,xmltodict?是一個(gè)用來(lái)處理xml數(shù)據(jù)的很方便的模塊,包含兩個(gè)常用方法parse和unparse,本文通過(guò)代碼介紹了用法,需要的朋友可以參考下2023-07-07
Python時(shí)間戳使用和相互轉(zhuǎn)換詳解
這篇文章主要為大家詳細(xì)介紹了Python時(shí)間戳使用和相互轉(zhuǎn)換的相關(guān)資料,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2017-12-12
PyCharm鼠標(biāo)右鍵不顯示Run unittest的解決方法
今天小編就為大家分享一篇PyCharm鼠標(biāo)右鍵不顯示Run unittest的解決方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-11-11
如何用python復(fù)制粘貼excel指定單元格(可保留格式)
這篇文章主要給大家介紹了關(guān)于如何用python復(fù)制粘貼excel指定單元格(可保留格式)的相關(guān)資料,利用python操作excel非常方便,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-07-07
python pandas中DataFrame類(lèi)型數(shù)據(jù)操作函數(shù)的方法
下面小編就為大家分享一篇python pandas中DataFrame類(lèi)型數(shù)據(jù)操作函數(shù)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-04-04
關(guān)于Python?中IndexError:list?assignment?index?out?of?rang
這篇文章主要介紹了Python?中IndexError:list?assignment?index?out?of?range?錯(cuò)誤解決,概述了兩個(gè)常見(jiàn)的列表函數(shù),它們可以幫助我們?cè)谔鎿Q兩個(gè)列表時(shí)幫助我們處理?Python?中的索引錯(cuò)誤,需要的朋友可以參考下2023-05-05
Python使用Flask框架獲取當(dāng)前查詢參數(shù)的方法
這篇文章主要介紹了Python使用Flask框架獲取當(dāng)前查詢參數(shù)的方法,實(shí)例分析了query_string獲取查詢參數(shù)的技巧,需要的朋友可以參考下2015-03-03

