Python實現(xiàn)的統(tǒng)計文章單詞次數(shù)功能示例
本文實例講述了Python實現(xiàn)的統(tǒng)計文章單詞次數(shù)功能。分享給大家供大家參考,具體如下:
題目是這樣的:你有一個目錄,放了你一個月的日記,都是 txt,為了避免分詞的問題,假設(shè)內(nèi)容都是英文,請統(tǒng)計出你認(rèn)為每篇日記最重要的詞。
其實就是統(tǒng)計一篇文章出現(xiàn)最多的單詞,但是要去除那些常見的連詞、介詞和謂語動詞等,代碼:
#coding=utf-8
import collections
import re
import os
useless_words=('the','a','an','and','by','of','in','on','is','to')
def get_important_word(file):
f=open(file)
word_counter=collections.Counter()
for line in f:
words=re.findall('\w+',line.lower())
word_counter.update(words)
f.close()
most_important_word=word_counter.most_common(1)[0][0]
count=2
while(most_important_word in useless_words):
most_important_word=word_counter.most_common(count)[count-1][0]
count+=1
num=word_counter.most_common(count)[count-1][1]
print 'the most important word in %s is %s,it appears %d times'%(file,most_important_word,num)
if __name__=='__main__':
filepath='.'
for dirpath,dirname,dirfiles in os.walk(filepath):
for file in dirfiles:
if os.path.splitext(file)[1]=='.txt':
abspath=os.path.join(dirpath,file)
if os.path.isfile(abspath):
get_important_word(abspath)
學(xué)習(xí)筆記:
collections模塊,是python內(nèi)建的模塊,提供了許多有用的集合類。我們這里用到了Counter類和其中的most_common()方法
PS:這里再為大家推薦2款相關(guān)統(tǒng)計工具供大家參考:
在線字?jǐn)?shù)統(tǒng)計工具:
http://tools.jb51.net/code/zishutongji
在線字符統(tǒng)計與編輯工具:
http://tools.jb51.net/code/char_tongji
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python文件與目錄操作技巧匯總》、《Python文本文件操作技巧匯總》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》及《Python入門與進(jìn)階經(jīng)典教程》
希望本文所述對大家Python程序設(shè)計有所幫助。
- Python統(tǒng)計列表元素出現(xiàn)次數(shù)的方法示例
- 利用Python3實現(xiàn)統(tǒng)計大量單詞中各字母出現(xiàn)的次數(shù)和頻率的方法
- python 統(tǒng)計list中各個元素出現(xiàn)的次數(shù)的幾種方法
- python統(tǒng)計字符串中字母出現(xiàn)次數(shù)代碼實例
- python統(tǒng)計文章中單詞出現(xiàn)次數(shù)實例
- Python統(tǒng)計文本詞匯出現(xiàn)次數(shù)的實例代碼
- Linux上使用Python統(tǒng)計每天的鍵盤輸入次數(shù)
- python 統(tǒng)計數(shù)組中元素出現(xiàn)次數(shù)并進(jìn)行排序的實例
- Python實現(xiàn)統(tǒng)計給定列表中指定數(shù)字出現(xiàn)次數(shù)的方法
- 5種Python統(tǒng)計次數(shù)方法技巧
相關(guān)文章
python實戰(zhàn)之利用pygame實現(xiàn)貪吃蛇游戲(一)
這篇文章主要介紹了python實戰(zhàn)之利用pygame實現(xiàn)貪吃蛇游戲,文中有非常詳細(xì)的代碼示例,對正在學(xué)習(xí)python的小伙伴們有很好的幫助喲,需要的朋友可以參考下2021-05-05
python中實現(xiàn)php的var_dump函數(shù)功能
這篇文章主要介紹了python中實現(xiàn)php的var_dump函數(shù)功能,var_dump函數(shù)在PHP中調(diào)試時非常實用,本文介紹在Python中實現(xiàn)這個函數(shù),需要的朋友可以參考下2015-01-01
使用django的ORM框架按月統(tǒng)計近一年內(nèi)的數(shù)據(jù)方法
今天小編就為大家分享一篇使用django的ORM框架按月統(tǒng)計近一年內(nèi)的數(shù)據(jù)方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-07-07

