布同 統(tǒng)計(jì)英文單詞的個(gè)數(shù)的python代碼
更新時(shí)間:2011年03月13日 13:21:09 作者:
最近需要翻譯英文文章,所以需要統(tǒng)計(jì)單詞個(gè)數(shù)。索性寫(xiě)了一段代碼在此,可以簡(jiǎn)單的統(tǒng)計(jì)單詞的個(gè)數(shù)
word中對(duì)于英文單詞的統(tǒng)計(jì)也很好,大家不妨試試。如果沒(méi)有安裝word,而且你也是程序員的話,那么可以使用我的這段代碼。通過(guò)測(cè)試,word的統(tǒng)計(jì)結(jié)果是18674,軟件的統(tǒng)計(jì)結(jié)果是18349,相差不到2%,可以作為一個(gè)參考。
代碼如下:
# -*- coding: utf-8 -*-
import os,sys
info = os.getcwd() #獲取當(dāng)前文件名稱
fin = open(u'谷歌C++編程代碼規(guī)范.txt')
info = fin.read()
alist = info.split(' ') # 將文章按照空格劃分開(kāi)
fout = open(u'count.txt', 'w')
fout.write('\n'.join(alist)) # 可以通過(guò)文本文件的行號(hào)同樣看到效果
##fout.write('%s' % alist)
fout.close()
allen = len(alist) # 總的單詞數(shù)
nulen = alist.count('') # 空格的數(shù)量
print "words' number is",allen
print "null number is",nulen
print "poor words number is", allen-nulen # 實(shí)際的單詞數(shù)目
fin.close()
代碼如下:
復(fù)制代碼 代碼如下:
# -*- coding: utf-8 -*-
import os,sys
info = os.getcwd() #獲取當(dāng)前文件名稱
fin = open(u'谷歌C++編程代碼規(guī)范.txt')
info = fin.read()
alist = info.split(' ') # 將文章按照空格劃分開(kāi)
fout = open(u'count.txt', 'w')
fout.write('\n'.join(alist)) # 可以通過(guò)文本文件的行號(hào)同樣看到效果
##fout.write('%s' % alist)
fout.close()
allen = len(alist) # 總的單詞數(shù)
nulen = alist.count('') # 空格的數(shù)量
print "words' number is",allen
print "null number is",nulen
print "poor words number is", allen-nulen # 實(shí)際的單詞數(shù)目
fin.close()
您可能感興趣的文章:
- python實(shí)現(xiàn)統(tǒng)計(jì)漢字/英文單詞數(shù)的正則表達(dá)式
- Python實(shí)現(xiàn)統(tǒng)計(jì)英文單詞個(gè)數(shù)及字符串分割代碼
- Python統(tǒng)計(jì)純文本文件中英文單詞出現(xiàn)個(gè)數(shù)的方法總結(jié)【測(cè)試可用】
- Python3實(shí)現(xiàn)統(tǒng)計(jì)單詞表中每個(gè)字母出現(xiàn)頻率的方法示例
- python 文本單詞提取和詞頻統(tǒng)計(jì)的實(shí)例
- python實(shí)現(xiàn)字符串中字符分類及個(gè)數(shù)統(tǒng)計(jì)
- python 統(tǒng)計(jì)數(shù)組中元素出現(xiàn)次數(shù)并進(jìn)行排序的實(shí)例
- python統(tǒng)計(jì)字母、空格、數(shù)字等字符個(gè)數(shù)的實(shí)例
- Python實(shí)現(xiàn)統(tǒng)計(jì)英文文章詞頻的方法分析
相關(guān)文章
一文詳解python如何將編寫(xiě)的模塊打包上傳至pypi
我們此前花了很大功夫?qū)懥艘粋€(gè)極其簡(jiǎn)單的web框架myWeb,想要給別人用的時(shí)候,需要讓別人拷貝源代碼才行,這太low了,所以本篇文章會(huì)介紹如何將自己寫(xiě)的模塊打包上傳至pypi,以便讓需要的人通過(guò)pip進(jìn)行安裝,感興趣的同學(xué)可以參考閱讀2023-05-05
針對(duì)Pandas的總結(jié)以及數(shù)據(jù)讀取_pd.read_csv()的使用詳解
這篇文章主要針對(duì)Pandas總結(jié)以及數(shù)據(jù)讀取_pd.read_csv()的使用詳解做出了實(shí)例,講解非常全面,值得收藏,需要的朋友可以參考下2023-03-03
pycharm中報(bào)ModuleNotFoundError:No?module?named?'tensor
這篇文章主要給大家介紹了關(guān)于pycharm中報(bào)ModuleNotFoundError:No?module?named?'tensorflow'錯(cuò)誤的解決方法,文中通過(guò)圖文介紹的非常詳細(xì),需要的朋友可以參考下2023-07-07
DataFrame 將某列數(shù)據(jù)轉(zhuǎn)為數(shù)組的方法
下面小編就為大家分享一篇DataFrame 將某列數(shù)據(jù)轉(zhuǎn)為數(shù)組的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-04-04
Python 實(shí)現(xiàn)自動(dòng)導(dǎo)入缺失的庫(kù)
這篇文章主要介紹了Python 實(shí)現(xiàn)自動(dòng)導(dǎo)入缺失的庫(kù),解決導(dǎo)入 Python 庫(kù)失敗的問(wèn)題,本文分三種情況給大家介紹,需要的朋友可以參考下2019-10-10
Django自定義YamlField實(shí)現(xiàn)過(guò)程解析
這篇文章主要介紹了Django自定義YamlField實(shí)現(xiàn)過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-11-11

