Python使用chardet判斷字符編碼
本文實(shí)例講述了Python使用chardet判斷字符編碼的方法。分享給大家供大家參考。具體分析如下:
Python中chardet 用來(lái)實(shí)現(xiàn)字符串/文件編碼檢測(cè)模板
1、chardet下載與安裝
下載地址:http://pypi.python.org/pypi/chardet
下載chardet后,解壓chardet壓縮包,直接將chardet文件夾放在應(yīng)用程序目錄下,就可以使用import chardet開始使用chardet了,也可以將chardet拷貝到Python系統(tǒng)目錄下,這樣你所有的python程序只要用import chardet就可以了。
python setup.py install
2、實(shí)例
使用中,chardet.detect()返回字典,其中confidence是檢測(cè)精確度,encoding是編碼形式
(1)網(wǎng)頁(yè)編碼判斷:
>>> import urllib
>>> rawdata = urllib.urlopen('http://www.google.cn/').read()
>>> import chardet
>>> chardet.detect(rawdata)
{'confidence': 0.98999999999999999, 'encoding': 'GB2312'}
(2)文件編碼判斷
import chardet
tt=open('c:\\111.txt','rb')
ff=tt.readline()
#這里試著換成read(5)也可以,但是換成readlines()后報(bào)錯(cuò)
enc=chardet.detect(ff)
print enc['encoding']
tt.close()
希望本文所述對(duì)大家的Python程序設(shè)計(jì)有所幫助。
- 深入探索Python解碼神器Chardet自動(dòng)檢測(cè)文本編碼
- Python處理文件的方法(mimetypes和chardet)
- Python chardet庫(kù)識(shí)別編碼原理解析
- Python3 chardet模塊查看編碼格式的例子
- python中判斷文件編碼的chardet(實(shí)例講解)
- Python中動(dòng)態(tài)檢測(cè)編碼chardet的使用教程
- python判斷字符串編碼的簡(jiǎn)單實(shí)現(xiàn)方法(使用chardet)
- python使用chardet判斷字符串編碼的方法
- 使用python的chardet庫(kù)獲得文件編碼并修改編碼
- python基于chardet識(shí)別字符編碼的方法
相關(guān)文章
Python+wxPython實(shí)現(xiàn)自動(dòng)生成PPTX文檔程序
這篇文章主要介紹了如何使用 wxPython 模塊和 python-pptx 模塊來(lái)編寫一個(gè)程序,用于生成包含首頁(yè)、內(nèi)容頁(yè)和感謝頁(yè)的 PPTX 文檔,感興趣的小伙伴可以學(xué)習(xí)一下2023-08-08
深度學(xué)習(xí)TextLSTM的tensorflow1.14實(shí)現(xiàn)示例
這篇文章主要為大家介紹了深度學(xué)習(xí)TextLSTM的tensorflow1.14實(shí)現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-01-01
Python傳統(tǒng)圖像處理之皮膚區(qū)域檢測(cè)詳解
這篇文章主要介紹了在不同情景下對(duì)傳統(tǒng)圖像進(jìn)行皮膚區(qū)域檢測(cè),文章中的代碼具有一定的參考價(jià)值,感興趣的小伙伴可以跟隨小編一起來(lái)學(xué)習(xí)學(xué)習(xí)2021-12-12
Django數(shù)據(jù)統(tǒng)計(jì)功能count()的使用
這篇文章主要介紹了Django數(shù)據(jù)統(tǒng)計(jì)功能count()的使用,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-11-11
Python 爬蟲學(xué)習(xí)筆記之正則表達(dá)式
正則表達(dá)式是用來(lái)匹配字符串非常強(qiáng)大的工具,在其他編程語(yǔ)言中同樣有正則表達(dá)式的概念,Python同樣不例外,利用了正則表達(dá)式,我們想要從返回的頁(yè)面內(nèi)容提取出我們想要的內(nèi)容就易如反掌了。2016-09-09
python實(shí)現(xiàn)加密的方式總結(jié)
這篇文章主要介紹了python實(shí)現(xiàn)加密的方式總結(jié),文中給大家提到了python中加密的注意點(diǎn),通過(guò)實(shí)例代碼給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-01-01
conda虛擬環(huán)境下使用pyinstaller打包程序?yàn)閑xe文件全過(guò)程
pyinstaller是一個(gè)支持跨平臺(tái)使用的第三方庫(kù),它可以將腳本執(zhí)行所需的模塊和庫(kù),自動(dòng)分析、收集并生成一個(gè)文件夾或者可執(zhí)行文件,這篇文章主要給大家介紹了關(guān)于conda虛擬環(huán)境下使用pyinstaller打包程序?yàn)閑xe文件的相關(guān)資料,需要的朋友可以參考下2023-12-12

