python中文編碼問題小結(jié)
中文編碼問題一直是Python程序設(shè)計中很頭痛的問題,本文對此較為詳細的進行了總結(jié)歸納。具體如下:
當(dāng)字符串是:'\u4e2d\u56fd'
>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")
>>>print str
中國
當(dāng)字符串是:' 东亚学团一中'
>>>print unichr(19996) 東
ord()支持unicode,可以顯示特定字符的unicode號碼,如:
>>>print ord('A')
65
只要和Unicode連接,就會產(chǎn)生Unicode字串。如:
>>> 'help' 'help' >>> 'help,' + u'python' u'help,python'
對于ASCII(7位)兼容的字串,可和內(nèi)置的str()函數(shù)把Unicode字串轉(zhuǎn)換成ASCII字串。如:
>>> str(u'hello world') 'hello world'
對幾個概念的理解:
ASCII碼 用數(shù)據(jù)字 對應(yīng) 相應(yīng)的字符 如下圖所示:

而中文 就是區(qū)位碼對應(yīng)漢字。如:“好” 的ASCII碼為: 22909
unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文范圍 4E00-9FBF:這個范圍內(nèi)有 gbk,gb2312,
utf-8是基于unicode的 國際化的場合適合使用
gb2312和gb2312都是國標(biāo)碼 出現(xiàn)的較早 主要用于編解碼常用漢字
希望本文所述對大家的Python程序設(shè)計有所幫助。
相關(guān)文章
Python機器學(xué)習(xí)之預(yù)測黃金價格
這篇文章主要介紹了如何使用機器學(xué)習(xí)方法來預(yù)測最重要的貴金屬之一黃金的價格,文中的示例代碼講解詳細,感興趣的小伙伴可以試一試2022-01-01
數(shù)據(jù)清洗--DataFrame中的空值處理方法
今天小編就為大家分享一篇數(shù)據(jù)清洗--DataFrame中的空值處理方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07
使用Python和Tesseract實現(xiàn)驗證碼識別功能
驗證碼識別是一個常見且實用的技術(shù)需求,尤其是在自動化測試和數(shù)據(jù)采集場景中,通過開源 OCR工具 Tesseract,結(jié)合 Python 的強大生態(tài),我們可以高效實現(xiàn)驗證碼識別任務(wù),本篇博客將以詳細步驟和代碼示例,介紹如何使用 Python 和 Tesseract 實現(xiàn)驗證碼識別2025-01-01
python生成可執(zhí)行exe控制Microsip自動填寫號碼并撥打功能
這篇文章主要介紹了python生成可執(zhí)行exe控制Microsip自動填寫號碼并撥打,在這需要注意一個問題,必須是已經(jīng)運行Microsip.exe文件,具體實現(xiàn)代碼跟隨小編一起看看吧2021-06-06
python查看某個包的當(dāng)前安裝版本及最新版本的五種方法
這篇文章主要介紹了5種查看Python包最新版本的方法,包括使用pip的--outdated參數(shù)、pipsearch命令(已被棄用)、pipindexversions命令、pypi-simple工具和在Python腳本中使用pip,需要的朋友可以參考下2025-01-01
django實現(xiàn)將后臺model對象轉(zhuǎn)換成json對象并傳遞給前端jquery
這篇文章主要介紹了django實現(xiàn)將后臺model對象轉(zhuǎn)換成json對象并傳遞給前端jquery,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-03-03

