淺談Python2之漢字編碼為unicode的問題(即類似\xc3\xa4)
Python2中編碼相關(guān)的問題很是讓人蛋疼,特別是中文字符。
比如本文所述的中文網(wǎng)頁GBK編碼的詭異問題。
現(xiàn)象
例如:盲錄職氓聭聵,其實網(wǎng)頁里面正常的應(yīng)該是會員
分析
接著上面的例子,會員這部分亂碼通過repr()函數(shù)求值得到如下結(jié)果
\xc3\xa4\xc2\xbc\xc2\x9a\xc3\xa5\xc2\x91\xc2\x98
使用type()函數(shù)求值得到的結(jié)果為unicode
eval(repr())出來值為
盲錄職氓聭聵
通過查表上述6個漢字對應(yīng)
c3a4 c2bc c29a c3a5 c291 c298
而上面內(nèi)容對應(yīng)的UTF-8值就是會員
解決方法
相當(dāng)詭異的是本身是unicode編碼,卻被當(dāng)作GBK系列來解碼,結(jié)果導(dǎo)致亂碼。因此將這些字符先編碼再解決解決問題。
encode('raw_unicode_escape').decode()
以上這篇淺談Python2之漢字編碼為unicode的問題(即類似\xc3\xa4)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實現(xiàn)希爾排序,歸并排序和桶排序的示例代碼
希爾、歸并、快速排序算法可歸為同一類,它們的共同點都是建立在分治思想之上。把大問題分拆成小問題,解決所有小問題后,再合并每一個小問題的結(jié)果,最終得到對原始問題的解答。本文將介紹這三種算法的實現(xiàn)代碼,需要的可以參考一下2022-04-04
使用python快速在局域網(wǎng)內(nèi)搭建http傳輸文件服務(wù)的方法
這篇文章主要介紹了使用 python快速在局域網(wǎng)內(nèi)搭建http傳輸文件服務(wù),但是這種方法不要傳輸機密文件,安全性不高,只用到http協(xié)議沒有使用任何加密協(xié)議,具體實現(xiàn)方法跟隨小編一起看看吧2019-11-11
Python cookbook(數(shù)據(jù)結(jié)構(gòu)與算法)從任意長度的可迭代對象中分解元素操作示例
這篇文章主要介紹了Python 數(shù)據(jù)結(jié)構(gòu)與算法 從任意長度的可迭代象中分解元素操作,結(jié)合實例形式分析了Python使用*表達式針對可迭代對象的分解操作相關(guān)實現(xiàn)技巧,需要的朋友可以參考下2018-02-02
Python爬蟲實現(xiàn)全國失信被執(zhí)行人名單查詢功能示例
這篇文章主要介紹了Python爬蟲實現(xiàn)全國失信被執(zhí)行人名單查詢功能,涉及Python爬蟲相關(guān)網(wǎng)絡(luò)接口調(diào)用及json數(shù)據(jù)轉(zhuǎn)換等相關(guān)操作技巧,需要的朋友可以參考下2018-05-05
Django+Nginx+uWSGI 定時任務(wù)的實現(xiàn)方法
本文主要介紹了Django+Nginx+uWSGI 定時任務(wù)的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2022-01-01
對Python中小整數(shù)對象池和大整數(shù)對象池的使用詳解
今天小編就為大家分享一篇對Python中小整數(shù)對象池和大整數(shù)對象池的使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-07-07
圖文詳解Django使用Pycharm連接MySQL數(shù)據(jù)庫
這篇文章主要介紹了Django使用Pycharm連接MySQL數(shù)據(jù)庫的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-08-08

