Python轉(zhuǎn)碼問題的解決方法

更新時間：2008年10月07日 23:50:38 作者：

在Python中，可以對String調(diào)用decode和encode方法來實(shí)現(xiàn)轉(zhuǎn)碼。

比如，若要將某個String對象s從gbk內(nèi)碼轉(zhuǎn)換為UTF-8，可以如下操作
s.decode('gbk').encode('utf-8′)
可是，在實(shí)際開發(fā)中，我發(fā)現(xiàn)，這種辦法經(jīng)常會出現(xiàn)異常：
UnicodeDecodeError: ‘gbk' codec can't decode bytes in position 30664-30665: illegal multibyte sequence
這是因?yàn)橛龅搅朔欠ㄗ址绕涫窃谀承┯肅/C++編寫的程序中，全角空格往往有多種不同的實(shí)現(xiàn)方式，比如\xa3\xa0，或者\(yùn)xa4\x57，這些字符，看起來都是全角空格，但它們并不是“合法”的全角空格（真正的全角空格是\xa1\xa1），因此在轉(zhuǎn)碼的過程中出現(xiàn)了異常。
這樣的問題很讓人頭疼，因?yàn)橹灰址谐霈F(xiàn)了一個非法字符，整個字符串——有時候，就是整篇文章——就都無法轉(zhuǎn)碼。

解決辦法：
s.decode('gbk', ‘ignore').encode('utf-8′)
因?yàn)閐ecode的函數(shù)原型是decode([encoding], [errors='strict'])，可以用第二個參數(shù)控制錯誤處理的策略，默認(rèn)的參數(shù)就是strict，代表遇到非法字符時拋出異常；
如果設(shè)置為ignore，則會忽略非法字符；
如果設(shè)置為replace，則會用?取代非法字符；
如果設(shè)置為xmlcharrefreplace，則使用XML的字符引用。

python文檔

decode( [encoding[, errors]])
Decodes the string using the codec registered for encoding. encoding defaults to the default string encoding. errors may be given to set a different error handling scheme. The default is 'strict', meaning that encoding errors raise UnicodeError. Other possible values are 'ignore', 'replace' and any other name registered via codecs.register_error, see section 4.8.1.

您可能感興趣的文章:

相關(guān)文章

python 使用plt畫圖,去除圖片四周的白邊方法
今天小編就為大家分享一篇python 使用plt畫圖,去除圖片四周的白邊方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-07-07
Numpy的簡單用法小結(jié)
這篇文章主要介紹了Numpy的簡單用法小結(jié)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2019-08-08
python 讀寫中文json的實(shí)例詳解
這篇文章主要介紹了 python 讀寫中文json的實(shí)例詳解的相關(guān)資料,希望通過本文能幫助到大家，讓大家掌握這樣的內(nèi)容，需要的朋友可以參考下
2017-10-10
Pycharm保存不能自動同步到遠(yuǎn)程服務(wù)器的解決方法
今天小編就為大家分享一篇Pycharm保存不能自動同步到遠(yuǎn)程服務(wù)器的解決方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-06-06
基于python log取對數(shù)詳解
今天小編就為大家分享一篇基于python log取對數(shù)詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-06-06
tensorflow pb to tflite 精度下降詳解
這篇文章主要介紹了tensorflow pb to tflite 精度下降詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-05-05
在Django框架中編寫Context處理器的方法
這篇文章主要介紹了在Django框架中編寫Context處理器的方法,Django是重多高人氣Python框架中最為著名的一個,需要的朋友可以參考下
2015-07-07
Python編程中被忽視的核心技巧總結(jié)
這篇文章主要介紹了一些在?Python?編程中可能被忽視的核心功能，包括默認(rèn)參數(shù)、海象運(yùn)算符、*args?和?**kwargs?的使用等，需要的可參考下
2023-08-08
Python使用Matplotlib實(shí)現(xiàn)Logos設(shè)計代碼
這篇文章主要介紹了Python使用Matplotlib實(shí)現(xiàn)Logos設(shè)計代碼，具有一定借鑒價值，需要的朋友可以參考下。
2017-12-12
Python 字符串與二進(jìn)制串的相互轉(zhuǎn)換示例
今天小編就為大家分享一篇Python 字符串與二進(jìn)制串的相互轉(zhuǎn)換示例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-07-07