python3里gbk編碼的問(wèn)題解決
在python3有關(guān)字符串的處理當(dāng)中,經(jīng)常會(huì)遇到
'gbk' codec can't encode character '\xa0'這個(gè)問(wèn)題,原因是在str里面存在著不能正確編碼的字符。
通過(guò)以下方法即可解決。
import requests
from bs4 import BeautifulSoup
url = "http://jecvay.com/2015/03/learning-compilers-1.html"
url = url.encode('gbk','ignore').decode('utf-8') //忽略
response = requests.get(url)
print(response)
soup = BeautifulSoup(response.text)
print(soup.body.text)以上方法在必須要記錄數(shù)據(jù)的時(shí)候會(huì)出現(xiàn)數(shù)據(jù)不準(zhǔn)確問(wèn)題
python3 字符串無(wú)法將 gbk 完全轉(zhuǎn)換為utf8
對(duì)于必須存儲(chǔ)的情況,將gbk -> 十六進(jìn)制字節(jié)碼文本 保存,需要的時(shí)候在轉(zhuǎn)換為gbk以便顯示。
def string_hex(data):
lin = ['%02X' % i for i in data]
return "".join(lin).upper()
def __ToUTF8(tuple):
lists = []
for itme in tuple:
tmp = itme
if type(itme) == bytes:
try:
tmp = itme.decode('gbk')
except UnicodeDecodeError:
tmp = string_hex(itme)
lists.append(tmp)
return listsdef readFileAll(file):
with open(file, 'rb') as f:
data = f.read()
return data
s = readFileAll('gkb.txt') //gbk 字符串文件
sx = string_hex(s)//轉(zhuǎn)化為16進(jìn)制文本
print(sx)到此這篇關(guān)于python3里gbk編碼的問(wèn)題解決的文章就介紹到這了,更多相關(guān)python3 gbk編碼內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python數(shù)據(jù)結(jié)構(gòu)之圖深度優(yōu)先和廣度優(yōu)先實(shí)例詳解
這篇文章主要介紹了python數(shù)據(jù)結(jié)構(gòu)之圖深度優(yōu)先和廣度優(yōu)先,較為詳細(xì)的分析了深度優(yōu)先和廣度優(yōu)先算法的概念與原理,并給出了完整實(shí)現(xiàn)算法,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-07-07
python opencv鼠標(biāo)畫矩形框之cv2.rectangle()函數(shù)
鼠標(biāo)操作屬于用戶接口設(shè)計(jì),以前一直使用Qt來(lái)做,但是如果只需要簡(jiǎn)單的鼠標(biāo),鍵盤操作,直接調(diào)用opencv庫(kù)的函數(shù)也未嘗不可,下面這篇文章主要給大家介紹了關(guān)于python opencv鼠標(biāo)畫矩形框cv2.rectangle()函數(shù)的相關(guān)資料,需要的朋友可以參考下2021-10-10
Python中pandas庫(kù)sort_values()方法的使用
最后去看了有關(guān)于 sort_values 的文檔,成功解決先把單詞出現(xiàn)頻次由高往低依次排序,再把頻次相同的情況下的單詞按照 MD5 值排序這個(gè)問(wèn)題,下面通過(guò)本文講解下Python中pandas庫(kù)sort_values()方法的使用,感興趣的朋友一起看看吧2023-07-07
Python實(shí)現(xiàn)的樸素貝葉斯分類器示例
這篇文章主要介紹了Python實(shí)現(xiàn)的樸素貝葉斯分類器,結(jié)合具體實(shí)例形式分析了基于Python實(shí)現(xiàn)的樸素貝葉斯分類器相關(guān)定義與使用技巧,需要的朋友可以參考下2018-01-01
Python pandas入門系列之眾數(shù)和分位數(shù)
分位數(shù)(Quantile),也稱分位點(diǎn),是指將一個(gè)隨機(jī)變量的概率分布范圍分為幾個(gè)等份的數(shù)值點(diǎn),分析其數(shù)據(jù)變量的趨勢(shì),而眾數(shù)(Mode)是代表數(shù)據(jù)的一般水平,這篇文章主要給大家介紹了Python pandas系列之眾數(shù)和分位數(shù)的相關(guān)資料,需要的朋友可以參考下2021-08-08
Python實(shí)現(xiàn)自動(dòng)駕駛訓(xùn)練模型
這篇文章主要為大家介紹了Python實(shí)現(xiàn)自動(dòng)駕駛訓(xùn)練模型,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-06-06

