解決python3爬蟲無法顯示中文的問題
更新時間:2018年04月12日 16:11:26 作者:正義狂哥
下面小編就為大家分享一篇解決python3爬蟲無法顯示中文的問題,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
有時候使用python從網(wǎng)站上爬數(shù)據(jù)的時候,如果數(shù)據(jù)里包含中文,有時候顯示的卻是如下所示...\xe4\xba\xba\xef\xbc\x8c\xe6...類似與國際化
解決方法:
import urllib.request
import sys
weburl="..."
webhead=...
req=urllib.request.Request(url=weburl,headers=webhead)
response=urllib.request.urlopen(req)
content = response.read()
#獲得系統(tǒng)的編碼
type = sys.getfilesystemencoding()
#設(shè)置爬出內(nèi)容的編碼
content = content.decode(type)
file = open("c。txt",'w',10000)
file.write(str(content))
file.close()
print(content)
以上這篇解決python3爬蟲無法顯示中文的問題就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python數(shù)據(jù)分析matplotlib設(shè)置多個子圖的間距方法
今天小編就為大家分享一篇Python數(shù)據(jù)分析matplotlib設(shè)置多個子圖的間距方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-08-08
python簡單獲取本機(jī)計算機(jī)名和IP地址的方法
這篇文章主要介紹了python簡單獲取本機(jī)計算機(jī)名和IP地址的方法,涉及Python中socket模塊的相關(guān)使用技巧,需要的朋友可以參考下2015-06-06
python清華pip鏡像源報HTTP error 403錯誤解決辦法
這篇文章主要介紹了如何解決在使用pip安裝Python包時遇到的403錯誤,提供了三種解決方法,并強調(diào)了清除緩存以使更改生效的重要性,需要的朋友可以參考下2024-12-12
Java Web開發(fā)過程中登陸模塊的驗證碼的實現(xiàn)方式總結(jié)
Java的SSH三大Web開發(fā)框架中,對于驗證碼這一基本功能的處理都比較得心應(yīng)手,接下來我們就來看看整理出的Java Web開發(fā)過程中登陸模塊的驗證碼的實現(xiàn)方式總結(jié):2016-05-05

