python BeautifulSoup設(shè)置頁面編碼的方法
更新時(shí)間:2015年04月03日 08:55:42 投稿:junjie
這篇文章主要介紹了python BeautifulSoup設(shè)置頁頁編碼的方法,本文直接給出代碼救命,需要的朋友可以參考下
在用BeautifulSoup進(jìn)行抓取頁面的時(shí)候,會(huì)各種各樣的編碼錯(cuò)誤。
可以通過在beautifulsoup中指定字符編碼,解決問題。
復(fù)制代碼 代碼如下:
import urllib2
from BeautifulSoup import BeautifulSoup
page = urllib2.urlopen('http://www.163.com');
soup = BeautifulSoup(page,from_encoding="gb2312")
print soup.originalEncoding
print soup.prettify()
紅色部分表示需要注意的地方。在BeautifulSoup構(gòu)造器中傳入fromEncoding參數(shù)即可解決亂碼問題,當(dāng)然具體參數(shù)值是什么就要看你獲取頁面的編碼是什么
您可能感興趣的文章:
- Python使用email模塊對(duì)郵件進(jìn)行編碼和解碼的實(shí)例教程
- 詳解Python中使用base64模塊來處理base64編碼的方法
- Python中json格式數(shù)據(jù)的編碼與解碼方法詳解
- python判斷字符串編碼的簡(jiǎn)單實(shí)現(xiàn)方法(使用chardet)
- Python字符編碼判斷方法分析
- python編碼總結(jié)(編碼類型、格式、轉(zhuǎn)碼)
- Python編碼類型轉(zhuǎn)換方法詳解
- 學(xué)習(xí)python處理python編碼問題
- Python開發(fā)編碼規(guī)范
- Python設(shè)置默認(rèn)編碼為utf8的方法
相關(guān)文章
Python 把兩層列表展開平鋪成一層(5種實(shí)現(xiàn)方式)
這篇文章主要介紹了Python 把兩層列表展開平鋪成一層(5種實(shí)現(xiàn)方式),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2021-04-04
Python+requests+unittest執(zhí)行接口自動(dòng)化測(cè)試詳情
這篇文章主要介紹了Python+requests+unittest執(zhí)行接口自動(dòng)化測(cè)試詳情,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價(jià)值,需要的朋友可以參考一下2022-09-09
python利用while求100內(nèi)的整數(shù)和方式
這篇文章主要介紹了 python利用while求100內(nèi)的整數(shù)和方式,下面文章要描述的內(nèi)容有1到100的和、1到100內(nèi)的偶數(shù)和、1到100內(nèi)的奇數(shù)和,具體詳細(xì)內(nèi)容,需要的朋友可以參考一下2021-11-11
python實(shí)現(xiàn)挑選出來100以內(nèi)的質(zhì)數(shù)
這篇文章主要介紹了python實(shí)現(xiàn)挑選出來100以內(nèi)的質(zhì)數(shù),由于是新手,思路有限,如有問題,還請(qǐng)大家指正,需要的朋友可以參考下2015-03-03
Python-while 計(jì)算100以內(nèi)奇數(shù)和的方法
今天小編就為大家分享一篇Python-while 計(jì)算100以內(nèi)奇數(shù)和的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-06-06

