python處理“”開頭加數(shù)字的html字符方法
python如何處理“&#”開頭加數(shù)字的html字符,比如:风水這類數(shù)據(jù)。
用python抓取數(shù)據(jù)時,有時會遇到想要數(shù)據(jù)是以“&#”開頭加數(shù)字的字符,比如圖中所示的這些:
风水大术士


這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。這些字符需要再次轉(zhuǎn)換才能變回中文內(nèi)容。
Python2.7版本
在python2.7版本中,使用import HTMLParser

定義變量,再定義轉(zhuǎn)換代碼。

代碼中最重要的是“data_parser = HTMLParser.HTMLParser()”,通過此才能用“.unescape()”方法。

測試運(yùn)行,這串字符串正常輸出了中文。

Python3.7+版本
在最新python版本中,不能用上面的導(dǎo)入方法??梢杂?import html"或者“from html import unescape”。這里使用"import html"做測試。

導(dǎo)入html后,直接用".unescape()"來處理字符串。

運(yùn)行后,正常轉(zhuǎn)換成了中文字符。

感謝大家的閱讀和對腳本之家的支持。
相關(guān)文章
Python enumerate函數(shù)遍歷數(shù)據(jù)對象組合過程解析
這篇文章主要介紹了Python enumerate函數(shù)遍歷數(shù)據(jù)對象組合過程解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-12-12
pytorch使用tensorboardX進(jìn)行l(wèi)oss可視化實(shí)例
今天小編就為大家分享一篇pytorch使用tensorboardX進(jìn)行l(wèi)oss可視化實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-02-02
Python通過Geopandas實(shí)現(xiàn)地理空間數(shù)據(jù)可視化
Geopandas是一個功能強(qiáng)大的Python庫,它擴(kuò)展了Pandas的功能,專門用于地理空間數(shù)據(jù)的處理和分析,下面我們來看看如何使用Geopandas進(jìn)行地理空間數(shù)據(jù)可視化吧2025-03-03
python,pycharm的環(huán)境變量設(shè)置方式
這篇文章主要介紹了python,pycharm的環(huán)境變量設(shè)置方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-01-01
簡單實(shí)現(xiàn)python數(shù)獨(dú)游戲
這篇文章主要為大家詳細(xì)介紹了如何簡單實(shí)現(xiàn)python數(shù)獨(dú)游戲,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-03-03

