python實現(xiàn)html轉(zhuǎn)ubb代碼(html2ubb)
這兩天在用python寫一個采集器,有個功能模塊是html代碼轉(zhuǎn)換為ubb,網(wǎng)上貌似沒有現(xiàn)成程序,就自己寫了個函數(shù),順便鍛煉下自己的正則。
import re
def Html2UBB(content):
#以下是將html標(biāo)簽轉(zhuǎn)為ubb標(biāo)簽
pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I)
content = pattern.sub(r'[url=1]2[/url]',content)
pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I)
content = pattern.sub(r'[img]1[/img]',content)
pattern = re.compile( '<strong>([sS]+?)</strong>',re.I)
content = pattern.sub(r'[b]1[/b]',content)
pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I)
content = pattern.sub(r'[1]2[/1]',content)
pattern = re.compile( '<[^>]*?>',re.I)
content = pattern.sub('',content)
#以下是將html轉(zhuǎn)義字符轉(zhuǎn)為普通字符
content = content.replace('<','<')
content = content.replace('>','>')
content = content.replace('”','”')
content = content.replace('“','“')
content = content.replace('"','"')
content = content.replace('©','©')
content = content.replace('®','®')
content = content.replace(' ',' ')
content = content.replace('—','—')
content = content.replace('–','–')
content = content.replace('‹','‹')
content = content.replace('›','›')
content = content.replace('…','…')
content = content.replace('&','&')
return content
使用時直接調(diào)用Html2UBB函數(shù),返回值就是ubb碼了html轉(zhuǎn)ubb
相關(guān)文章
Python檢測數(shù)據(jù)類型的方法總結(jié)
在本篇文章里小編給大家整理了關(guān)于Python檢測數(shù)據(jù)類型的方法和相關(guān)實例代碼,需要的朋友們跟著學(xué)習(xí)下。2019-05-05
Python實現(xiàn)遍歷windows所有窗口并輸出窗口標(biāo)題的方法
這篇文章主要介紹了Python實現(xiàn)遍歷windows所有窗口并輸出窗口標(biāo)題的方法,涉及Python調(diào)用及遍歷windows窗口句柄的技巧,具有一定參考借鑒價值,需要的朋友可以參考下2015-03-03
python PyQt5/Pyside2 按鈕右擊菜單實例代碼
本文通過實例代碼給大家介紹了python PyQt5/Pyside2 按鈕右擊菜單,代碼簡單易懂,非常不錯,具有一定的參考借鑒價值,需要的朋友參考下吧2019-08-08
Python實現(xiàn)自動化處理每月考勤缺卡數(shù)據(jù)
不管是上學(xué)還是上班都會統(tǒng)計考勤,有些學(xué)?;蚬緯γ吭氯笨ù螖?shù)過多(比如三次以上)的人員進行處罰。本文提供了Python自動處理考勤和日志缺失的方法,需要的可以參考一下2022-06-06
手把手教你將Flask應(yīng)用封裝成Docker服務(wù)的實現(xiàn)
這篇文章主要介紹了手把手教你將Flask應(yīng)用封裝成Docker服務(wù),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-08-08
一步一步教你用Python?pyglet仿制鴻蒙系統(tǒng)里的時鐘
pyglet是一個面向Python的跨平臺窗口、多媒體庫,它可以用于創(chuàng)建游戲和多媒體應(yīng)用程序,下面這篇文章主要給大家介紹了關(guān)于如何一步一步教你用Python?pyglet仿制鴻蒙系統(tǒng)里的時鐘,需要的朋友可以參考下2024-03-03
Python應(yīng)用開發(fā)頻繁假死的問題分析及解決
最近在開發(fā)一款自動化的應(yīng)用,但是,在測試時,卻發(fā)現(xiàn)了問題,當(dāng)我點擊暫停任務(wù)后,此時子線程被阻塞,如果我這個時候點擊停止,那么就會任務(wù)結(jié)束,之后,如果我再點擊開始運行,整個應(yīng)用就會卡死,所以本文介紹了Python應(yīng)用開發(fā)頻繁假死的問題分析及解決,需要的朋友可以參考下2024-08-08

