淺談Python采集網(wǎng)頁(yè)時(shí)正則表達(dá)式匹配換行符的問(wèn)題
如下所示:
p1 = r'(?<=<div class="ds_cr">)(.*?)(?=<div id="pageurl">)' #這樣采集html時(shí)出錯(cuò),采集不到數(shù)據(jù),正則中 . 是不能匹配換行符,改成如下: p1 = r'(?<=<div class="ds_cr">)([\s\S]*?)(?=<div id="pageurl">)' # 這是我們寫(xiě)的正則表達(dá)式規(guī)則,你現(xiàn)在可以不理解啥意思
[\s\S]
\s
匹配任何空白字符,包括空格、制表符、換頁(yè)符等等。等價(jià)于[ \f\n\r\t\v]。
\S
匹配任何非空白字符。等價(jià)于[^ \f\n\r\t\v]。
以上這篇淺談Python采集網(wǎng)頁(yè)時(shí)正則表達(dá)式匹配換行符的問(wèn)題就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
numpy中的norm()函數(shù)求范數(shù)實(shí)例
這篇文章主要介紹了numpy中的norm()函數(shù)求范數(shù)實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-02-02
Python+PyQt5開(kāi)發(fā)一個(gè)圖片尺寸修改器
基于Python打造一個(gè)高效開(kāi)發(fā)輔助全能工具箱
Python中往列表中插入字典時(shí),數(shù)據(jù)重復(fù)問(wèn)題
Python實(shí)現(xiàn)接受任意個(gè)數(shù)參數(shù)的函數(shù)方法

