Python使用正則匹配實(shí)現(xiàn)抓圖代碼分享
內(nèi)涵:正則匹配,正則替換,頁(yè)面抓取,圖片保存 。
實(shí)用的第一次 Python 代碼 參考
#!/usr/bin/env python
import urllib
import re
x=0
def getHtml(url):
page = urllib.urlopen(url)
html = page.read()
return html
def getImg(html):
global x
reg = 'alt=".+?" src="(.+?\.jpg)"'
imgre = re.compile(reg)
imglist = re.findall(imgre,html)
for imgurl in imglist:
urllib.urlretrieve(re.sub(r',\d+,\d+',',800,450',imgurl),"img/%s.jpg" % x)
print "\n"+re.sub(r',\d+,\d+',',800,450',imgurl)+"========"+"img/%s.jpg" % x
x+=1
print 'Starting...'
pages = range(1,9)
for p in pages:
html = getHtml('http://m.lovebizhi.com/category/7655/%d/' % p)
print "\n-------------------------page:%d-------------------------------" % p
getImg(html)
print "\nDone!"
以上所述就是本文給大家分享的全部代碼了,本人Python菜鳥(niǎo),第一個(gè)作品,希望對(duì)大家能有所幫助。
- python re模塊findall()函數(shù)實(shí)例解析
- Python 匹配任意字符(包括換行符)的正則表達(dá)式寫(xiě)法
- Python匹配中文的正則表達(dá)式
- Python正則表達(dá)式匹配ip地址實(shí)例
- python正則表達(dá)式中的括號(hào)匹配問(wèn)題
- python正則表達(dá)式去掉數(shù)字中的逗號(hào)(python正則匹配逗號(hào))
- Python利用正則表達(dá)式匹配并截取指定子串及去重的方法
- python使用正則表達(dá)式匹配字符串開(kāi)頭并打印示例
- python正則匹配抓取豆瓣電影鏈接和評(píng)論代碼分享
- Python3正則匹配re.split,re.finditer及re.findall函數(shù)用法詳解
相關(guān)文章
Deepsort + Yolo 實(shí)現(xiàn)行人檢測(cè)和軌跡追蹤的方法
這篇文章主要介紹了Deepsort + Yolo 實(shí)現(xiàn)行人檢測(cè)和軌跡追蹤,本項(xiàng)目通過(guò)采用深度學(xué)習(xí)方法實(shí)現(xiàn)YOLO算法行人檢測(cè)和deepsort算法對(duì)人員定位的和軌跡跟蹤,需要的朋友可以參考下2021-09-09
python?manage.py?createsuperuser運(yùn)行錯(cuò)誤問(wèn)題解決
這篇文章主要介紹了python?manage.py?createsuperuser運(yùn)行錯(cuò)誤,本文給大家分享錯(cuò)誤復(fù)現(xiàn)及解決方案,感興趣的朋友一起看看吧2023-10-10
python web框架中實(shí)現(xiàn)原生分頁(yè)
這篇文章主要為大家詳細(xì)介紹了python web框架中使用原生分頁(yè)的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-09-09
Python基于LightGBM進(jìn)行時(shí)間序列預(yù)測(cè)
LightGBM是擴(kuò)展機(jī)器學(xué)習(xí)系統(tǒng)。是一款基于GBDT(梯度提升決策樹(shù))算法的分布梯度提升框架。其設(shè)計(jì)思路主要集中在減少數(shù)據(jù)對(duì)內(nèi)存與計(jì)算性能的使用上,以及減少多機(jī)器并行計(jì)算時(shí)的通訊代價(jià)。本文將通過(guò)LightGBM進(jìn)行時(shí)間序列預(yù)測(cè),感興趣的可以了解一下2022-03-03
django model 條件過(guò)濾 queryset.filter(**condtions)用法詳解
這篇文章主要介紹了django model 條件過(guò)濾 queryset.filter(**condtions)用法詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-05-05
Python的hashlib庫(kù)獲取超大文件的md5值實(shí)例探究
這篇文章主要為大家介紹了Python的hashlib庫(kù)獲取超大文件的md5值實(shí)現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01
Python基于回溯法子集樹(shù)模板解決全排列問(wèn)題示例
這篇文章主要介紹了Python基于回溯法子集樹(shù)模板解決全排列問(wèn)題,簡(jiǎn)單描述了全排列問(wèn)題并結(jié)合實(shí)例形式分析了Python使用回溯法子集樹(shù)模板解決全排列問(wèn)題的具體步驟與相關(guān)操作注意事項(xiàng),需要的朋友可以參考下2017-09-09
解決Python3中二叉樹(shù)前序遍歷的迭代問(wèn)題
二叉樹(shù)是分層數(shù)據(jù)結(jié)構(gòu),其中每個(gè)父節(jié)點(diǎn)最多有 2 個(gè)子節(jié)點(diǎn),在今天的文章中,我們將討論一個(gè)在大量技術(shù)編碼面試中出現(xiàn)的重要主題,對(duì)Python二叉樹(shù)遍歷相關(guān)知識(shí)感興趣的朋友一起看看吧2022-09-09

