簡單實現(xiàn)Python爬取網(wǎng)絡(luò)圖片
本文實例為大家分享了Python爬取網(wǎng)絡(luò)圖片的具體代碼,供大家參考,具體內(nèi)容如下
代碼:
import urllib
import urllib.request
import re
#打開網(wǎng)頁,下載器
def open_html ( url):
require=urllib.request.Request(url)
reponse=urllib.request.urlopen(require)
html=reponse.read()
return html
#下載圖片
def load_image(html):
regx='http://[\S]*jpg'
pattern=re.compile(regx)
get_image=re.findall(pattern,repr(html))
num=1
for img in get_image:
photo=open_html(img)
with open(r'E:\Photo\%s.jpg'%num,'wb') as f:
print('開始下載圖片')
f.write(photo)
print('正在下載第%s張圖片'%num)
f.close()
num=num+1
if num>1:
print('下載成功?。?!')
else:
print('下載失?。。?!')
url='http://www.qiqipu.com/'
html=open_html(url)
load_image(html)
執(zhí)行結(jié)果:


注意:
在運行之前,必須要有路徑(文件夾):E:\Photo\
如果網(wǎng)站是HTTPS可以將正則中的http換為HTTPS,可以再定義一個下載圖片的函數(shù)
如果想要下載jpg、png、gif等多種格式的圖片可以將正則中的jpg換為對應(yīng)格式,也可以使用元組定義多種格式后遍歷
我這里只要jpg就可以,就不改了,大家可以自己改下。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
TensorFlow自定義模型保存加載和分布式訓(xùn)練
本篇文章將涵蓋 TensorFlow 的高級應(yīng)用,包括如何自定義模型的保存和加載過程,以及如何進行分布式訓(xùn)練,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-07-07
python通過cookie模擬已登錄狀態(tài)的初步研究
對于那些需要在登錄環(huán)境下進行的爬蟲操作,模擬登陸或偽裝已登錄狀態(tài)是一個剛性需求。這篇文章主要介紹了python通過cookie模擬已登錄狀態(tài)的相關(guān)資料,需要的朋友可以參考下2016-11-11
Python中時間datetime的處理與轉(zhuǎn)換用法總結(jié)
今天小編就為大家分享一篇關(guān)于Python中時間datetime的處理與轉(zhuǎn)換用法總結(jié),小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-02-02

