python抓取網(wǎng)站的圖片并下載到本地的方法
更新時(shí)間:2018年05月22日 14:06:53 作者:wickedvalley
今天小編就為大家分享一篇python抓取網(wǎng)站的圖片并下載到本地的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
實(shí)例如下所示:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import re
import urllib,urllib2;
#通過url獲取網(wǎng)頁
def getHtml(url):
# 要設(shè)置請(qǐng)求頭,讓服務(wù)器知道不是機(jī)器人
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = {'User-Agent': user_agent}
request=urllib2.Request(url,headers=headers);
page = urllib2.urlopen(request);
html = page.read()
return html
#通過正則表達(dá)式來獲取圖片地址,并下載到本地
def getImg(html):
reg = r'src="(.+?\.jpg)"'
imgre = re.compile(reg)
imglist = imgre.findall(html)
x = 0
for imgurl in imglist:
print imgurl;
#通過urlretrieve函數(shù)把數(shù)據(jù)下載到本地的D:\\images,所以你需要?jiǎng)?chuàng)建目錄
urllib.urlretrieve(imgurl, 'D:\\images\\%s.jpg' % x)
x = x + 1
html = getHtml("http://www.qiushibaike.com/imgrank/")
getImg(html)
以上這篇python抓取網(wǎng)站的圖片并下載到本地的方法就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
解決pycharm的Python console不能調(diào)試當(dāng)前程序的問題
今天小編就為大家分享一篇解決pycharm的Python console不能調(diào)試當(dāng)前程序的問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01
Python如何基于selenium實(shí)現(xiàn)自動(dòng)登錄博客園
這篇文章主要介紹了Python如何基于selenium實(shí)現(xiàn)自動(dòng)登錄博客園,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12
Python+request+unittest實(shí)現(xiàn)接口測(cè)試框架集成實(shí)例
這篇文章主要介紹了Python+request+unittest實(shí)現(xiàn)接口測(cè)試框架集成實(shí)例,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-03-03
Python數(shù)據(jù)庫的連接實(shí)現(xiàn)方法與注意事項(xiàng)
這篇文章主要介紹了Python數(shù)據(jù)庫的連接實(shí)現(xiàn)方法與注意事項(xiàng),需要的朋友可以參考下2016-02-02

