python爬蟲爬取圖片的簡(jiǎn)單代碼

更新時(shí)間：2021年01月18日 14:39:49 作者：宋宋大人

在本篇文章里小編給大家整理的是一篇關(guān)于python爬蟲爬取圖片的簡(jiǎn)單代碼內(nèi)容，有興趣的朋友們可以測(cè)試下。

Python是很好的爬蟲工具不用再說(shuō)了，它可以滿足我們爬取網(wǎng)絡(luò)內(nèi)容的需求，那最簡(jiǎn)單的爬取網(wǎng)絡(luò)上的圖片，可以通過(guò)很簡(jiǎn)單的方法實(shí)現(xiàn)。只需導(dǎo)入正則表達(dá)式模塊，并利用spider原理通過(guò)使用定義函數(shù)的方法可以輕松的實(shí)現(xiàn)爬取圖片的需求。

1、spider原理

spider就是定義爬取的動(dòng)作及分析網(wǎng)站的地方。
以初始的URL**初始化Request**，并設(shè)置回調(diào)函數(shù)。當(dāng)該request**下載完畢并返回時(shí)，將生成**response ，并作為參數(shù)傳給該回調(diào)函數(shù)。

2、實(shí)現(xiàn)python爬蟲爬取圖片

第一步：導(dǎo)入正則表達(dá)式模塊

import re # 導(dǎo)入正則表達(dá)式模塊
import requests # python HTTP客戶端 編寫爬蟲和測(cè)試服務(wù)器經(jīng)常用到的模塊
import random # 隨機(jī)生成一個(gè)數(shù)，范圍[0,1]

第二步：使用定義函數(shù)的方法爬取圖片

def spiderPic(html, keyword):
  print('正在查找 ' + keyword + ' 對(duì)應(yīng)的圖片,下載中，請(qǐng)稍后......')
  for addr in re.findall('"objURL":"(.*?)"', html, re.S): # 查找URL
    print('正在爬取URL地址：' + str(addr)[0:30] + '...') 
    # 爬取的地址長(zhǎng)度超過(guò)30時(shí)，用'...'代替后面的內(nèi)容
    try:
      pics = requests.get(addr, timeout=100) # 請(qǐng)求URL時(shí)間（最大10秒）
    except requests.exceptions.ConnectionError:
      print('您當(dāng)前請(qǐng)求的URL地址出現(xiàn)錯(cuò)誤')
      continue
    fq = open('H:\\img\\' + (keyword + '_' + str(random.randrange(0, 1000, 4)) + '.jpg'), 'wb') 
     # 下載圖片，并保存和命名
    fq.write(pics.content)
    fq.close()

到此這篇關(guān)于python爬蟲爬取圖片的簡(jiǎn)單代碼的文章就介紹到這了,更多相關(guān)python爬蟲怎么爬取圖片內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

詳解Pandas如何高效對(duì)比處理DataFrame的兩列數(shù)據(jù)
我們?cè)谟?pandas?處理數(shù)據(jù)的時(shí)候，經(jīng)常會(huì)遇到用其中一列數(shù)據(jù)替換另一列數(shù)據(jù)的場(chǎng)景。這一類的需求估計(jì)很多人都遇到，當(dāng)然還有其它更復(fù)雜的。解決這類需求的辦法有很多，這里我們來(lái)推薦幾個(gè)
2022-09-09
基于python requests selenium爬取excel vba過(guò)程解析
這篇文章主要介紹了基于python requests selenium爬取excel vba過(guò)程解析,文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2020-08-08
使用Pycharm分段執(zhí)行代碼
這篇文章主要介紹了使用Pycharm分段執(zhí)行代碼，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
2020-04-04
VSCode配置Anaconda Python環(huán)境的實(shí)現(xiàn)
VisualStudioCode中可以使用Anaconda環(huán)境進(jìn)行Python開發(fā),本文主要介紹了VSCode配置Anaconda Python環(huán)境的實(shí)現(xiàn),具有一定的參考價(jià)值,感興趣的可以了解一下
2025-03-03
Python手機(jī)號(hào)碼歸屬地查詢代碼
這篇文章主要介紹了Python手機(jī)號(hào)碼歸屬地查詢代碼的相關(guān)資料,需要的朋友可以參考下
2016-05-05
springboot整合單機(jī)緩存ehcache的實(shí)現(xiàn)
本文主要介紹了springboot整合單機(jī)緩存ehcache的實(shí)現(xiàn)，文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2023-02-02
Python自然語(yǔ)言處理之snownlp模塊介紹、安裝與常見操作實(shí)戰(zhàn)案例
SnowNLP是一個(gè)針對(duì)中文文本處理的Python庫(kù),提供分詞、詞性標(biāo)注、情感分析等功能,它基于自然語(yǔ)言處理技術(shù),能夠處理unicode編碼的文本,這篇文章主要介紹了Python自然語(yǔ)言處理之snownlp模塊介紹、安裝與常見操作的相關(guān)資料,需要的朋友可以參考下
2024-11-11
Python3.4編程實(shí)現(xiàn)簡(jiǎn)單抓取爬蟲功能示例
這篇文章主要介紹了Python3.4編程實(shí)現(xiàn)簡(jiǎn)單抓取爬蟲功能,涉及Python3.4網(wǎng)頁(yè)抓取及正則解析相關(guān)操作技巧,需要的朋友可以參考下
2017-09-09
Django+Uwsgi+Nginx如何實(shí)現(xiàn)生產(chǎn)環(huán)境部署
這篇文章主要介紹了Django+Uwsgi+Nginx如何實(shí)現(xiàn)生產(chǎn)環(huán)境部署,文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2020-07-07
詳解pandas數(shù)據(jù)合并與重塑（pd.concat篇）
這篇文章主要介紹了詳解pandas數(shù)據(jù)合并與重塑（pd.concat篇），文中通過(guò)示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2019-07-07