python抓取網(wǎng)頁中鏈接的靜態(tài)圖片

更新時間：2018年01月29日 11:45:46 作者：zoujm-hust12

這篇文章主要為大家詳細介紹了python抓取網(wǎng)頁中鏈接的靜態(tài)圖片，具有一定的參考價值，感興趣的小伙伴們可以參考一下

本文實例為大家分享了python抓取網(wǎng)頁中鏈接的靜態(tài)圖片的具體代碼，供大家參考，具體內容如下

# -*- coding:utf-8 -*- 
 
#http://tieba.baidu.com/p/2460150866 
#抓取圖片地址 
 
from bs4 import BeautifulSoup 
import urllib.request 
from time import sleep 
 
html_doc = "http://tieba.baidu.com/p/2460150866" 
 
def get_image(url): 
 req = urllib.request.Request(url) 
 webpage = urllib.request.urlopen(req) 
 
 html = webpage.read() 
 soup = BeautifulSoup(html, 'html.parser') 
 
 #抓取圖片地址 
 #抓取img標簽且class為BDE_Image的所有內容 
 img_src=soup.findAll("img",{'class':'BDE_Image'}) 
 i = 1 
 for img in img_src: 
  img_url = img.get('src') #抓取src 
 # print(img) 
  req = urllib.request.Request(img_url) 
  u = urllib.request.urlopen(req) 
  data = u.read() 
  with open("AutoCodePng20180119-"+str(i)+".jpg", 'wb') as f: 
   sleep(2) 
   f.write(data) 
   i += 1 
 
def getImg(url): 
 html = urllib.request(url) 
 page = html.read() 
 soup = BeautifulSoup(page, "html.parser") 
 imglist = soup.find_all('img') #發(fā)現(xiàn)html中帶img標簽的數(shù)據(jù)，輸出格式為<img xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx，存入集合 
 lenth = len(imglist) #計算集合的個數(shù) 
 for i in range(lenth): 
  print imglist[i].attrs['src'] #抓取img中屬性為src的信息,例如<img src="123456" xxxxxxxxxxxxxxxx,則輸出為123456

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python的函數(shù)使用示例詳解
在Python的函數(shù)中，我們將其分為內置函數(shù)、自定義函數(shù)、main函數(shù)三個模塊，當然，使用的過程中會涉及到變量以及參數(shù)，這些都會舉例進行說明，對Python函數(shù)使用相關知識感興趣的朋友跟隨小編一起看看吧
2021-12-12
使用Keras實現(xiàn)Tensor的相乘和相加代碼
這篇文章主要介紹了使用Keras實現(xiàn)Tensor的相乘和相加代碼，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-06-06
Python實現(xiàn)的數(shù)據(jù)結構與算法之隊列詳解
這篇文章主要介紹了Python實現(xiàn)的數(shù)據(jù)結構與算法之隊列,詳細分析了隊列的定義、功能與Python實現(xiàn)隊列的相關技巧,以及具體的用法,需要的朋友可以參考下
2015-04-04
python psutil庫安裝教程
這篇文章給大家介紹了python psutil庫安裝教程，首先要確認本機已安裝python環(huán)境，具體安裝過程大家參考下本文
2018-03-03
初學Python實用技巧兩則
這篇文章主要介紹了初學Python實用技巧兩則,包括可變參數(shù)的應用級execfile函數(shù)的用法,需要的朋友可以參考下
2014-08-08
python刪除列表元素的三種方法(remove,pop,del)
這篇文章主要介紹了python刪除列表元素的三種方法(remove,pop,del)，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-07-07
Python機器學習iris數(shù)據(jù)集預處理和模型訓練方式
iris數(shù)據(jù)集包含150個樣本,每個樣本有4個特征及其類別信息,本文介紹了iris數(shù)據(jù)集的基本操作和如何使用knn模型進行花卉種類預測,是機器學習中的經(jīng)典案例,適用于監(jiān)督式學習
2024-10-10
matplotlib之輕松解決中文亂碼的問題
這篇文章主要介紹了matplotlib之輕松解決中文亂碼的問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2023-09-09
PyQt5每天必學之日歷控件QCalendarWidget
這篇文章主要為大家詳細介紹了PyQt5每天必學之日歷控件QCalendarWidget，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-04-04
用Python下載一個網(wǎng)頁保存為本地的HTML文件實例
今天小編就為大家分享一篇用Python下載一個網(wǎng)頁保存為本地的HTML文件實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-05-05