python爬蟲入門教程之點(diǎn)點(diǎn)美女圖片爬蟲代碼分享
更新時間:2014年09月02日 11:01:43 投稿:junjie
這篇文章主要介紹了python爬蟲入門教程之點(diǎn)點(diǎn)美女圖片爬蟲代碼分享,本文以采集抓取點(diǎn)點(diǎn)網(wǎng)美女圖片為例,需要的朋友可以參考下
繼續(xù)鼓搗爬蟲,今天貼出一個代碼,爬取點(diǎn)點(diǎn)網(wǎng)「美女」標(biāo)簽下的圖片,原圖。
# -*- coding: utf-8 -*-
#---------------------------------------
# 程序:點(diǎn)點(diǎn)美女圖片爬蟲
# 版本:0.2
# 作者:zippera
# 日期:2013-07-26
# 語言:Python 2.7
# 說明:能設(shè)置下載的頁數(shù)
#---------------------------------------
import urllib2
import urllib
import re
pat = re.compile('<div class="feed-big-img">\n.*?imgsrc="(ht.*?)\".*?')
nexturl1 = "http://www.diandian.com/tag/%E7%BE%8E%E5%A5%B3?page="
count = 1
while count < 2:
print "Page " + str(count) + "\n"
myurl = nexturl1 + str(count)
myres = urllib2.urlopen(myurl)
mypage = myres.read()
ucpage = mypage.decode("utf-8") #轉(zhuǎn)碼
mat = pat.findall(ucpage)
if len(mat):
cnt = 1
for item in mat:
print "Page" + str(count) + " No." + str(cnt) + " url: " + item + "\n"
cnt += 1
fnp = re.compile('(\w{10}\.\w+)$')
fnr = fnp.findall(item)
if fnr:
fname = fnr[0]
urllib.urlretrieve(item, fname)
else:
print "no data"
count += 1
使用方法:新建一個文件夾,把代碼保存為name.py文件,運(yùn)行python name.py就可以把圖片下載到文件夾。
相關(guān)文章
Python基于gevent實(shí)現(xiàn)文件字符串查找器
這篇文章主要介紹了Python基于gevent實(shí)現(xiàn)文件字符串查找器,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-08-08
Django中日期處理注意事項與自定義時間格式轉(zhuǎn)換詳解
這篇文章主要給大家介紹了關(guān)于Django中日期處理注意事項與自定義時間格式轉(zhuǎn)換的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2018-08-08
python數(shù)組過濾實(shí)現(xiàn)方法
這篇文章主要介紹了python數(shù)組過濾實(shí)現(xiàn)方法,涉及Python針對數(shù)組的相關(guān)操作技巧,具有一定參考借鑒價值,需要的朋友可以參考下2015-07-07
使用Python獲取愛奇藝電視劇彈幕數(shù)據(jù)的示例代碼
這篇文章主要介紹了用Python獲取愛奇藝電視劇彈幕數(shù)據(jù),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-01-01
python構(gòu)建深度神經(jīng)網(wǎng)絡(luò)(DNN)
這篇文章主要為大家詳細(xì)介紹了python構(gòu)建深度神經(jīng)網(wǎng)絡(luò)DNN,文中示例代碼介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-03-03

