python 爬取免費簡歷模板網(wǎng)站的示例
更新時間:2020年09月27日 14:58:08 作者:straightup
這篇文章主要介紹了python 爬取免費簡歷模板網(wǎng)站的示例,幫助大家更好的理解和使用python 爬蟲,感興趣的朋友可以了解下
代碼
# 免費的簡歷模板進(jìn)行爬取本地保存
# http://sc.chinaz.com/jianli/free.html
# http://sc.chinaz.com/jianli/free_2.html
import requests
from lxml import etree
import os
dirName = './resumeLibs'
if not os.path.exists(dirName):
os.mkdir(dirName)
headers = {
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.83 Safari/537.36'
}
url = 'http://sc.chinaz.com/jianli/free_%d.html'
for page in range(1,2):
if page == 1:
new_url = 'http://sc.chinaz.com/jianli/free.html'
else:
new_url = format(url%page)
page_text = requests.get(url=new_url,headers=headers).text
tree = etree.HTML(page_text)
a_list = tree.xpath('//div[@id="container"]/div/p/a')
for a in a_list:
a_src = a.xpath('./@href')[0]
a_title = a.xpath('./text()')[0]
a_title = a_title.encode('iso-8859-1').decode('utf-8')
# 爬取下載頁面
page_text = requests.get(url=a_src,headers=headers).text
tree = etree.HTML(page_text)
dl_src = tree.xpath('//div[@id="down"]/div[2]/ul/li[8]/a/@href')[0]
resume_data = requests.get(url=dl_src,headers=headers).content
resume_name = a_title
resume_path = dirName + '/' + resume_name + '.rar'
with open(resume_path,'wb') as fp:
fp.write(resume_data)
print(resume_name,'下載成功!')
爬取結(jié)果


以上就是python 爬取免費簡歷模板網(wǎng)站的示例的詳細(xì)內(nèi)容,更多關(guān)于python 爬取網(wǎng)站的資料請關(guān)注腳本之家其它相關(guān)文章!
您可能感興趣的文章:
- python爬取新聞門戶網(wǎng)站的示例
- python 爬取壁紙網(wǎng)站的示例
- Python爬取網(wǎng)站圖片并保存的實現(xiàn)示例
- Python爬蟲設(shè)置Cookie解決網(wǎng)站攔截并爬取螞蟻短租的問題
- python 多線程爬取壁紙網(wǎng)站的示例
- python爬蟲爬取某網(wǎng)站視頻的示例代碼
- python爬蟲實現(xiàn)爬取同一個網(wǎng)站的多頁數(shù)據(jù)的實例講解
- sql coalesce函數(shù)的具體使用
- Python3 實現(xiàn)爬取網(wǎng)站下所有URL方式
- 使用python爬取taptap網(wǎng)站游戲截圖的步驟
相關(guān)文章
Python將一個CSV文件里的數(shù)據(jù)追加到另一個CSV文件的方法
今天小編就為大家分享一篇Python將一個CSV文件里的數(shù)據(jù)追加到另一個CSV文件的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07
Python基于textdistance實現(xiàn)計算文本相似度
textdistance是Python的第三方庫,用于計算文本之間的相似度或距離,本文主要為大家詳細(xì)介紹了如何使用textdistance實現(xiàn)計算文本相似度,需要的可以了解下2024-03-03
pyqt4教程之實現(xiàn)半透明的天氣預(yù)報界面示例
這篇文章主要介紹了pyqt4實現(xiàn)半透明的天氣預(yù)報界面示例,需要的朋友可以參考下2014-03-03
Python調(diào)用AnythingLLM API使用流輸出的實現(xiàn)
本文主要介紹了Python調(diào)用AnythingLLM API使用流輸出的實現(xiàn),用于處理長文本或?qū)崟r交互場景,文中通過示例代碼介紹的非常詳細(xì),需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2025-03-03

