淺析Python requests 模塊
Python requests 模塊
requests 模塊是我們使用的 python爬蟲 模塊 可以完成市場進(jìn)80%的爬蟲需求。
安裝
pip install requests
使用
requests模塊代碼編寫的流程:
- - 指定url
- - 發(fā)起請求
- - 獲取響應(yīng)對象中的數(shù)據(jù)
- - 持久化存儲
-------------案例-------------------------
import requests
# 指定url
url="https://www.sogou.com/"
# 發(fā)起請求
response = requests.get(url)
# 獲取響應(yīng)對象中的數(shù)據(jù)
page_text = response.text
# 持久化存儲
with open('./sogou.html','w',encoding='utf-8') as fp:
fp.write()
-------------------------------------------
參數(shù)
# post 數(shù)據(jù) response = requests.post(url=url,data=data,headers=headers) # get 數(shù)據(jù) response = requests.get(url=url,data=data,headers=headers) # 返回二進(jìn)制數(shù)據(jù) response.content # 返回字符串?dāng)?shù)據(jù) response.text # 返回json對象 response.json()
其他了解
1、該模塊實(shí)現(xiàn)爬取數(shù)據(jù)前需要查找需要爬取數(shù)據(jù)的指定URL,可通過瀏覽器自帶抓包功能。
# 瀏覽器抓取 Ajax 請求 F12 --> Network --> XHR --> Name --> Response
2、上面的headers參數(shù)是進(jìn)行UA偽裝為了反反爬
反爬機(jī)制:UA檢測 --> UA偽裝
3、下面是http我們爬包是常用的請求頭參數(shù)
- accept: 瀏覽器通過這個頭告訴服務(wù)器,他所支持的數(shù)據(jù)類型 - Accept-Charset:瀏覽器通過這個頭告訴服務(wù)器,它支持那種字符集 - Accept-Encoding:瀏覽器通過這個頭告訴服務(wù)器,支持的壓縮格式 - Accept-Language:瀏覽器通過這個頭告訴服務(wù)器,他的語言環(huán)境 - Host:瀏覽器同過這個頭告訴服務(wù)器,想訪問哪臺主機(jī) - If-ModifiedSince:瀏覽器通過這個頭告訴服務(wù)器,緩存數(shù)據(jù)的時間 - Heferer:瀏覽器通過這個頭告訴服務(wù)器,客戶及時那個頁面來的,防盜鏈 - Connection:瀏覽器通過這個頭告訴服務(wù)器,請求完后是斷開鏈接還是保持鏈接 - X-Requested-With:XMLHttpRequest 代表通過ajax方式進(jìn)行訪問 - User-Agent:請求載體的身份標(biāo)識
以上就是淺析Python requests 模塊的詳細(xì)內(nèi)容,更多關(guān)于Python requests 模塊的資料請關(guān)注腳本之家其它相關(guān)文章!
- Python使用requests模塊爬取百度翻譯
- Python grequests模塊使用場景及代碼實(shí)例
- Python requests模塊安裝及使用教程圖解
- Python requests模塊cookie實(shí)例解析
- python爬蟲開發(fā)之Request模塊從安裝到詳細(xì)使用方法與實(shí)例全解
- Python3離線安裝Requests模塊問題
- python爬蟲 基于requests模塊的get請求實(shí)現(xiàn)詳解
- python爬蟲 基于requests模塊發(fā)起ajax的get請求實(shí)現(xiàn)解析
- python利用re,bs4,requests模塊獲取股票數(shù)據(jù)
- Python實(shí)現(xiàn)使用request模塊下載圖片demo示例
- Python3使用requests模塊實(shí)現(xiàn)顯示下載進(jìn)度的方法詳解
- python request 模塊詳細(xì)介紹
相關(guān)文章
python批量從es取數(shù)據(jù)的方法(文檔數(shù)超過10000)
今天小編就為大家分享一篇python批量從es取數(shù)據(jù)的方法(文檔數(shù)超過10000),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12
pytest多進(jìn)程或多線程執(zhí)行測試實(shí)例
這篇文章介紹了pytest多進(jìn)程或多線程執(zhí)行測試的實(shí)例,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-07-07
python?中?lxml?的?etree?標(biāo)簽解析
這篇文章主要介紹了python?中l(wèi)xml的etree?標(biāo)簽解析,文章圍繞主題展開詳細(xì)內(nèi)容,需要的小伙伴可以參考一下,希望對你的學(xué)習(xí)或工作有所幫助2022-04-04
pandas 缺失值與空值處理的實(shí)現(xiàn)方法
這篇文章主要介紹了pandas 缺失值與空值處理的實(shí)現(xiàn)方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-10-10
Python closure閉包解釋及其注意點(diǎn)詳解
這篇文章主要介紹了Python closure閉包解釋及其注意點(diǎn)詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-08-08
Python腳本提取fasta文件單序列信息實(shí)現(xiàn)
這篇文章主要為大家介紹了Python腳本提取fasta文件單序列信息實(shí)現(xiàn)示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-07-07
python實(shí)現(xiàn)身份證實(shí)名認(rèn)證的方法實(shí)例
這篇文章主要給大家介紹了關(guān)于python實(shí)現(xiàn)身份證實(shí)名認(rèn)證的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11
Pycharm配置遠(yuǎn)程SSH服務(wù)器實(shí)現(xiàn)(切換不同虛擬環(huán)境)
本文主要介紹了Pycharm配置遠(yuǎn)程SSH服務(wù)器實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02
Python 獲取圖片GPS等信息鎖定圖片拍攝地點(diǎn)、拍攝時間(實(shí)例代碼)
這篇文章主要介紹了Python 獲取圖片GPS等信息鎖定圖片拍攝地點(diǎn)、拍攝時間,先把圖片以二進(jìn)制的格式讀取出來,然后通過 exifread 庫把里面的 GPS 信息提取出來,再以特定的格式打印出來,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2023-07-07

