python實(shí)現(xiàn)愛奇藝登陸密碼RSA加密的方法示例詳解
前言
通過Python實(shí)現(xiàn)對(duì)大麥網(wǎng)近期全國(guó)演唱會(huì)數(shù)據(jù)進(jìn)行爬取,通過分析,我們發(fā)現(xiàn)大麥網(wǎng)屬于Python爬蟲策略中“中等型”難度網(wǎng)站,演唱會(huì)數(shù)據(jù)封裝在json文件中。因此,我們簡(jiǎn)單的通過requests、json就可以將數(shù)據(jù)爬取出來,后期通過pandas進(jìn)行數(shù)據(jù)篩選并保存至Excel文件中。
1.目標(biāo)網(wǎng)站分析

檢查一下看xhr中有沒有我們需要的數(shù)據(jù)。


很好,就在xhr中用json封裝了數(shù)據(jù)。
2.構(gòu)造相應(yīng)的Request URL


request url中只有一個(gè)參數(shù)變化,那就是“Page=”這個(gè)選項(xiàng)變了,簡(jiǎn)單了😄,一共6頁(yè),直接循環(huán)構(gòu)造了。

for i in range(1,7):
url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
# print(url)
3.requests爬蟲走起
直接上代碼:
def crawl(url):
headers={
'cookie': 'cna=J7K2Fok5AXECARu7QWn6+cxu; isg=BCcnDiP-NfKV5bF-OctWuXuatl3xrPuOyBVJJfmQLrZn6ESqAX0y3jrhCuj2ANMG; l=eBSmWoPRQeT6Zn3iBO5whurza77O1CAf1sPzaNbMiIncC6BR1AvOCJxQLtyCvptRR8XcGLLB4nU7C5eTae7_7CDmndLHuI50MbkyCef..',
'user-agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response=requests.get(url,headers=headers)
json_text=json.loads(response.text)
# print(json_text.keys())
rdata=json_text['pageData']['resultData']
# print(rdata)
return(rdata)
加一個(gè)headers,簡(jiǎn)單做一個(gè)防反爬。
4.保存至excel文件
基本思路是將每頁(yè)數(shù)據(jù)保存成pandas的DataFrame結(jié)構(gòu),然后進(jìn)行拼接,拼接完后再保存到Excel文件中。
inidata=pd.DataFrame(columns=('name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic'))
for i in range(1,7):
url=f'https://search.damai.cn/searchajax.html?keyword=&cty=&ctl=%E6%BC%94%E5%94%B1%E4%BC%9A&sctl=&tsg=0&st=&et=&order=1&pageSize=30&currPage={i}&tn='
# print(url)
# print(crawl(url))
data=pd.DataFrame(crawl(url))
data1=data[['name','actors','cityname','showtime','price_str','venue','venuecity','verticalPic']]
inidata=inidata.append(data1)
# print(inidata)
inidata.to_excel('大麥網(wǎng)演唱會(huì).xlsx',index=0)
5.看看效果

總結(jié)
到此這篇關(guān)于python實(shí)現(xiàn)愛奇藝登陸的密碼RSA加密的文章就介紹到這了,更多相關(guān)python實(shí)現(xiàn)愛奇藝登陸的密碼RSA加密內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python rsa-oaep加密的示例代碼
- Python實(shí)現(xiàn)常見的幾種加密算法(MD5,SHA-1,HMAC,DES/AES,RSA和ECC)
- Python3加密解密庫(kù)Crypto的RSA加解密和簽名/驗(yàn)簽實(shí)現(xiàn)方法實(shí)例
- Python如何基于rsa模塊實(shí)現(xiàn)非對(duì)稱加密與解密
- python使用rsa非對(duì)稱加密過程解析
- Python3.7 基于 pycryptodome 的AES加密解密、RSA加密解密、加簽驗(yàn)簽
- python中的RSA加密與解密實(shí)例解析
- python rsa實(shí)現(xiàn)數(shù)據(jù)加密和解密、簽名加密和驗(yàn)簽功能
- Python3非對(duì)稱加密算法RSA實(shí)例詳解
- Python實(shí)現(xiàn)的rsa加密算法詳解
- python RSA加密的示例
相關(guān)文章
一文詳細(xì)介紹Python中的OrderedDict對(duì)象
OrderedDict是Python標(biāo)準(zhǔn)庫(kù)collections模塊的一部分,下面這篇文章主要給大家介紹了關(guān)于Python中OrderedDict對(duì)象的相關(guān)資料,文中通過代碼介紹的非常詳細(xì),需要的朋友可以參考下2024-08-08
解讀requests.session()獲取Cookies全過程
這篇文章主要介紹了解讀requests.session()獲取Cookies全過程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-02-02
使用Ray集群簡(jiǎn)單創(chuàng)建Python分布式應(yīng)用程序
面對(duì)計(jì)算密集型的任務(wù),除了多進(jìn)程,就是分布式計(jì)算,如何用 Python 實(shí)現(xiàn)分布式計(jì)算呢?今天分享一個(gè)很簡(jiǎn)單的方法,那就是借助于 Ray2021-09-09
Pytorch精準(zhǔn)記錄函數(shù)運(yùn)行時(shí)間的方法
參考Pytorch官方文檔對(duì)CUDA的描述,GPU的運(yùn)算是異步執(zhí)行的,一般來說,異步計(jì)算的效果對(duì)于調(diào)用者來說是不可見的,異步計(jì)算的后果是,沒有同步的時(shí)間測(cè)量是不準(zhǔn)確的,所以本文給大家介紹了Pytorch如何精準(zhǔn)記錄函數(shù)運(yùn)行時(shí)間,需要的朋友可以參考下2024-11-11
Python列表1~n輸出步長(zhǎng)為3的分組實(shí)例
這篇文章主要介紹了Python列表1~n輸出步長(zhǎng)為3的分組實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-05-05
解決python3讀取Python2存儲(chǔ)的pickle文件問題
今天小編就為大家分享一篇解決python3讀取Python2存儲(chǔ)的pickle文件問題,具有很好的參考價(jià)值。希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-10-10
Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例
這篇文章主要介紹了Python實(shí)現(xiàn)Word文檔轉(zhuǎn)換Markdown的示例,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12
Python基于PyGraphics包實(shí)現(xiàn)圖片截取功能的方法
這篇文章主要介紹了Python基于PyGraphics包實(shí)現(xiàn)圖片截取功能的方法,涉及PyGraphics包的安裝及基于PyGraphics包實(shí)現(xiàn)圖片的打開、讀取、截取等相關(guān)操作技巧,需要的朋友可以參考下2017-12-12
Python如何實(shí)現(xiàn)小程序 無限求和平均
這篇文章主要介紹了python如何實(shí)現(xiàn)小程序 無限求和平均,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-02-02

