Python反爬實(shí)戰(zhàn)掌握酷狗音樂排行榜加密規(guī)則
效果展示

爬取目標(biāo)
網(wǎng)址:酷我音樂

工具使用
開發(fā)工具:pycharm
開發(fā)環(huán)境:python3.7, Windows10
使用工具包:requests,re
項(xiàng)目思路解析
找到需要解析的榜單數(shù)據(jù)

隨意點(diǎn)擊一個(gè)歌曲獲取到音樂的詳情數(shù)據(jù) 通過抓包的方式獲取到音樂播放數(shù)據(jù)

找到MP3的數(shù)據(jù)提交地址 mp3數(shù)據(jù)來自于這個(gè)url地址


提交數(shù)據(jù)的網(wǎng)址:
https://wwwapi.kugou.com/yy/index.php?r=play/getdata&callback=jQuery19102816534571347611_1626783818555&hash=A38449E76C74D45825F565C1FDB825C0&dfid=3dKstH1sJdRa44o6Vj0ZIryF&mid=4458f6d567640b39de367a394d69879e&platid=4&album_id=40437970&_=1626783818556
將多個(gè)網(wǎng)址數(shù)據(jù)進(jìn)行對(duì)比看看哪些參數(shù)是需要自行修改的
變化的url數(shù)據(jù)有3個(gè)
- hash
- album_id
- _
_ 可以明顯看出來是時(shí)間戳 需要獲取到對(duì)應(yīng)的hash以及album_id的值 來到主頁找尋對(duì)應(yīng)的歌曲id數(shù)據(jù) 發(fā)現(xiàn)數(shù)據(jù)來自網(wǎng)頁源代碼

歌曲的數(shù)據(jù)都是來自網(wǎng)頁源代碼

梳理整體思路:
- 從首頁源碼里提取出對(duì)應(yīng)的hash、album_id值
- 組合成新的url地址
- 獲取到j(luò)son數(shù)據(jù)總的歌曲播放地址
簡易源碼分享
本章內(nèi)容只限學(xué)習(xí),切勿用作其他用途?。。。?!
import requests
import re
import time
def Tools(url):
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36 Edg/91.0.864.70'
}
response = requests.get(url, headers=headers)
return response
def Save(name, url):
mp3 = Tools(url).content # 請(qǐng)求mp3地址鏈接 返回格式是16進(jìn)制
f = open('./kugou/{}.mp3'.format(name), 'wb') # w 文件存在就寫入 不存在就會(huì)創(chuàng)建 b進(jìn)制讀寫
f.write(mp3)
f.close()
print('{}下載完成....'.format(name))
url = 'https://www.kugou.com/yy/html/rank.html'
response = Tools(url).text
album_id = re.findall(r'"album_id":(\d*?),', response) # id
Hash = re.findall(r'"Hash":"(.*?)",', response) # hash
for a, h in zip(album_id, Hash):
# 生成時(shí)間戳
time1 = int(time.time() * 1000)
# 包含歌曲下載地址的url
urls = 'https://wwwapi.kugou.com/yy/index.php?r=play/getdata&hash={}&dfid=0zlWqK0UWNFa0weUnX0hjlFa&mid=f79511e2e86914b99e351c42ba1f8bc7&platid=4&album_id={}&_={}'.format(h, a, time1)
response1 = Tools(urls).json()
audio_name = response1['data']['audio_name'].split('-')[1]
play_url = response1['data']['play_url']
Save(audio_name, play_url)
以上就是Python實(shí)戰(zhàn)酷狗音樂反爬排行榜加密規(guī)則的詳細(xì)內(nèi)容,更多關(guān)于Python反爬酷狗音樂排行榜加密規(guī)則的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
python函數(shù)的默認(rèn)參數(shù)請(qǐng)勿定義可變類型詳解
這篇文章主要介紹了python函數(shù)的默認(rèn)參數(shù)請(qǐng)勿定義可變類型詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-02-02
win8下python3.4安裝和環(huán)境配置圖文教程
這篇文章主要為大家詳細(xì)介紹了win8下python3.4安裝和環(huán)境配置圖文教程,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-07-07
對(duì)Python 中矩陣或者數(shù)組相減的法則詳解
今天小編就為大家分享一篇對(duì)Python 中矩陣或者數(shù)組相減的法則詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-08-08
教你使用Python實(shí)現(xiàn)一個(gè)簡易版Web服務(wù)器
這篇文章主要介紹了教你使用Python實(shí)現(xiàn)一個(gè)簡易版Web服務(wù)器,本篇文章將通過實(shí)現(xiàn)一個(gè)簡易版的Web服務(wù)器,幫助讀者理解Python網(wǎng)絡(luò)編程的基本概念和技巧,需要的朋友可以參考下2023-04-04
Python使用pyecharts繪制世界地圖,省級(jí)地圖,城市地圖實(shí)例詳解
這篇文章主要介紹了如何使用Python中的pyecharts庫繪制世界地圖、中國地圖、省級(jí)地圖、市級(jí)地圖,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以跟隨小編一起動(dòng)手試一試2022-02-02
用python標(biāo)準(zhǔn)庫difflib比較兩份文件的異同詳解
今天小編就為大家分享一篇用python標(biāo)準(zhǔn)庫difflib比較兩份文件的異同詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11
使用Python在Excel中創(chuàng)建和取消數(shù)據(jù)分組
Excel中的分組是一種通過添加層級(jí)結(jié)構(gòu)將相鄰行或列組織在一起的功能,當(dāng)分組完成后,用戶可以通過折疊或展開數(shù)據(jù)組來簡化數(shù)據(jù)視圖,這篇博客將介紹如何使用Python在Excel中創(chuàng)建或取消數(shù)據(jù)分組,需要的朋友可以參考下2025-02-02

