Python爬取某平臺(tái)短視頻的方法
前言
本文的文字及圖片來源于網(wǎng)絡(luò),僅供學(xué)習(xí)、交流使用,不具有任何商業(yè)用途,如有問題請(qǐng)及時(shí)聯(lián)系我們以作處理。
基本開發(fā)環(huán)境
Python 3.6
Pycharm
相關(guān)模塊的使用
import os import requests
安裝Python并添加到環(huán)境變量,pip安裝需要的相關(guān)模塊即可。
一、確定需求

爬取搞笑趣味欄目的視頻內(nèi)容。
二、網(wǎng)站數(shù)據(jù)分析
首先需要明確一點(diǎn),好看視頻網(wǎng)站加載方式是懶加載的方式,需要你下滑網(wǎng)頁才會(huì)加載出新的內(nèi)容

加載出來的內(nèi)容里面有音頻播放地址以及標(biāo)題。
內(nèi)容比較簡(jiǎn)單,看代碼就行
import os
import requests
url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
title = index['title']
play_url = index['play_url']
video_content = requests.get(url=play_url, headers=headers).content
path = 'video\\'
if not os.path.exists(path):
os.mkdir(path)
with open(path + title + '.mp4', mode='wb') as f:
f.write(video_content)
print('正在保存:', title)


到此這篇關(guān)于Python爬取某平臺(tái)短視頻的方法的文章就介紹到這了,更多相關(guān)Python爬取短視頻內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python使用PyV8執(zhí)行javascript代碼示例分享
這篇文章主要介紹了python使用PyV8執(zhí)行javascript的小示例,大家參考使用吧2013-12-12
Python利用tenacity庫處理超時(shí)重試機(jī)制詳解
Python?的?tenacity?庫用于實(shí)現(xiàn)重試機(jī)制,特別適合處理網(wǎng)絡(luò)不穩(wěn)定或其他意外錯(cuò)誤導(dǎo)致的函數(shù)調(diào)用失敗,下面我們就來看看它的具體使用吧2025-02-02
詳解Python+OpenCV實(shí)現(xiàn)圖像二值化
圖像二值化就是將圖像上的像素點(diǎn)的灰度值設(shè)置為0或255,也就是將整個(gè)圖像呈現(xiàn)出明顯的黑白效果的過程。本文將通過Python+OpenCV實(shí)現(xiàn)這一過程,感興趣的可以學(xué)習(xí)一下2022-05-05
Python定時(shí)任務(wù)框架APScheduler原理及常用代碼
這篇文章主要介紹了Python定時(shí)任務(wù)框架APScheduler原理及常用代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-10-10
Django基于Token的驗(yàn)證使用的實(shí)現(xiàn)
本文主要介紹了Django基于Token的驗(yàn)證使用的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-09-09
python如何用columns參數(shù)獲取DataFrame各列的表頭名
這篇文章主要介紹了python如何用columns參數(shù)獲取DataFrame各列的表頭名問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-03-03

