python批量爬取下載抖音視頻
更新時(shí)間:2019年06月17日 15:09:10 作者:劉勁松1
這篇文章主要為大家詳細(xì)介紹了python批量爬取下載抖音視頻,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
本文實(shí)例為大家分享了python批量爬取下載抖音視頻的具體代碼,供大家參考,具體內(nèi)容如下
import os
import requests
import re
import sys
import asyncio
import aiohttp
headers = {
'user-agent': 'Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) '
'Version/11.0 Mobile/15A372 Safari/604.1'
}
VIDEO_URLS, PAGE = [], 1
def get_info(url):
"""
:param url: 用戶的鏈接
:return:返回name,dytk,user_id 參數(shù)
"""
name = None
dytk = None
user_id = None
try:
response = requests.get(url, headers=headers)
user_id = response.url.split('/')[5].split('?')[0]
name = re.search(r'class="nickname">(.*?)<', response.text)[1]
dytk = re.search(r"dytk: '(.*?)'", response.text)[1]
except (TypeError, IndexError):
sys.stdout.write('Waring:輸入的鏈接錯(cuò)誤')
except requests.exceptions:
sys.stdout.write('Waring:鏈接錯(cuò)誤')
finally:
return name, user_id, dytk
def make_dir(name):
"""
建立文件夾
:param name: 用戶名稱
:return:
"""
if not os.path.isdir(name):
os.mkdir(name)
else:
pass
def get_all_video(user_id, max_cursor, dytk):
"""
獲取視頻的地址
:param user_id:
:param max_cursor:
:param dytk:
:return:
"""
url = "https://www.amemv.com/aweme/v1/aweme/post/?"
params = {'user_id': user_id,
'count': 21,
'max_cursor': max_cursor,
'dytk': dytk}
try:
response = requests.get(url=url, params=params, headers=headers)
if response.status_code == 200:
datas = response.json()
for data in datas['aweme_list']:
name = data.get('share_info').get('share_desc')
url = data.get('video').get('play_addr').get('url_list')[0].replace('playwm', 'play')
VIDEO_URLS.append([name, url])
if datas['has_more'] == 1 and datas.get('max_cursor') != 0:
global PAGE
print(f'收集第{PAGE}頁(yè)視頻')
PAGE += 1
return get_all_video(user_id, datas.get('max_cursor'), dytk)
else:
print('收集完成')
return VIDEO_URLS
else:
print('狀態(tài)碼:', response.status_code)
return None
except Exception as e:
print('Waring:', e)
return
async def download_video(index, name, video_name, url):
"""
下載視頻
:param index: 視頻id
:param name: 用戶名稱
:param video_name: 視頻名稱
:param url: 下載url
:return:
"""
print(f'正在下載第{index}個(gè)視頻:{video_name}')
video_path = '{}/{}.mp4'.format(name, video_name)
if not os.path.isfile(video_path):
try:
async with aiohttp.ClientSession() as session:
async with session.get(url=url, headers=headers, ssl=False) as response:
with open(video_path, 'wb') as f:
while True:
chunk = await response.content.read(1024)
f.write(chunk)
if not chunk:
break
print(f'下載完成第{index}個(gè)視頻:{video_name}')
except Exception as e:
print('waring:download faild', video_name, e)
return
else:
print('文件已存在')
def main():
url = 'http://v.douyin.com/dEorkn/'
name, user_id, dytk = get_info(url)
if not (name, user_id, dytk):
return
make_dir(name)
get_all_video(user_id, 0, dytk)
print(f'{name}:總共有{len(VIDEO_URLS)}個(gè)視頻')
tasks = []
for index, item in enumerate(VIDEO_URLS, 1):
video_name = item[0]
url = item[1]
tasks.append(asyncio.ensure_future(download_video(index, name, video_name, url)))
loop = asyncio.get_event_loop()
loop.run_until_complete(asyncio.wait(tasks))
loop.run_until_complete(asyncio.sleep(0))
loop.close()
print(f'{name}視頻下載完成!')
if __name__ == '__main__':
main()

以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python編程入門之Hello World的三種實(shí)現(xiàn)方式
這篇文章主要介紹了Python編程入門之Hello World的三種實(shí)現(xiàn)方式,實(shí)例分析了print輸出函數(shù)的使用及控制臺(tái)輸出的相關(guān)技巧,具有一定參考借鑒價(jià)值,需要的朋友可以參考下2015-11-11
Python生成任意波形并存為txt的實(shí)現(xiàn)
本文主要介紹了Python生成任意波形并存為txt的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-11-11
用sqlalchemy構(gòu)建Django連接池的實(shí)例
今天小編就為大家分享一篇用sqlalchemy構(gòu)建Django連接池的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧2019-08-08
python實(shí)戰(zhàn)之利用pygame實(shí)現(xiàn)貪吃蛇游戲(一)
這篇文章主要介紹了python實(shí)戰(zhàn)之利用pygame實(shí)現(xiàn)貪吃蛇游戲,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)python的小伙伴們有很好的幫助喲,需要的朋友可以參考下2021-05-05
Python計(jì)算程序運(yùn)行時(shí)間的方法
這篇文章主要介紹了Python計(jì)算程序運(yùn)行時(shí)間的方法,分別記錄起始時(shí)間與結(jié)束時(shí)間,計(jì)算兩者之間的差值來(lái)獲得程序的運(yùn)行時(shí)間,需要的朋友可以參考下2014-12-12

