python爬蟲中抓取指數(shù)的實例講解

更新時間：2020年12月01日 08:36:31 作者：小妮淺淺

在本篇文章里小編給大家整理了關于python爬蟲中抓取指數(shù)的實例講解內容，有興趣的朋友們學習下。

有一些數(shù)據(jù)我們是沒法直觀的查看的，需要通過抓取去獲得。聽到指數(shù)這個詞，有的小伙伴們覺得很復雜，似乎只在股票的時候才聽說的，比如一些數(shù)據(jù)的漲跌分析都是比較棘手的問題。不過指數(shù)對于我們的數(shù)據(jù)分析還是很有幫助的，今天小編就python爬蟲中抓取指數(shù)得方法給大家?guī)碇v解。

剛好這幾天需要用到這個爬蟲，結果發(fā)現(xiàn)baidu指數(shù)的請求有點變化，所以就改了改：

import requests
import sys
import time
word_url = 'http://index.baidu.com/api/SearchApi/thumbnail?area=0&word={}'
COOKIES = ''
headers = {
 'Accept': 'application/json, text/plain, */*',
 'Accept-Encoding': 'gzip, deflate',
 'Accept-Language': 'zh-CN,zh;q=0.9',
 'Cache-Control': 'no-cache',
 'Cookie': COOKIES,
 'DNT': '1',
 'Host': 'index.baidu.com',
 'Pragma': 'no-cache',
 'Proxy-Connection': 'keep-alive',
 'Referer': 'http://index.baidu.com/v2/main/index.html',
 'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.90 Safari/537.36',
 'X-Requested-With': 'XMLHttpRequest',
}
def decrypt(t,e):
 n = list(t)
 i = list(e)
 a = {}
 result = []
 ln = int(len(n)/2)
 start = n[ln:]
 end = n[:ln]
 for j,k in zip(start, end):
  a.update({k: j})
 for j in e:
  result.append(a.get(j))
 return ''.join(result)
  
def get_ptbk(uniqid):
 url = 'http://index.baidu.com/Interface/ptbk?uniqid={}'
 resp = requests.get(url.format(uniqid), headers=headers)
 if resp.status_code != 200:
  print('獲取uniqid失敗')
  sys.exit(1)
 return resp.json().get('data')
def get_index_data(keyword, start='2011-01-03', end='2019-08-05'):
 keyword = str(keyword).replace("'", '"')
 url = f'http://index.baidu.com/api/SearchApi/index?area=0&word={keyword}&area=0&startDate={start}&endDate={end}'
 resp = requests.get(url, headers=headers)
  print('獲取指數(shù)失敗')
 content = resp.json()
 data = content.get('data')
 user_indexes = data.get('userIndexes')[0]
 uniqid = data.get('uniqid')
 ptbk = get_ptbk(uniqid)
 while ptbk is None or ptbk == '':
  ptbk = get_ptbk(uniqid)
 all_data = user_indexes.get('all').get('data')
 result = decrypt(ptbk, all_data)
 result = result.split(',')
 print(result)
if __name__ == '__main__':
 words = [[{"name": "酷安", "wordType": 1}]]
get_index_data(words)

輸出:

運行代碼就可以得到我們想要的指數(shù)了，當然也可以用來看股票以及其他的一些操作，運用python爬蟲解決都是不錯的選擇，感興趣的小伙伴也可以跟著小編嘗試一下。

到此這篇關于python爬蟲中抓取指數(shù)的實例講解的文章就介紹到這了,更多相關python爬蟲中如何抓取指數(shù)內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Python通過matplotlib繪制動畫簡單實例
這篇文章主要介紹了Python通過matplotlib繪制動畫簡單實例，具有一定借鑒價值，需要的朋友可以參考下。
2017-12-12
python的內存管理和垃圾回收機制詳解
這篇文章主要介紹了python內存管理和垃圾回收機制，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-05-05
Django MTV和MVC的區(qū)別詳解
這篇文章主要介紹了Django MTV和MVC的區(qū)別詳解，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2021-03-03
python解析xml文件實例分析
這篇文章主要介紹了python解析xml文件的方法,實例分析了Python針對XML文件節(jié)點及字段的獲取技巧,非常簡單實用,需要的朋友可以參考下
2015-05-05
python對RabbitMQ的簡單入門使用教程
RabbitMq是實現(xiàn)了高級消息隊列協(xié)議(AMQP)的開源消息代理中間件,下面這篇文章主要給大家介紹了關于python對RabbitMQ的簡單入門使用,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下
2022-06-06
Pytorch實現(xiàn)ResNet網絡之Residual Block殘差塊
這篇文章主要為大家介紹了Pytorch實現(xiàn)ResNet網絡之Residual Block殘差塊實現(xiàn)示例詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-04-04
Python讀取mat文件,并保存為pickle格式的方法
今天小編就為大家分享一篇Python讀取mat文件,并保存為pickle格式的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-10-10
Python中優(yōu)雅地處理JSON5文件的方法詳解
JSON5 是 JSON 的一個超集,通過引入部分 ECMAScript 5.1 的特性來擴展 JSON 的語法,以減少 JSON 格式的某些限制,同時,保持兼容現(xiàn)有的 JSON 格式,本文給大家介紹了Python中如何優(yōu)雅地處理 JSON5 文件,需要的朋友可以參考下
2024-04-04
Python基于yaml文件配置logging日志過程解析
這篇文章主要介紹了Python基于yaml文件配置logging日志過程解析,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-06-06
Python內置的HTTP協(xié)議服務器SimpleHTTPServer使用指南
這篇文章主要介紹了Python內置的HTTP協(xié)議服務器SimpleHTTPServer使用指南,SimpleHTTPServer本身的功能十分簡單,文中介紹了需要的朋友可以參考下
2016-03-03