Python爬蟲分析微博熱搜關鍵詞的實現(xiàn)代碼

更新時間：2021年02月22日 10:15:41 作者：北晨lpl

這篇文章主要介紹了Python爬蟲分析微博熱搜關鍵詞的實現(xiàn)代碼,本文給大家介紹的非常詳細，對大家的學習或工作具有一定的參考借鑒價值，需要的朋友可以參考下

1，使用到的第三方庫
requests
BeautifulSoup 美味湯
worldcloud 詞云
jieba 中文分詞
matplotlib 繪圖
2，代碼實現(xiàn)部分

import requests
import wordcloud
import jieba
from bs4 import BeautifulSoup
from matplotlib import pyplot as plt
from pylab import mpl

#設置字體
mpl.rcParams['font.sans-serif'] = ['SimHei']
mpl.rcParams['axes.unicode_minus'] = False

url = 'https://s.weibo.com/top/summary?Refer=top_hot&topnav=1&wvr=6'

try:
  #獲取數(shù)據(jù)
  r = requests.get(url)
  r.raise_for_status()
  r.encoding = r.apparent_encoding
  soup = BeautifulSoup(r.text,'html.parser')
  data = soup.find_all('a')
  d_list = []
  for item in data:
    d_list.append(item.text)
  words = d_list[4:-11:]
  #中文分詞
  result = list(jieba.cut(words[0]))
  for word in words[1::]:
    result.extend(jieba.cut(word))
  redata = []
  for it in result:
    if len(it) <= 1:
      continue
    else:
      redata.append(it)
  result_str = ' '.join(redata)
  #輸出詞云圖
  font = r'C:\Windows\Fonts\simhei.ttf'
  w = wordcloud.WordCloud(font_path=font,width=600,height=400)
  w.generate(result_str)
  w.to_file('微博熱搜關鍵詞詞云.png')
  key = list(set(redata))
  x,y = [],[]
  #篩選數(shù)據(jù)
  for st in key:
    count = redata.count(st)
    if count <= 1:
      continue
    else:
      x.append(st)
      y.append(count)
  x.sort()
  y.sort()
  #繪制結果圖
  plt.plot(x,y)
  plt.show()
except Exception as e:
  print(e)

3，運行結果

在這里插入圖片描述

到此這篇關于Python爬蟲分析微博熱搜關鍵詞的文章就介紹到這了,更多相關Python爬蟲微博熱搜內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

rsa詳解及例題及python算法
RSA公開密鑰密碼體制的原理是：根據(jù)數(shù)論，尋求兩個大素數(shù)比較簡單，而將它們的乘積進行因式分解卻極其困難，因此可以將乘積公開作為加密密鑰，這篇文章主要介紹了rsa?詳解及例題及python,需要的朋友可以參考下
2022-04-04
深入解答關于Python的11道基本面試題
這篇文章主要介紹了關于Python的11道基本面試題，其中單引號，雙引號，三引號的區(qū)別、Python的參數(shù)傳遞是值傳遞還是引用傳遞以及什么是lambda函數(shù)？它有什么好處?等一系列的基礎面試題，文中給出了詳細的解答，需要的朋友可以參考學習。
2017-04-04
python中的getter與setter你了解嗎
這篇文章主要為大家詳細介紹了python中的getter與setter，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下，希望能夠給你帶來幫助
2022-03-03
pandas進行時間數(shù)據(jù)的轉換和計算時間差并提取年月日
這篇文章主要介紹了pandas進行時間數(shù)據(jù)的轉換和計算時間差并提取年月日，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-07-07
Python3利用Dlib實現(xiàn)攝像頭實時人臉檢測和平鋪顯示示例
這篇文章主要介紹了Python3利用Dlib實現(xiàn)攝像頭實時人臉檢測和平鋪顯示示例，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-02-02
對Python 內(nèi)建函數(shù)和保留字詳解
今天小編就為大家分享一篇對Python 內(nèi)建函數(shù)和保留字詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-10-10
python+tkinter實現(xiàn)一個簡單的秒鐘
這篇文章主要為大家詳細介紹了Python如何利用tkinter實現(xiàn)一個簡單的秒鐘,文中的示例代碼講解詳細,具有一定的參考價值,感興趣的小伙伴可以自己動手嘗試一下
2024-02-02
淺析python redis的連接及相關操作
Redis是一個開源的使用ANSIC語言編寫、支持網(wǎng)絡、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫，并提供多種語言的API。這篇文章主要介紹了python redis的連接及相關操作,需要的朋友可以參考下
2019-11-11
python中使用requests設置代理服務器
文章介紹了代理服務器的工作原理和使用方法,包括代理的概念、代理服務器的作用、如何在Python中設置代理以及代理的匿名度分類
2024-11-11
Python實現(xiàn)TCP通信的示例代碼
這篇文章主要介紹了Python實現(xiàn)TCP通信的示例代碼，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-09-09