Python實現(xiàn)爬取并分析電商評論
現(xiàn)如今各種APP、微信訂閱號、微博、購物網(wǎng)站等網(wǎng)站都允許用戶發(fā)表一些個人看法、意見、態(tài)度、評價、立場等信息。針對這些數(shù)據(jù),我們可以利用情感分析技術(shù)對其進行分析,總結(jié)出大量的有價值信息。例如對商品評論的分析,可以了解用戶對商品的滿意度,進而改進產(chǎn)品;通過對一個人分布內(nèi)容的分析,了解他的情緒變化,哪種情緒多,哪種情緒少,進而分析他的性格。怎樣知道哪些評論是正面的,哪些評論是負面的呢?正面評價的概率是多少呢?
利用python的第三方模塊SnowNLP可以實現(xiàn)對評論內(nèi)容的情感分析預(yù)測,SnowNLP可以方便的處理中文文本內(nèi)容,如中文分詞、詞性標注、情感分析、文本分類、提取文本關(guān)鍵詞、文本相似度計算等。大概大于等于0.5,可以判斷為正面評價——積極情感,小于0.5,可以判斷為負面評價——消極情感。
下面分析一組京東上某產(chǎn)品的評論數(shù)據(jù)并生成折線圖:
部分源數(shù)據(jù):

實現(xiàn)過程:
#加載情感分析模塊
from snownlp import SnowNLP
#from snownlp import sentiment
import pandas as pd
import matplotlib.pyplot as plt
#導(dǎo)入樣例數(shù)據(jù)
aa ='F:\\python入門\\python編程錦囊\\Code(實例源碼及使用說明)\\Code(實例源碼及使用說明)\\Code(實例源碼及使用說明)\\09\\data\\京東評論.xls'
#讀取文本數(shù)據(jù)
df=pd.read_excel(aa)
#提取所有數(shù)據(jù)
df1=df.iloc[:,3]
print('將提取的數(shù)據(jù)打印出來:\n',df1)
#遍歷每條評論進行預(yù)測
values=[SnowNLP(i).sentiments for i in df1]
#輸出積極的概率,大于0.5積極的,小于0.5消極的
#myval保存預(yù)測值
myval=[]
good=0
bad=0
for i in values:
if (i>=0.5):
myval.append("正面")
good=good+1
else:
myval.append("負面")
bad=bad+1
df['預(yù)測值']=values
df['評價類別']=myval
#將結(jié)果輸出到Excel
df.to_excel('F:\\python入門\\python編程錦囊\\Code(實例源碼及使用說明)\\Code(實例源碼及使用說明)\\Code(實例源碼及使用說明)\\09\\data\\result2.xls')
rate=good/(good+bad)
print('好評率','%.f%%' % (rate * 100)) #格式化為百分比
#作圖
y=values
plt.rc('font', family='SimHei', size=10)
plt.plot(y, marker='o', mec='r', mfc='w',label=u'評價分值')
plt.xlabel('用戶')
plt.ylabel('評價分值')
# 讓圖例生效
plt.legend()
#添加標題
plt.title('京東評論情感分析',family='SimHei',size=14,color='blue')
plt.show()
Excel結(jié)果:

作圖的結(jié)果:

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
pycharm創(chuàng)建臨時文件scatch file的方法詳解
JetBrains PyCharm是一種Python IDE,其帶有一整套可以幫助用戶在使用Python語言開發(fā)時提高其效率的工具,這篇文章主要介紹了pycharm創(chuàng)建臨時文件scatch file的方法,需要的朋友可以參考下2024-07-07
Linux下使用python腳本執(zhí)行BCP導(dǎo)入導(dǎo)出方式
這篇文章主要介紹了Linux下使用python腳本執(zhí)行BCP導(dǎo)入導(dǎo)出方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2024-01-01
Python?pyecharts案例超市4年數(shù)據(jù)可視化分析
這篇文章主要介紹了Python?pyecharts案例超市4年數(shù)據(jù)可視化分析,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-08-08
使用jupyter notebook將文件保存為Markdown,HTML等文件格式
這篇文章主要介紹了使用jupyter notebook將文件保存為Markdown,HTML等文件格式,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04

