Python生成詞云的實現(xiàn)代碼
1 概述
利用Python生成簡單的詞云,需要的工具是cython,wordcloud與anaconda.
2 準備工作
包括安裝cython,wordcloud與anaconda.
2.1 安裝anaconda

選擇對應(yīng)的版本下載即可.
2.2 安裝cython
cython是為了安裝wordcloud準備的.
pip -m pip install --upgrade cython

2.3 安裝wordcloud
安裝wordcloud前需要先安裝Microsoft Visuall C++ 14.0.
這里下載
安裝好了以后重啟,輸入
python -m easy_install wordcloud

3 使用
3.1 打開Jupyter
打開Jupyter Notebook.

然后會在瀏覽器打開這個頁面,新建一個notebook.

先把需要的庫導(dǎo)入:
from wordcloud import WordCloud import matplotlib.pyplot as plt

3.2 創(chuàng)建文字庫
簡單的文字庫可以直接選擇一個txt文件,復(fù)雜的話可以選擇創(chuàng)建一個excel,導(dǎo)出為csv文件,然后利用pandas庫的read_csv()讀入文件.這里創(chuàng)建一個txt,空格分隔單詞即可.

然后上傳到Jupyter中:

3.3 生成詞云
首先讀入文件:
text = open('1.txt').read()
然后使用WordCloud().generate(text),在里面設(shè)置各種屬性.
wc=WordCloud( width=800, repeat=True, height=800).generate(text)
這里設(shè)置了高度與寬度,允許重復(fù).
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.show()
顯示詞云,
interpolation='bilinear'
會使顯示平滑更加平滑,axis("off")表示不顯示坐標軸.
下面是效果:

3.4 注意事項
如果含有漢字,首先在讀取時設(shè)置編碼:
text = open('1.txt',encoding='utf-8')
然后再生成詞云時設(shè)置字體:
wc = WordCloud(font_path=r'C:\Windows\Fonts\simfang.ttf')
測試:

text=open('1.txt',encoding='utf-8').read()
wc=WordCloud(
width=1300,
repeat=True,
font_path=r'C:\Windows\Fonts\simfang.ttf',
height=1300).generate(text)
plt.imshow(wc,interpolation="bilinear")
plt.axis("off")
plt.savefig('aaaa.jpg')


以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Python2與Python3的區(qū)別實例總結(jié)
這篇文章主要介紹了Python2與Python3的區(qū)別,結(jié)合實例形式總結(jié)分析了Python2與Python3打印輸出、編碼、數(shù)值運算、異常處理等使用區(qū)別,需要的朋友可以參考下2019-04-04
Python實現(xiàn)TCP探測目標服務(wù)路由軌跡的原理與方法詳解
這篇文章主要介紹了Python實現(xiàn)TCP探測目標服務(wù)路由軌跡的原理與方法,結(jié)合實例形式分析了Python TCP探測目標服務(wù)路由軌跡的原理、實現(xiàn)方法及相關(guān)操作注意事項,需要的朋友可以參考下2019-09-09
使用原生Python編寫Hadoop?MapReduce程序
在大數(shù)據(jù)處理領(lǐng)域,Hadoop?MapReduce是一個廣泛使用的框架,用于處理和生成大規(guī)模數(shù)據(jù)集,本文將使用原生Python編寫Hadoop?MapReduce程序,需要的可以參考下2025-02-02
對PyQt5的輸入對話框使用(QInputDialog)詳解
今天小編就為大家分享一篇對PyQt5的輸入對話框使用(QInputDialog)詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06

