Python基于wordcloud及jieba實(shí)現(xiàn)中國(guó)地圖詞云圖
熱詞圖很酷炫,也非常適合熱點(diǎn)事件,抓住重點(diǎn),以圖文結(jié)合的方式表現(xiàn)出來,很有沖擊力。下面這段代碼是制作熱詞圖的,用到了以下技術(shù):
jieba,把文本分詞
wordcloud,制作熱圖
chardet,辨別文件的編碼格式,其中中文統(tǒng)一為GB18030,更加的兼容
imageio,提取圖片的形狀
其他:自動(dòng)識(shí)別文件編碼,自動(dòng)識(shí)別txt文件,圖片文件名與txt文件一致,使用的是四大名著的文本(自行百度),部分中國(guó)地圖
上代碼:
import os
import jieba
import wordcloud
import chardet
import imageio
directory = "D:\\"
mask = imageio.imread(r"D:\map.jpg") # 用于最后圖像圖形
directory_lists = os.scandir(directory)
for directory_list in directory_lists:
if directory_list.is_dir() or directory_list.path.split('.')[-1] != "txt":
continue
with open(directory_list.path, 'rb') as fd:
coding = chardet.detect(fd.read()[:1000])['encoding']
if coding.upper() == 'GB2312' or coding == 'GBK':
coding = 'GB18030'
file = open(directory_list.path, 'r', encoding=coding)
text = file.read()
file.close()
jieba_text = ' '.join(jieba.lcut(text))
w = wordcloud.WordCloud(height=800, width=1600, font_path='msyh.ttc', background_color='white', stopwords={'Page'}, mask=mask)
w.generate(jieba_text)
w.to_file('{}.png'.format(directory_list.path.split('.')[0]))
輸出:
水滸傳的如下

西游記的如下

仔細(xì)看輸出的內(nèi)容,還是挺有意思的,哈哈哈。
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
pytorch 求網(wǎng)絡(luò)模型參數(shù)實(shí)例
今天小編就為大家分享一篇pytorch 求網(wǎng)絡(luò)模型參數(shù)實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-12-12
python argparse 模塊命令行參數(shù)用法及說明
這篇文章主要介紹了python argparse 模塊命令行參數(shù)用法及說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-11-11
python異步編程之a(chǎn)syncio低階API的使用詳解
asyncio中低階API的種類很多,涉及到開發(fā)的5個(gè)方面,這篇文章主要為大家詳細(xì)介紹了這些低階API的具體使用,感興趣的小伙伴可以學(xué)習(xí)一下2024-01-01
Python字符串操作實(shí)戰(zhàn)之如何提取子字符串
這篇文章主要給大家介紹了關(guān)于Python字符串操作實(shí)戰(zhàn)之如何提取子字符串的相關(guān)資料,字符串是Python中最常用的數(shù)據(jù)類型,大家應(yīng)該都不陌生,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-06-06
PyTorch中的神經(jīng)網(wǎng)絡(luò) Mnist 分類任務(wù)
這篇文章主要介紹了PyTorch中的神經(jīng)網(wǎng)絡(luò) Mnist 分類任務(wù),在本次的分類任務(wù)當(dāng)中,我們使用的數(shù)據(jù)集是 Mnist 數(shù)據(jù)集,這個(gè)數(shù)據(jù)集大家都比較熟悉,需要的朋友可以參考下2023-03-03
python 遺傳算法求函數(shù)極值的實(shí)現(xiàn)代碼
今天小編就為大家分享一篇python 遺傳算法求函數(shù)極值的實(shí)現(xiàn)代碼,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-02-02
python中設(shè)置超時(shí)跳過,超時(shí)退出的方式
今天小編就為大家分享一篇python中設(shè)置超時(shí)跳過,超時(shí)退出的方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-12-12
Python常見數(shù)字運(yùn)算操作實(shí)例小結(jié)
這篇文章主要介紹了Python常見數(shù)字運(yùn)算操作,結(jié)合實(shí)例形式總結(jié)分析了Python數(shù)字常見的四則運(yùn)算、整除、取余、開平方等相關(guān)操作技巧與注意事項(xiàng),需要的朋友可以參考下2019-03-03

