Python jieba庫分詞模式實例用法
在中文分詞中,jiebe庫是最為常見的,主要的原因還是它獨特的支持分詞模式如:精確模式、全模式、搜索引擎模式。也對應(yīng)著三種方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就為大家實例操作這些分詞模式,以及方法的使用,一起來了解下吧。
全模式:
import jieba
seg_list = jieba.cut("南京市長江大橋歡迎你。", cut_all=True)
print(type(seg_list),seg_list)
精確模式:
seg_list1 = jieba.lcut("南京市長江大橋歡迎你。", cut_all=False)
print(type(seg_list1),seg_list1)
搜索模式:
seg_list2 = jieba.cut_for_search("南京市長江大橋歡迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精確模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))
輸出結(jié)果:
全模式:南京/ 南京市/ 京市/ 市長/ 長江/ 長江大橋/ 大橋/ 歡迎/ 你/ 。
精確模式:南京市/ 長江大橋/ 歡迎/ 你/ 。
搜索引擎模式:南京/ 京市/ 南京市/ 長江/ 大橋/ 長江大橋/ 歡迎/ 你/ 。
內(nèi)容擴展:
獲取詞性
我們還可以通過jiaba這個庫把詞性進行區(qū)分,比如動詞,名詞等
import jieba.posseg as psg
seg_list = psg.cut("我要進行關(guān)鍵詞提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('進行', 'v'), ('關(guān)鍵詞', 'n'), ('提取', 'v')]
我們還可以提取動詞或者名詞,我們來提取下里面的動詞
import jieba.posseg as psg
seg_list = psg.cut("我要進行關(guān)鍵詞提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])
到此這篇關(guān)于Python jieba庫分詞模式實例用法的文章就介紹到這了,更多相關(guān)Python jieba庫分詞模式怎么用內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python異步實現(xiàn)定時任務(wù)和周期任務(wù)的方法
今天小編就為大家分享一篇python異步實現(xiàn)定時任務(wù)和周期任務(wù)的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-06-06
Python使用sqlite3模塊內(nèi)置數(shù)據(jù)庫
這篇文章主要介紹了Python使用sqlite3模塊內(nèi)置數(shù)據(jù)庫,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習或者工作具有一定的參考學(xué)習價值,需要的朋友可以參考下2020-05-05

