python同義詞替換的實(shí)現(xiàn)(jieba分詞)
更新時(shí)間:2020年01月21日 10:24:21 作者:Lty美麗人生
這篇文章主要介紹了python同義詞替換的實(shí)現(xiàn)(jieba分詞),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
TihuanWords.txt文檔格式
注意:同一行的詞用單個(gè)空格隔開,每行第一個(gè)詞為同行詞的替換詞。
年休假 年假 年休
究竟 到底
回家場景 我回來了
代碼
import jieba
def replaceSynonymWords(string1):
# 1讀取同義詞表,并生成一個(gè)字典。
combine_dict = {}
# synonymWords.txt是同義詞表,每行是一系列同義詞,用空格分割
for line in open("TihuanWords.txt", "r", encoding='utf-8'):
seperate_word = line.strip().split(" ")
num = len(seperate_word)
for i in range(1, num):
combine_dict[seperate_word[i]] = seperate_word[0]
print(seperate_word)
print(combine_dict)
# 2提升某些詞的詞頻,使其能夠被jieba識別出來
jieba.suggest_freq("年休假", tune=True)
# 3將語句切分成單詞
seg_list = jieba.cut(string1, cut_all=False)
f = "/".join(seg_list).encode("utf-8")
f = f.decode("utf-8")
print(f)
# 4返回同義詞替換后的句子
final_sentence = " "
for word in f.split('/'):
if word in combine_dict:
word = combine_dict[word]
final_sentence += word
else:
final_sentence += word
# print final_sentence
return final_sentence
string1 = '年休到底放幾天?'
print(replaceSynonymWords(string1))
結(jié)果

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
教你用Python為二年級的學(xué)生批量生成數(shù)學(xué)題
這兩天在學(xué)習(xí)pthon,正好遇到老師布置的暑假作業(yè),需要家長給還在出試卷,下面這篇文章主要給大家介紹了關(guān)于如何用Python為二年級的學(xué)生批量生成數(shù)學(xué)題的相關(guān)資料,需要的朋友可以參考下2023-02-02
python計(jì)算Content-MD5并獲取文件的Content-MD5值方式
這篇文章主要介紹了python計(jì)算Content-MD5并獲取文件的Content-MD5值方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04
python中執(zhí)行shell命令的幾個(gè)方法小結(jié)
這篇文章主要介紹了python中執(zhí)行shell命令的幾個(gè)方法,本文一共給出3種方法實(shí)現(xiàn)執(zhí)行shell命令,需要的朋友可以參考下2014-09-09
關(guān)于PyQt5主窗口圖標(biāo)顯示問題匯總
這篇文章主要介紹了關(guān)于PyQt5主窗口圖標(biāo)顯示問題匯總,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-03-03
python manim實(shí)現(xiàn)排序算法動畫示例
這篇文章主要為大家介紹了python manim實(shí)現(xiàn)排序算法動畫示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-08-08

