python中similarity函數(shù)實(shí)例用法
1、similarity函數(shù)接收兩個(gè)列表,并返回由兩個(gè)列表中相同元素組成的列表。
2、函數(shù)使用列表推導(dǎo),遍歷所有a列表中的元素,并使用in關(guān)鍵詞來(lái)判斷這些元素是否存在于b列表中。
實(shí)例
def similarity(a, b): return [item for item in a if item in b] # EXAMPLES similarity([1, 2, 3], [1, 2, 4]) # [1, 2]
知識(shí)點(diǎn)擴(kuò)充:
python 語(yǔ)義similarity_Python:string的語(yǔ)義相似度得分
Python:string的語(yǔ)義相似度得分
有沒(méi)有用于計(jì)算一對(duì)句子的語(yǔ)義相似度分?jǐn)?shù)的庫(kù)?
我知道WordNet的語(yǔ)義數(shù)據(jù)庫(kù),以及如何為2個(gè)單詞生成分?jǐn)?shù),但是我正在尋找能夠在整個(gè)句子和輸出中執(zhí)行所有預(yù)處理任務(wù)(如端口詞干,停用詞刪除等)的庫(kù)兩個(gè)句子如何相關(guān)的分?jǐn)?shù)。
我發(fā)現(xiàn)了一個(gè)使用.NET框架編寫(xiě)的工作 ,它使用一系列預(yù)處理步驟來(lái)計(jì)算分?jǐn)?shù)。 有沒(méi)有任何項(xiàng)目,在Python中做到這一點(diǎn)?
我不是在尋找能夠幫助我find分?jǐn)?shù)的操作順序(就像這里要求的那樣)
我喜歡自己實(shí)現(xiàn)每個(gè)階段,或者從不同的庫(kù)中粘貼函數(shù),以便它可以用于句對(duì),但是我主要需要這個(gè)工具來(lái)testing數(shù)據(jù)的推論。
編輯:我正在考慮使用NLTK和計(jì)算每?jī)蓚€(gè)單詞對(duì)這兩個(gè)句子迭代的得分,然后從結(jié)果的標(biāo)準(zhǔn)偏差中得出推論,但我不知道這是否是一個(gè)合理的相似性估計(jì)。 另外,這將花費(fèi)很長(zhǎng)的時(shí)間。
再次,我正在尋找已經(jīng)實(shí)現(xiàn)這個(gè)智能的項(xiàng)目/庫(kù)。 東西,讓我這樣做:
import amazing_semsim_package str1='Birthday party ruined as cake explodes' str2='Grandma mistakenly bakes cake using gunpowder' >>similarity(str1,str2) >>0.889
我見(jiàn)過(guò)的最好的包裝是在Gensim主頁(yè)find的Gensim 。 我已經(jīng)使用過(guò)很多次了,總體而言非常滿(mǎn)意,它的易用性, 它是用Python編寫(xiě)的,并且有一個(gè)簡(jiǎn)單的跟隨教程來(lái)開(kāi)始,它比較了9個(gè)string。 它可以通過(guò)點(diǎn)安裝,所以你不會(huì)有很多麻煩得到它安裝,我希望。
你使用哪種評(píng)分algorithm在很大程度上取決于你的問(wèn)題的背景,但是如果你想要一些基本的東西的話(huà),我build議開(kāi)始使用LSI的function。 (這是教程引導(dǎo)你通過(guò)。)
如果您閱讀gensim教程,它將引導(dǎo)您通過(guò)比較兩個(gè)string,使用Similaritiesfunction。 這樣可以讓你看到你的叮咬是如何根據(jù)它們所包含的文字相互比較的,或者是一些其他的刺痛。
到此這篇關(guān)于python中similarity函數(shù)實(shí)例用法的文章就介紹到這了,更多相關(guān)python中similarity函數(shù)的使用內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python+Appium實(shí)現(xiàn)自動(dòng)搶微信紅包
不知從何時(shí)開(kāi)始微信紅包橫空出世,對(duì)于網(wǎng)速和手速慢的人只能在一旁觀(guān)望,做為python的學(xué)習(xí)者就是要運(yùn)用編程解決生活和工作上的事情。于是我用python解決我們的手速問(wèn)題python實(shí)現(xiàn)自動(dòng)搶微信紅包,至于網(wǎng)速慢得那就只能自己花錢(qián)提升了。2021-05-05
Python?頁(yè)面解析Beautiful?Soup庫(kù)的使用方法
Beautiful?Soup?簡(jiǎn)稱(chēng)?BS4(其中?4?表示版本號(hào))是一個(gè)?Python?中常用的頁(yè)面解析庫(kù),它可以從?HTML?或?XML?文檔中快速地提取指定的數(shù)據(jù),這篇文章主要介紹了springboot?集成?docsify?實(shí)現(xiàn)隨身文檔?,需要的朋友可以參考下2022-09-09
python時(shí)間日期函數(shù)與利用pandas進(jìn)行時(shí)間序列處理詳解
python標(biāo)準(zhǔn)庫(kù)包含于日期(date)和時(shí)間(time)數(shù)據(jù)的數(shù)據(jù)類(lèi)型,datetime、time以及calendar模塊會(huì)被經(jīng)常用到,而pandas則可以對(duì)時(shí)間進(jìn)行序列化排序2018-03-03
Python WebSocket長(zhǎng)連接心跳與短連接的示例
這篇文章主要介紹了Python WebSocket長(zhǎng)連接心跳與短連接的示例,幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下2020-11-11
python3實(shí)現(xiàn)簡(jiǎn)單飛機(jī)大戰(zhàn)
這篇文章主要為大家詳細(xì)介紹了python3實(shí)現(xiàn)簡(jiǎn)單飛機(jī)大戰(zhàn),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2020-11-11
詳解python requests中的post請(qǐng)求的參數(shù)問(wèn)題
這篇文章主要介紹了詳解python requests中的post請(qǐng)求的參數(shù)問(wèn)題,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-03-03
java中兩個(gè)byte數(shù)組實(shí)現(xiàn)合并的示例
今天小編就為大家分享一篇java中兩個(gè)byte數(shù)組實(shí)現(xiàn)合并的示例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05

