Python語言檢測模塊langid和langdetect的使用實(shí)例
之前使用數(shù)據(jù)編碼風(fēng)格檢測的模塊chardet比較多一點(diǎn),今天提到的兩個(gè)模塊是檢測數(shù)據(jù)的語言類型,比如是:中文還是英文,模塊的使用方法也比較簡單,我這里只是簡單地使用了一下,因?yàn)轫?xiàng)目中有這個(gè)需求,所以拿來用了一下,并沒有深入地去研究這兩個(gè)模塊,模塊的地址鏈接我都給出來了,需要的話可以去研究下:
def langidFunc():
'''
https://github.com/yishuihanhan/langid.py
'''
print langid.classify("We Are Family")
print langid.classify("Questa e una prova")
print langid.classify("我們都有一個(gè)家")
identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
print identifier.classify("We Are Family")
def langdetectFunc():
'''
https://github.com/yishuihanhan/langdetect
'''
s1=u"本篇文章主要介紹兩款語言探測工具,用于區(qū)分文本到底是什么語言,"
s2=u'We are pleased to introduce today a new technology'
print detect(s1)
print detect(s2)
print detect_langs(s2) # detect_langs()輸出探測出的所有語言類型及其所占的比例
print detect_langs("Otec matka syn.")
結(jié)果如下:
('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接
- Python爬蟲之UserAgent的使用實(shí)例
- Python快速轉(zhuǎn)換numpy數(shù)組中Nan和Inf的方法實(shí)例說明
- Python基于滑動(dòng)平均思想實(shí)現(xiàn)缺失數(shù)據(jù)填充的方法
- 利用Python對文件夾下圖片數(shù)據(jù)進(jìn)行批量改名的代碼實(shí)例
- Python基于opencv調(diào)用攝像頭獲取個(gè)人圖片的實(shí)現(xiàn)方法
- 啥是佩奇?使用Python自動(dòng)繪畫小豬佩奇的代碼實(shí)例
- Python實(shí)戰(zhàn)購物車項(xiàng)目的實(shí)現(xiàn)參考
- Python英文文本分詞(無空格)模塊wordninja的使用實(shí)例
- Python基于datetime或time模塊分別獲取當(dāng)前時(shí)間戳的方法實(shí)例
- Python多進(jìn)程fork()函數(shù)詳解
相關(guān)文章
python 根據(jù)時(shí)間來生成唯一的字符串方法
今天小編就為大家分享一篇python 根據(jù)時(shí)間來生成唯一的字符串方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-01-01
PyQt5?python?數(shù)據(jù)庫?表格動(dòng)態(tài)增刪改詳情
這篇文章主要介紹了PyQt5?python?數(shù)據(jù)庫?表格動(dòng)態(tài)增刪改詳情,首先手動(dòng)連接數(shù)據(jù)庫與下一個(gè)的程序連接數(shù)據(jù)庫是獨(dú)立的2個(gè)部分,下面來看看文章的詳細(xì)介紹2022-01-01
Python數(shù)學(xué)建模庫StatsModels統(tǒng)計(jì)回歸簡介初識
這篇文章主要為大家介紹了Python數(shù)學(xué)建模庫StatsModels統(tǒng)計(jì)回歸的基本概念,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝打擊多多進(jìn)步2021-10-10
python實(shí)現(xiàn)機(jī)器人行走效果
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)機(jī)器人行走效果,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-01-01
python實(shí)現(xiàn)列表推導(dǎo)式與生成器
列表推導(dǎo)式和生成器都是Python中處理集合的強(qiáng)大工具,列表推導(dǎo)式用于快速生成列表,而生成器表達(dá)式則提供了一種節(jié)約內(nèi)存的方式來處理大型數(shù)據(jù)集,下面就來介紹一下python實(shí)現(xiàn)列表推導(dǎo)式與生成器,感興趣的可以了解一下2024-09-09
Pyinstaller打包Scrapy項(xiàng)目的實(shí)現(xiàn)步驟
這篇文章主要介紹了Pyinstaller打包Scrapy項(xiàng)目的實(shí)現(xiàn)步驟,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09

