Python中文分詞實(shí)現(xiàn)方法(安裝pymmseg)
本文實(shí)例講述了Python中文分詞實(shí)現(xiàn)方法。分享給大家供大家參考,具體如下:
在Python這pymmseg-cpp 還是十分方便的!
環(huán)境 ubuntu10.04 , python2.65
步驟:
1 下載mmseg-cpp的源代碼 http://code.google.com/p/pymmseg-cpp/
2 執(zhí)行:
tar -zxf pymmseg-cpp*.tar.gz //解壓后得到pymmseg 目錄 cd pymmseg\mmseg-cpp python build.py #生成 mmseg.so文件
3 將 pymmseg 目錄復(fù)制到 /usr/local/lib/python2.6/dist-packages 中
4 測(cè)試有沒(méi)有成功:
test.py文件:
from pymmseg import mmseg mmseg.dict_load_defaults() text = '今天的天氣真好啊,我們一起出去玩一下吧' algor = mmseg.Algorithm(text) for tok in algor: print '%s [%d..%d]' % (tok.text, tok.start, tok.end)
更多關(guān)于Python相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Python圖片操作技巧總結(jié)》、《Python數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Python Socket編程技巧總結(jié)》、《Python函數(shù)使用技巧總結(jié)》、《Python字符串操作技巧匯總》、《Python入門(mén)與進(jìn)階經(jīng)典教程》及《Python文件與目錄操作技巧匯總》
希望本文所述對(duì)大家Python程序設(shè)計(jì)有所幫助。
- python實(shí)現(xiàn)中文分詞FMM算法實(shí)例
- Python結(jié)巴中文分詞工具使用過(guò)程中遇到的問(wèn)題及解決方法
- Python中文分詞工具之結(jié)巴分詞用法實(shí)例總結(jié)【經(jīng)典案例】
- python中文分詞教程之前向最大正向匹配算法詳解
- python中文分詞,使用結(jié)巴分詞對(duì)python進(jìn)行分詞(實(shí)例講解)
- python使用jieba實(shí)現(xiàn)中文分詞去停用詞方法示例
- python中文分詞庫(kù)jieba使用方法詳解
- Python中文分詞庫(kù)jieba,pkusegwg性能準(zhǔn)確度比較
- Python3爬蟲(chóng)中關(guān)于中文分詞的詳解
- Python jieba 中文分詞與詞頻統(tǒng)計(jì)的操作
- Python中文分詞庫(kù)jieba(結(jié)巴分詞)詳細(xì)使用介紹
相關(guān)文章
通過(guò)python將大量文件按修改時(shí)間分類(lèi)的方法
今天小編就為大家分享一篇通過(guò)python將大量文件按修改時(shí)間分類(lèi)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-10-10
如何修復(fù)使用 Python ORM 工具 SQLAlchemy 時(shí)的常見(jiàn)陷阱
SQLAlchemy 是一個(gè) Python ORM 工具包,它提供使用 Python 訪問(wèn) SQL 數(shù)據(jù)庫(kù)的功能。這篇文章主要介紹了如何修復(fù)使用 Python ORM 工具 SQLAlchemy 時(shí)的常見(jiàn)陷阱,需要的朋友可以參考下2019-11-11
pyhton中__pycache__文件夾的產(chǎn)生與作用詳解
這篇文章主要介紹了pyhton中__pycache__文件夾的產(chǎn)生與作用詳解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-11-11
python網(wǎng)絡(luò)爬蟲(chóng)selenium打開(kāi)多窗口與切換頁(yè)面的實(shí)現(xiàn)
本文主要介紹了python網(wǎng)絡(luò)爬蟲(chóng)selenium打開(kāi)多窗口與切換頁(yè)面的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01
Pandas實(shí)現(xiàn)Excel文件讀取,增刪,打開(kāi),保存操作
Pandas?是一種基于?NumPy?的開(kāi)源數(shù)據(jù)分析工具,用于處理和分析大量數(shù)據(jù)。本文將通過(guò)Pandas實(shí)現(xiàn)對(duì)Excel文件進(jìn)行讀取、增刪、打開(kāi)、保存等操作,需要的可以參考一下2023-04-04
Python3中的re.findall()方法及re.compile()
這篇文章主要介紹了Python3中的re.findall()方法及re.compile(),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-05-05
MacOS(M1芯片 arm架構(gòu))下安裝PyTorch的詳細(xì)過(guò)程
這篇文章主要介紹了MacOS(M1芯片 arm架構(gòu))下安裝PyTorch的詳細(xì)過(guò)程,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-02-02
使用Python中的線程進(jìn)行網(wǎng)絡(luò)編程的入門(mén)教程
這篇文章主要介紹了使用Python中的線程進(jìn)行網(wǎng)絡(luò)編程的入門(mén)教程,本文來(lái)自于IBM官方網(wǎng)站技術(shù)文檔,需要的朋友可以參考下2015-04-04
python pow函數(shù)的底層實(shí)現(xiàn)原理介紹
這篇文章主要介紹了python pow函數(shù)的底層實(shí)現(xiàn)原理介紹,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2021-03-03

