python去除拼音聲調(diào)字母,替換為字母的方法
更新時(shí)間:2018年11月28日 09:35:15 作者:瓜而不皮
今天小編就為大家分享一篇python去除拼音聲調(diào)字母,替換為字母的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
第一種方法
import sys
import unicodedata
s = "Lǐ Zhōu Wú"
remap = {
# ord返回ascii值
ord('\t'): '',
ord('\f'): '',
ord('\r'): None
}
# 去除\t, \f, \r
a = s.translate(remap)
'''
通過使用dict.fromkeys() 方法構(gòu)造一個(gè)字典,每個(gè)Unicode 和音符作為鍵,對(duì)于的值全部為None
然后使用unicodedata.normalize() 將原始輸入標(biāo)準(zhǔn)化為分解形式字符
sys.maxunicode : 給出最大Unicode代碼點(diǎn)的值的整數(shù),即1114111(十六進(jìn)制的0x10FFFF)。
unicodedata.combining:將分配給字符chr的規(guī)范組合類作為整數(shù)返回。 如果未定義組合類,則返回0。
'''
cmb_chrs = dict.fromkeys(c for c in range(sys.maxunicode) if unicodedata.combining(chr(c))) #此部分建議拆分開來理解
b = unicodedata.normalize('NFD', a)
'''
調(diào)用translate 函數(shù)刪除所有重音符
'''
print(b.translate(cmb_chrs))
第二種方法 (推薦)
import unicodedata
mystr='Lǐ Zhōu Wú'
unicodedata.normalize('NFKD', mystr).encode('ascii','ignore')
以上這篇python去除拼音聲調(diào)字母,替換為字母的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
您可能感興趣的文章:
- Python 中拼音庫 PyPinyin 用法詳解
- python 批量將中文名轉(zhuǎn)換為拼音
- 基于Python第三方插件實(shí)現(xiàn)西游記章節(jié)標(biāo)注漢語拼音的方法
- 利用python實(shí)現(xiàn)漢字轉(zhuǎn)拼音的2種方法
- 用Python從0開始實(shí)現(xiàn)一個(gè)中文拼音輸入法的思路詳解
- Python3實(shí)現(xiàn)漢語轉(zhuǎn)換為漢語拼音
- Python 獲取中文字拼音首個(gè)字母的方法
- python獲取一組漢字拼音首字母的方法
- Python 返回漢字的漢語拼音
- Python實(shí)現(xiàn)拼音轉(zhuǎn)換
相關(guān)文章
pandas中的DataFrame數(shù)據(jù)遍歷解讀
這篇文章主要介紹了pandas中的DataFrame數(shù)據(jù)遍歷解讀,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-12-12
python+tkinter實(shí)現(xiàn)一個(gè)簡單的秒鐘
這篇文章主要為大家詳細(xì)介紹了Python如何利用tkinter實(shí)現(xiàn)一個(gè)簡單的秒鐘,文中的示例代碼講解詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴可以自己動(dòng)手嘗試一下2024-02-02
詳解Django+Uwsgi+Nginx的生產(chǎn)環(huán)境部署
這篇文章主要介紹了Django + Uwsgi + Nginx 的生產(chǎn)環(huán)境部署,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-06-06
python時(shí)間序列數(shù)據(jù)相減的實(shí)現(xiàn)
本文主要介紹了python時(shí)間序列數(shù)據(jù)相減的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-04-04

