python中將\\uxxxx轉(zhuǎn)換為Unicode字符串的方法
今天碰到一個(gè)很有意思的問題,需要將普通的 Unicode字符串轉(zhuǎn)換為 Unicode編碼的字符串,如下:
將 \\u9500\\u552e 轉(zhuǎn)化為 \u9500\u552e 也就是 銷售 。
乍一看感覺挺簡(jiǎn)單的,用 re 庫將前面的反斜杠去掉即可,但是在替換的過程中會(huì)拋出如下錯(cuò)誤:
Traceback (most recent call last):
File "<pyshell#15>", line 1, in <module>
re.sub(r"(\)\u", r'', t)
File "D:\Python36\lib\re.py", line 191, in sub
return _compile(pattern, flags).sub(repl, string, count)
File "D:\Python36\lib\re.py", line 301, in _compile
p = sre_compile.compile(pattern, flags)
File "D:\Python36\lib\sre_compile.py", line 562, in compile
p = sre_parse.parse(p, flags)
File "D:\Python36\lib\sre_parse.py", line 855, in parse
p = _parse_sub(source, pattern, flags & SRE_FLAG_VERBOSE, 0)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 765, in _parse
p = _parse_sub(source, state, sub_verbose, nested + 1)
File "D:\Python36\lib\sre_parse.py", line 416, in _parse_sub
not nested and not items))
File "D:\Python36\lib\sre_parse.py", line 502, in _parse
code = _escape(source, this, state)
File "D:\Python36\lib\sre_parse.py", line 362, in _escape
raise source.error("incomplete escape %s" % escape, len(escape))
sre_constants.error: incomplete escape \u at position 3
大概意思就是去掉前面的反寫杠之后剩下的 \u 不能組成完整的字符。
到這里問題好像有點(diǎn)難以解決了,這時(shí)候我們會(huì)放棄嗎?
當(dāng)然不會(huì),到谷歌上搜一下,發(fā)現(xiàn)還真有人碰到過這個(gè)問題,解決方法也是十分的巧妙。
竟然還可以使用 json 庫的 loads 方法 ...
解決方法如下:
import json
s = '\\u9500\\u552e'
print(json.loads(f'"{s}"'))
PS:python3 將字符串unicode轉(zhuǎn)換為中文
記錄一個(gè)經(jīng)常會(huì)遇到的問題:
得到的文本打印出來是“\uxxxx”的字符串格式,在python3中使用text.decode('unicode_escape')會(huì)報(bào)錯(cuò):‘str' object has no attribute 'decode'
正確的姿勢(shì)是:
text.encode('utf-8').decode("unicode_escape")
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
- Python 字節(jié)流,字符串,十六進(jìn)制相互轉(zhuǎn)換實(shí)例(binascii,bytes)
- python3 json數(shù)據(jù)格式的轉(zhuǎn)換(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互轉(zhuǎn)換)
- Python 十六進(jìn)制整數(shù)與ASCii編碼字符串相互轉(zhuǎn)換方法
- python 將字符串轉(zhuǎn)換成字典dict的各種方式總結(jié)
- python實(shí)現(xiàn)字典(dict)和字符串(string)的相互轉(zhuǎn)換方法
- python 轉(zhuǎn)換 Javascript %u 字符串為python unicode的代碼
- python 將字符串轉(zhuǎn)換成字典dict
- C語言字符串轉(zhuǎn)換為Python字符串的方法
相關(guān)文章
小白學(xué)Python之實(shí)現(xiàn)OCR識(shí)別
將圖片翻譯成文字一般被稱為光學(xué)文字識(shí)別(Optical Character Recognition,OCR),這篇文章主要給大家介紹了關(guān)于Python實(shí)現(xiàn)OCR識(shí)別的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考下2021-08-08
Python創(chuàng)建模塊及模塊導(dǎo)入的方法
這篇文章主要介紹了Python創(chuàng)建模塊及模塊導(dǎo)入的方法,實(shí)例分析了模塊的定義、導(dǎo)入及模塊屬性的使用技巧,并附帶說明了包的概念與用法,需要的朋友可以參考下2015-05-05
Python中Generators教程的實(shí)現(xiàn)
本文主要介紹了Python中Generators教程的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02
Python 數(shù)據(jù)結(jié)構(gòu)之旋轉(zhuǎn)鏈表
這篇文章主要介紹了Python 數(shù)據(jù)結(jié)構(gòu)之旋轉(zhuǎn)鏈表的相關(guān)資料,需要的朋友可以參考下2017-02-02
處理Selenium3+python3定位鼠標(biāo)懸停才顯示的元素
這篇文章主要介紹了Selenium3+python3--如何定位鼠標(biāo)懸停才顯示的元素 ,文中通過簡(jiǎn)單代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2019-07-07

