python2 中 unicode 和 str 之間的轉(zhuǎn)換及與python3 str 的區(qū)別
在python2中字符串分為 unicode 和 str 類(lèi)型
Str To Unicode 使用decode(), 解碼 Unicode To Str 使用encode(), 編碼
返回?cái)?shù)據(jù)給前端時(shí)需要先將unicode轉(zhuǎn)換為str類(lèi)型, 事實(shí)上, python2 中的 str 就是一串字節(jié)(byte), 而網(wǎng)絡(luò)通信時(shí), 傳輸?shù)木褪亲止?jié). 如果前端需要接收json數(shù)據(jù), 需要使用 json.dumps() 將數(shù)據(jù)轉(zhuǎn)換為json格式進(jìn)行返回, 當(dāng)數(shù)據(jù)是嵌套類(lèi)型的數(shù)據(jù), 內(nèi)層的數(shù)據(jù)可能無(wú)法直接轉(zhuǎn)換為str類(lèi)型的數(shù)據(jù), 這時(shí)可以使用eval()函數(shù)進(jìn)行轉(zhuǎn)換, 再使用json.dumps()進(jìn)行轉(zhuǎn)換為json格式的數(shù)據(jù), json 事實(shí)上就是一串字符串.
python2 默認(rèn)情況下 字符串 的類(lèi)型是 str 類(lèi)型, 如果需要得到 unicode 類(lèi)型的字符串, 需要使用下面的方式進(jìn)行聲明:
my_str = u"lowmanisbusy" # 在變量前面加上 u
在 python2 中如果沒(méi)有重新指定字符編碼, 定義中文的字符串時(shí), 需要加上 "u", 指明該字符串為 unicode 類(lèi)型, 指定使用unicode編碼對(duì)其進(jìn)行編碼保存:
my_zh_str = u"渣男不但丑" # 在變量前面加上 u
unicode編碼: unicode編碼為世界上所有字符都分配了一個(gè)唯一編號(hào), 為十六進(jìn)制, 如中文簡(jiǎn)體漢字 “渣” 的 Unicode編號(hào)就是 6E23, 在 python2就是 "\u6e23", 但是unicode僅僅定義了每個(gè)字符的編號(hào),并沒(méi)有定義如何將這個(gè)編號(hào)進(jìn)行存儲(chǔ)的方式,所以后來(lái)出現(xiàn)了utf-8, gbk等編碼格式, 它們都是 unicode 的一種實(shí)現(xiàn)方式, 仍然使用了unicode 中的唯一編號(hào), 個(gè)人對(duì)其的簡(jiǎn)單理解就是在unicode編碼的基礎(chǔ)之上又定義了對(duì)字符的存儲(chǔ)方式.
在python3中字符串分為 str 和 bytes 兩種類(lèi)型
Str To Bytes 使用 encode(), 編碼 Bytes To Str 使用 decode(), 解碼
這里需要說(shuō)明的是, python3 中 bytes 類(lèi)型的字符串, 就相當(dāng)于 python2 中 str 類(lèi)型的字符串, python3中沒(méi)有unicode類(lèi)型的字符串, 這里其實(shí)涉及到默認(rèn)編碼的問(wèn)題, python3默認(rèn)字符編碼為:utf-8, python2默認(rèn)字符編碼為:ASCII, ASCII碼 包含了128個(gè)字符, 其中包括所有的英文字符, 阿拉伯?dāng)?shù)字, 標(biāo)點(diǎn)符號(hào), 控制符號(hào)等, 卻沒(méi)有中文, 中文是象形文字, 需要使用到更多的字節(jié)進(jìn)行組合來(lái)表示出每個(gè)漢字, 因此ASCII是無(wú)法滿足對(duì)中文的表示的, 所以 python2中如果沒(méi)有重新設(shè)置字符編碼的話,代碼中就不允許出現(xiàn)str類(lèi)型的中文字符串(可以指定為unicode類(lèi)型), 因?yàn)镃python2解釋器無(wú)法識(shí)別. 至于 ASCII, UNICODE, UTF-8 之間的關(guān)系與區(qū)別這里就不細(xì)說(shuō)了, 可以自行去了解一下( utf-8編碼 是 unicode編碼 的一種實(shí)現(xiàn)方式, 個(gè)人理解可以認(rèn)為是下面這樣一種關(guān)系: utf-8 <---> unicode <--->byte, 最終,數(shù)據(jù)的傳輸仍然是以二進(jìn)制的形式一個(gè)一個(gè)字節(jié)進(jìn)行傳輸?shù)?
默認(rèn)情況下,python3中字符串的類(lèi)型為 str, 在web框架中, 會(huì)自動(dòng)將 str轉(zhuǎn)換成 byte 向前端返回.
當(dāng)需要將某種編碼格式的bytes轉(zhuǎn)換另外一種編碼格式的bytes時(shí)需要先按原來(lái)的編碼格式進(jìn)行解碼成str類(lèi)型, 再使用新的編碼格式轉(zhuǎn)換為bytes類(lèi)型
如: 若存在變量 my_bt, 其為編碼格式 gbk 的 bytes, 需將其轉(zhuǎn)換為utf-8的編碼格式,需要進(jìn)行如下的處理:
my_str = my_bt.decode("gbk") # 解碼
my_bt = my_str.encode("utf-8") # 重新編碼
因?yàn)?python3 中沒(méi)有 unicode 類(lèi)型的字符串, 所有在 python3 中使用下面這種方式定義字符串是沒(méi)有意義的
my_str = u"渣男不但丑"
ps:下面看下Python2之unicode轉(zhuǎn)字符串
str.encode('unicode-escape').decode('string_escape')
總結(jié)
以上所述是小編給大家介紹的python2 中 unicode 和 str 之間的轉(zhuǎn)換及與python3 str 的區(qū)別,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!
如果你覺(jué)得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!
- Python3.x和Python2.x的區(qū)別介紹
- python3 與python2 異常處理的區(qū)別與聯(lián)系
- python2 與python3的print區(qū)別小結(jié)
- 淺談Python2.6和Python3.0中八進(jìn)制數(shù)字表示的區(qū)別
- 淺述python2與python3的簡(jiǎn)單區(qū)別
- Python2與Python3的區(qū)別實(shí)例分析
- Python2.X/Python3.X中urllib庫(kù)區(qū)別講解
- python2和python3的輸入和輸出區(qū)別介紹
- python2和python3在處理字符串上的區(qū)別詳解
- python面試題Python2.x和Python3.x的區(qū)別
- Python2與Python3的區(qū)別點(diǎn)整理
- Python2 與Python3的版本區(qū)別實(shí)例分析
相關(guān)文章
python對(duì)指定字符串逆序的6種方法(小結(jié))
這篇文章主要介紹了python對(duì)指定字符串逆序的6種方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-04-04
numpy.random.seed()的使用實(shí)例解析
這篇文章主要介紹了numpy.random.seed()的使用實(shí)例解析,分享了相關(guān)代碼示例,小編覺(jué)得還是挺不錯(cuò)的,具有一定借鑒價(jià)值,需要的朋友可以參考下2018-02-02
淺談Python由__dict__和dir()引發(fā)的一些思考
這篇文章主要介紹了淺談Python由__dict__和dir()引發(fā)的一些思考,具有一定參考價(jià)值,需要的朋友可以了解下。2017-10-10
Pytorch的torch.utils.data中Dataset以及DataLoader示例詳解
torch.utils.data?是?PyTorch?提供的一個(gè)模塊,用于處理和加載數(shù)據(jù),該模塊提供了一系列工具類(lèi)和函數(shù),用于創(chuàng)建、操作和批量加載數(shù)據(jù)集,這篇文章主要介紹了Pytorch的torch.utils.data中Dataset以及DataLoader等詳解,需要的朋友可以參考下2023-08-08
python動(dòng)態(tài)文本進(jìn)度條的實(shí)例代碼
這篇文章主要介紹了python動(dòng)態(tài)文本進(jìn)度條的實(shí)例代碼,代碼簡(jiǎn)單易懂,非常不錯(cuò),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-01-01
Pycharm搭建Django項(xiàng)目詳細(xì)教程(看完這一篇就夠了)
這篇文章主要給大家介紹了關(guān)于Pycharm搭建Django項(xiàng)目的詳細(xì)教程,想要學(xué)習(xí)的小伙伴看完這一篇就夠了,pycharm是一種Python?IDE,帶有一整套可以幫助用戶在使用Python語(yǔ)言開(kāi)發(fā)時(shí)提高其效率的工具,需要的朋友可以參考下2023-11-11
Python數(shù)據(jù)結(jié)構(gòu)與算法之完全樹(shù)與最小堆實(shí)例
這篇文章主要介紹了Python數(shù)據(jù)結(jié)構(gòu)與算法之完全樹(shù)與最小堆,結(jié)合實(shí)例形式分析了Python完全樹(shù)定義及堆排序功能實(shí)現(xiàn)相關(guān)操作技巧,需要的朋友可以參考下2017-12-12

