Python3 中文文件讀寫方法

更新時間：2018年01月23日 15:08:59 作者：SuPhoebe

下面小編就為大家分享一篇Python3 中文文件讀寫方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

字符串在Python內部的表示是Unicode編碼，因此，在做編碼轉換時，通常需要以Unicode作為中間編碼，即先將其他編碼的字符串解碼（decode）成Unicode，再從Unicode編碼（encode）成另一種編碼。

在新版本的python3中，取消了unicode類型，代替它的是使用unicode字符的字符串類型(str),字符串類型（str）成為基礎類型如下所示，而編碼后的變?yōu)榱俗止?jié)類型(bytes) 但是兩個函數的使用方法不變：

  decode    encode
bytes ------> str(unicode)------>bytes

u = '中文' #指定字符串類型對象u 
str = u.encode('gb2312') #以gb2312編碼對u進行編碼，獲得bytes類型對象str 
u1 = str.decode('gb2312')#以gb2312編碼對字符串str進行解碼，獲得字符串類型對象u1 
u2 = str.decode('utf-8')#如果以utf-8的編碼對str進行解碼得到的結果，將無法還原原來的字符串內容

文件讀取問題

假如我們讀取一個文件，文件保存時，使用的編碼格式，決定了我們從文件讀取的內容的編碼格式，例如，我們從記事本新建一個文本文件test.txt, 編輯內容，保存的時候注意，編碼格式是可以選擇的，例如我們可以選擇gb2312,那么使用python讀取文件內容，方式如下：

f = open('test.txt','r')
s = f.read() #讀取文件內容,如果是不識別的encoding格式（識別的encoding類型跟使用的系統(tǒng)有關），這里將讀取失敗
'''假設文件保存時以gb2312編碼保存'''
u = s.decode('gb2312') #以文件保存格式對內容進行解碼，獲得unicode字符串
'''下面我們就可以對內容進行各種編碼的轉換了'''
str = u.encode('utf-8')#轉換為utf-8編碼的字符串str
str1 = u.encode('gbk')#轉換為gbk編碼的字符串str1
str1 = u.encode('utf-16')#轉換為utf-16編碼的字符串str1

codecs進行文件的讀取

python給我們提供了一個包codecs進行文件的讀取，這個包中的open()函數可以指定編碼的類型：

import codecs 
f = codecs.open('text.text','r+',encoding='utf-8')#必須事先知道文件的編碼格式，這里文件編碼是使用的utf-8 
content = f.read()#如果open時使用的encoding和文件本身的encoding不一致的話，那么這里將將會產生錯誤 
f.write('你想要寫入的信息') 
f.close()

以上這篇Python3 中文文件讀寫方法就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Tensorflow中的dropout的使用方法
這篇文章主要介紹了Tensorflow中的dropout的使用方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-03-03
Python中的Sequence類型使用實例
這篇文章主要為大家介紹了Python中的Sequence類型使用實例，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-12-12
Python統(tǒng)計日志中每個IP出現次數的方法
這篇文章主要介紹了Python統(tǒng)計日志中每個IP出現次數的方法,實例分析了Python基于正則表達式解析日志文件的相關技巧,需要的朋友可以參考下
2015-07-07
Python?isdigit()函數判斷字符串是否全都是數字字符示例
這篇文章主要為大家介紹了Python判斷字符串是否全都是數字字符示例,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
2024-01-01
python中networkx函數的具體使用
本文主要介紹了python中networkx函數的具體使用，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2023-02-02
python中tkinter實現GUI程序三個實例教程
Python提供了多個GUI庫,使開發(fā)人員能夠輕松創(chuàng)建各種交互式界面,這篇文章主要給大家介紹了關于python中tkinter實現GUI程序的三個實例教程,文中通過代碼介紹的非常詳細,需要的朋友可以參考下
2024-05-05
PyCharm導入numpy庫的幾種方式
今天給大家?guī)淼氖顷P于Python的相關知識,文章圍繞著PyCharm導入numpy庫的幾種方式展開,文中有非常詳細的解釋及代碼示例,需要的朋友可以參考下
2021-06-06
python翻譯軟件實現代碼(使用google api完成)
這篇文章主要介紹了python結合google api完成的翻譯軟件實現代碼，大家參考使用
2013-11-11
Python不要再使用while死循環(huán),定時器代替效果更佳
在python開發(fā)的過程中，經常見到小伙伴直接使用while True的死循環(huán)+sleep的方式來保存程序的一直運行。這種方式雖然能達到效果，但是說不定什么時候就直接崩潰了，其實使用定時器效果也不錯哦
2023-03-03
基于Tensorflow:CPU性能分析
今天小編就為大家分享一篇基于Tensorflow:CPU性能分析，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-02-02