Python中的zipfile模塊使用詳解
zip文件格式是通用的文檔壓縮標(biāo)準(zhǔn),在ziplib模塊中,使用ZipFile類來操作zip文件,下面具體介紹一下:
class zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
創(chuàng)建一個ZipFile對象,表示一個zip文件。參數(shù)file表示文件的路徑或類文件對象(file-like object);參數(shù)mode指示打開zip文件的模式,默認(rèn)值為'r',表示讀已經(jīng)存在的zip文件,也可以為'w'或'a','w'表示新建一個zip文檔或覆蓋一個已經(jīng)存在的zip文檔,'a'表示將數(shù)據(jù)附加到一個現(xiàn)存的zip文檔中。參數(shù)compression表示在寫zip文檔時使用的壓縮方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。如果要操作的zip文件大小超過2G,應(yīng)該將allowZip64設(shè)置為True。
ZipFile還提供了如下常用的方法和屬性:
ZipFile.getinfo(name):
獲取zip文檔內(nèi)指定文件的信息。返回一個zipfile.ZipInfo對象,它包括文件的詳細(xì)信息。將在下面 具體介紹該對象。
ZipFile.infolist()
獲取zip文檔內(nèi)所有文件的信息,返回一個zipfile.ZipInfo的列表。
ZipFile.namelist()
獲取zip文檔內(nèi)所有文件的名稱列表。
ZipFile.extract(member[, path[, pwd]])
將zip文檔內(nèi)的指定文件解壓到當(dāng)前目錄。參數(shù)member指定要解壓的文件名稱或?qū)?yīng)的ZipInfo對象;參數(shù)path指定了解析文件保存的文件夾;參數(shù)pwd為解壓密碼。下面一個例子將保存在程序根目錄下的txt.zip內(nèi)的所有文件解壓到D:/Work目錄:
import zipfile, os zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'txt.zip')) for file in zipFile.namelist(): zipFile.extract(file, r'd:/Work') zipFile.close() ZipFile.extractall([path[, members[, pwd]]])
解壓zip文檔中的所有文件到當(dāng)前目錄。參數(shù)members的默認(rèn)值為zip文檔內(nèi)的所有文件名稱列表,也可以自己設(shè)置,選擇要解壓的文件名稱。
ZipFile.printdir()
將zip文檔內(nèi)的信息打印到控制臺上。
ZipFile.setpassword(pwd)
設(shè)置zip文檔的密碼。
ZipFile.read(name[, pwd])
獲取zip文檔內(nèi)指定文件的二進(jìn)制數(shù)據(jù)。下面的例子演示了read()的使用,zip文檔內(nèi)包括一個txt.txt的文本文件,使用read()方法讀取其二進(jìn)制數(shù)據(jù),然后保存到D:/txt.txt。
#coding=gbk
import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'txt.zip'))
data = zipFile.read('txt.txt')
(lambda f, d: (f.write(d), f.close()))(open(r'd:/txt.txt', 'wb'), data)
#一行語句就完成了寫文件操作。仔細(xì)琢磨哦~_~
zipFile.close()
ZipFile.write(filename[, arcname[, compress_type]])
將指定文件添加到zip文檔中。filename為文件路徑,arcname為添加到zip文檔之后保存的名稱, 參數(shù)compress_type表示壓縮方法,它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。下面的例子演示了如何創(chuàng)建一個zip文檔,并將文件D:/test.doc添加到壓縮文檔中。
import zipfile, os zipFile = zipfile.ZipFile(r'D:/test.zip'), 'w') zipFile.write(r'D:/test.doc', 'ok.doc', zipfile.ZIP_DEFLATED) zipFile.close() ZipFile.writestr(zinfo_or_arcname, bytes)
writestr()支持將二進(jìn)制數(shù)據(jù)直接寫入到壓縮文檔。
Class ZipInfo
ZipFile.getinfo(name) 方法返回的是一個ZipInfo對象,表示zip文檔中相應(yīng)文件的信息。它支持如下屬性:
- ZipInfo.filename: 獲取文件名稱。
- ZipInfo.date_time: 獲取文件最后修改時間。返回一個包含6個元素的元組:(年, 月, 日, 時, 分, 秒)
- ZipInfo.compress_type: 壓縮類型。
- ZipInfo.comment: 文檔說明。
- ZipInfo.extr: 擴(kuò)展項數(shù)據(jù)。
- ZipInfo.create_system: 獲取創(chuàng)建該zip文檔的系統(tǒng)。
- ZipInfo.create_version: 獲取 創(chuàng)建zip文檔的PKZIP版本。
- ZipInfo.extract_version: 獲取 解壓zip文檔所需的PKZIP版本。
- ZipInfo.reserved: 預(yù)留字段,當(dāng)前實現(xiàn)總是返回0。
- ZipInfo.flag_bits: zip標(biāo)志位。
- ZipInfo.volume: 文件頭的卷標(biāo)。
- ZipInfo.internal_attr: 內(nèi)部屬性。
- ZipInfo.external_attr: 外部屬性。
- ZipInfo.header_offset: 文件頭偏移位。
- ZipInfo.CRC: 未壓縮文件的CRC-32。
- ZipInfo.compress_size: 獲取壓縮后的大小。
- ZipInfo.file_size: 獲取未壓縮的文件大小。
下面一個簡單的例子說明這些屬性的意思:
import zipfile, os
zipFile = zipfile.ZipFile(os.path.join(os.getcwd(), 'txt.zip'))
zipInfo = zipFile.getinfo('doc.doc')
print 'filename:', zipInfo.filename
print 'date_time:', zipInfo.date_time
print 'compress_type:', zipInfo.compress_type
print 'comment:', zipInfo.comment
print 'extra:', zipInfo.extra
print 'create_system:', zipInfo.create_system
print 'create_version:', zipInfo.create_version
print 'extract_version:', zipInfo.extract_version
print 'extract_version:', zipInfo.reserved
print 'flag_bits:', zipInfo.flag_bits
print 'volume:', zipInfo.volume
print 'internal_attr:', zipInfo.internal_attr
print 'external_attr:', zipInfo.external_attr
print 'header_offset:', zipInfo.header_offset
print 'CRC:', zipInfo.CRC
print 'compress_size:', zipInfo.compress_size
print 'file_size:', zipInfo.file_size
zipFile.close()
感覺使用zipfile模塊來處理zip文件真的很簡單。想當(dāng)初在.NET平臺下,使用sharpziplib壓縮、解壓一個文件,我花了N多時間,找了N多英文資源,才寫出一個能壓縮文件的demo。而現(xiàn)在使用Python,通過閱讀python手冊,一兩個小時就掌握了zipfile模塊的基本使用。哈哈,使用Python,真爽!
相關(guān)文章
Python 圖片轉(zhuǎn)數(shù)組,二進(jìn)制互轉(zhuǎn)操作
這篇文章主要介紹了Python 圖片轉(zhuǎn)數(shù)組,二進(jìn)制互轉(zhuǎn)操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-03-03
python圖像填充與裁剪/resize的實現(xiàn)代碼
這篇文章主要介紹了python圖像填充與裁剪/resize,本文通過示例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-08-08
python學(xué)習(xí)之subprocess模塊詳解
這篇文章主要介紹了python學(xué)習(xí)之subprocess模塊的相關(guān)資料,該模塊用于創(chuàng)建子進(jìn)程并與其進(jìn)行交互,它提供了多個函數(shù)和類來執(zhí)行操作系統(tǒng)命令、獲取命令輸出以及管理子進(jìn)程的生命周期,需要的朋友可以參考下2024-12-12
使用Python將Markdown格式轉(zhuǎn)為EPUB電子書格式的代碼實現(xiàn)
我們每天都會接觸到大量的文本內(nèi)容,無論是收藏的技術(shù)文檔、自己撰寫的筆記,還是網(wǎng)絡(luò)上的優(yōu)質(zhì)文章,都可能面臨閱讀體驗不佳的問題,所以本文給大家介紹了使用Python將Markdown格式轉(zhuǎn)為EPUB電子書格式的實現(xiàn)方法,需要的朋友可以參考下2025-04-04
Python網(wǎng)絡(luò)編程之xmlrpc模塊
這篇文章介紹了Python網(wǎng)絡(luò)編程之xmlrpc模塊,文中通過示例代碼介紹的非常詳細(xì)。對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2022-05-05
Python實現(xiàn)讀取.nc數(shù)據(jù)并提取指定時間與經(jīng)緯度維度對應(yīng)的變量數(shù)值
這篇文章主要為大家詳細(xì)介紹了如何使用Python語言的netCDF4庫實現(xiàn)讀取.nc格式的數(shù)據(jù)文件,并提取指定維(時間、經(jīng)度與緯度)下的變量數(shù)據(jù),需要的可以了解下2024-02-02
詳解Python中生成隨機(jī)數(shù)據(jù)的示例詳解
在日常工作編程中存在著各種隨機(jī)事件,同樣在編程中生成隨機(jī)數(shù)字的時候也是一樣。每當(dāng)在?Python?中生成隨機(jī)數(shù)據(jù)、字符串或數(shù)字時,最好至少大致了解這些數(shù)據(jù)是如何生成的。所以本文將詳細(xì)為大家講解一下Python是如何生成隨機(jī)數(shù)據(jù),需要的可以參考一下2022-04-04

