解決Python復雜zip文件的解壓問題

廢話不多說,直接看問題,使用過?Python?中的標準庫?zipfile?解壓過?zip?格式壓縮包的朋友們,可能遇到過,當壓縮文件中的目錄或文件名中包含中文等常見?unicode?字符時,典型如下面的例子:

使用?zipfile?的?extract()?或?extractall()?方法直接解壓時,產(chǎn)生的解壓結(jié)果名充斥著亂碼,這一點我們通過調(diào)用?namelist()?方法就可以看出來:
from zipfile import ZipFile
# 讀入壓縮包文件
file = ZipFile('示例壓縮包.zip')
# 查看壓縮包內(nèi)目錄、文件名稱
file.namelist()

這是因為?zipfile?中針對壓縮包內(nèi)容的編碼兼容性差,但我們可以通過下面的函數(shù)自行矯正:
def recode(raw: str) -> str:
'''
編碼修正
'''
try:
return raw.encode('cp437').decode('gbk')
except:
return raw.encode('utf-8').decode('utf-8')
for file_or_path in file.namelist():
print(file_or_path, ' -------> ' , recode(file_or_path))

解決了文件名亂碼的問題后,接下來我們就可以配合?shutil?與?os?標準庫中的相關(guān)功能,實現(xiàn)將指定任意?zip?壓縮包,完好地解壓到指定的目錄中,代碼如下:
def zip_extract_all(src_zip_file: ZipFile, target_path: str) -> None:
# 遍歷壓縮包內(nèi)所有內(nèi)容
for file_or_path in file.namelist():
# 若當前節(jié)點是文件夾
if file_or_path.endswith('/'):
try:
# 基于當前文件夾節(jié)點創(chuàng)建多層文件夾
os.makedirs(os.path.join(target_path, recode(file_or_path)))
except FileExistsError:
# 若已存在則跳過創(chuàng)建過程
pass
# 否則視作文件進行寫出
else:
# 利用shutil.copyfileobj,從壓縮包io流中提取目標文件內(nèi)容寫出到目標路徑
with open(os.path.join(target_path, recode(file_or_path)), 'wb') as z:
# 這里基于Zipfile.open()提取文件內(nèi)容時需要使用原始的亂碼文件名
shutil.copyfileobj(src_zip_file.open(file_or_path), z)
# 向已存在的指定文件夾完整解壓當前讀入的zip文件
zip_extract_all(file, '解壓測試')
可以看到,效果完美 :

到此這篇關(guān)于Python復雜zip文件的解壓的文章就介紹到這了,更多相關(guān)Python zip文件的解壓內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Pycharm中運行程序在Python?console中執(zhí)行,不是直接Run問題
這篇文章主要介紹了Pycharm中運行程序在Python?console中執(zhí)行,不是直接Run問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-07-07
Python使用try except處理程序異常的三種常用方法分析
這篇文章主要介紹了Python使用try except處理程序異常的三種常用方法,結(jié)合實例形式分析了Python基于try except語句針對異常的捕獲、查看、回溯等相關(guān)操作技巧,需要的朋友可以參考下2018-09-09
基于Python數(shù)據(jù)可視化利器Matplotlib,繪圖入門篇,Pyplot詳解
下面小編就為大家?guī)硪黄赑ython數(shù)據(jù)可視化利器Matplotlib,繪圖入門篇,Pyplot詳解。小編覺得挺不錯的,現(xiàn)在就分享給大家,也給大家做個參考。一起跟隨小編過來看看吧2017-10-10

