Python?讀取?.gz?文件全過程
Python 讀取 .gz 文件
讀取.gz 文件需要使用gzip 包,如果沒有安裝可以自行在終端安裝
pip install gzip
import gzip path = "" #你的文件路徑 f = gzip.open(path, 'rb') ? for line in f.readlines(): # 按行進(jìn)行讀取 ? ? s = line.decode() # 讀取之后要進(jìn)行解碼 ? ? print(s) # s 為string類型,就是我們讀取的文件中的一行
也可以批量讀取,批量讀取文件使用os包對文件夾中的所有文件進(jìn)行
import gzip import os\ ? path = "" #表示你要打開的文件夾 files = os.listdir(path) #files 是path中存放的所有文件名集合 for file in files: ? ? f = gzip.open(path+file, 'rb') ? ? for line in f.readline(): ? ? ? ? print(line)
Python 讀取gz文件,字符串與字節(jié)串的相互轉(zhuǎn)換
首先是字節(jié)串轉(zhuǎn)字符串,也就是str:
b = b'some byte array' ? str(b, encoding = "utf-8") ? #or bytes.decode(b)
然后是字符串轉(zhuǎn)為字節(jié)串:
s = 'some string' ? bytes(s, encoding = "utf8") ? #or str.encode(s)
fastq.gz文件讀取
with gzip.open(fq,'r') as fastq: ?? ?try: ?? ??? ?while True: ?? ??? ??? ?line1 = next(fastq).decode() ?# 字節(jié)轉(zhuǎn)字符串 ?? ??? ??? ?line2 = next(fastq).decode() ?? ??? ??? ?line3 = next(fastq).decode() ?? ??? ??? ?line4 = next(fastq).decode() ?? ??? ??? ? ?? ?except: ?? ??? ??? ?pass
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
python人工智能tensorflow構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)RNN
這篇文章主要為大家介紹了python人工智能tensorflow構(gòu)建循環(huán)神經(jīng)網(wǎng)絡(luò)RNN,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05
Python+Pygame實戰(zhàn)之炫舞小游戲的實現(xiàn)
提到QQ炫舞,可能很多人想到的第一個詞是“青春”?;腥婚g,這個承載了無數(shù)人回憶與時光的游戲品牌,已經(jīng)走到了第十幾個年頭。今天小編就來給大家嘗試做一款簡單的簡陋版的小游戲——《舞動青春*炫舞》,感興趣的可以了解一下2022-12-12
使用Python對微信好友進(jìn)行數(shù)據(jù)分析
這篇文章主要介紹了使用Python對微信好友進(jìn)行數(shù)據(jù)分析的實現(xiàn)代碼,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下2018-06-06
Python Dask庫處理大規(guī)模數(shù)據(jù)集的強(qiáng)大功能實戰(zhàn)
Dask是一個靈活、開源的Python庫,專為處理大規(guī)模數(shù)據(jù)集而設(shè)計,與傳統(tǒng)的單機(jī)計算相比,Dask能夠在分布式系統(tǒng)上運(yùn)行,有效利用集群的計算資源,本文將深入介紹Dask的核心概念、功能和實際應(yīng)用,通過豐富的示例代碼展示其在大數(shù)據(jù)處理領(lǐng)域的強(qiáng)大能力2023-12-12
Python 管理依賴包工具pip, virtualenv詳解
管理依賴包是Python開發(fā)中不可或缺的一部分,通過pip、virtualenv和pipenv等工具,我們可以有效地管理包和虛擬環(huán)境,確保項目的可移植性和一致性,這篇文章主要介紹了Python 管理依賴包(pip, virtualenv),需要的朋友可以參考下2024-07-07

