Python fileinput模塊應(yīng)用詳解
一、簡(jiǎn)介
說(shuō)到fileinput,可能90%的碼農(nóng)表示沒(méi)用過(guò),甚至沒(méi)有聽(tīng)說(shuō)過(guò)。
這不奇怪,因?yàn)樵趐ython界,既然open可以走天下,何必要fileinput呢?。
其為open方法的高級(jí)封裝:
fileinput模塊可以對(duì)一個(gè)或多個(gè)文件中的內(nèi)容進(jìn)行迭代、遍歷等操作。
該模塊的input()函數(shù)有點(diǎn)類似文件readlines()方法,區(qū)別在于:
前者是一個(gè)迭代對(duì)象,即每次只生成一行,需要用for循環(huán)迭代。
后者是一次性讀取所有行。在碰到大文件的讀取時(shí),前者無(wú)疑效率更高效。
用fileinput對(duì)文件進(jìn)行循環(huán)遍歷,格式化輸出,查找、替換等操作,非常方便。
二、常用函數(shù)
1、描述
fileinput.input() # 進(jìn)行讀取文件對(duì)象的初始化,返回能夠用于for循環(huán)遍歷的對(duì)象
# return FileInput(files, inplace, backup, mode=mode, openhook=openhook)
fileinput.filename() # 返回當(dāng)前文件的名稱
# return fileInput.filename()
fileinput.lineno() # 返回當(dāng)前已經(jīng)讀取的行的數(shù)量(或者序號(hào))
# return fileInput.lineno()
fileinput.filelineno() # 返回當(dāng)前讀取的行的行號(hào)
# return fileInput.filelineno()
fileinput.isfirstline() # 檢查當(dāng)前行是否是文件的第一行
# return fileInput.isfirstline()
fileinput.isstdin() # 判斷最后一行是否從stdin中讀取
# return fileInput.isstdin()
fileinput.close() # 關(guān)閉隊(duì)列,也是關(guān)閉文件
fileinput.nextfile() # 關(guān)閉當(dāng)前文件以使下次迭代將從下一個(gè)文件(如果存在)讀取第一行;不是從該文件讀取的行將不會(huì)被計(jì)入累計(jì)行數(shù)。直到下一個(gè)文件的第一行被讀取之后文件名才會(huì)改變。
# —>在第一行被讀取之前,此函數(shù)將不會(huì)生效;它不能被用來(lái)跳過(guò)第一個(gè)文件。
# —>在最后一個(gè)文件的最后一行被讀取之后,此函數(shù)將不再生效。
2、第一個(gè)程序
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__email__ = "liu.zhong.kun@foxmail.com"
import fileinput
# 典型用法
for line in fileinput.input(): # 如果input函數(shù)里面不傳入?yún)?shù),則,我們需要從命令行傳入文件路徑
print(line)
python demo02.py 1.txt 2.txt
三、函數(shù)參數(shù)
1、參數(shù)
我們使用input方法打開(kāi)文件
fileinput.input(files=None, inplace=False, backup="", bufsize=0, *, mode="r", openhook=None)
參數(shù):
files:默認(rèn)是stdin方式 ,傳入要打開(kāi)的文件,可以傳入一個(gè)文件列表,打開(kāi)多個(gè)文件inplace:是否將標(biāo)準(zhǔn)輸出的結(jié)果寫回文件,默認(rèn)不取代backup:備份文件的擴(kuò)展名,只指定擴(kuò)展名,如.bak。如果該文件的備份文件已存在,則會(huì)自動(dòng)覆蓋。bufsize:緩沖區(qū)大小,默認(rèn)為0,如果文件很大,可以修改此參數(shù),一般默認(rèn)即可mode: 讀寫模式,默認(rèn)為只讀openhook:鉤子函數(shù), 該鉤子用于控制打開(kāi)的所有文件,比如說(shuō)編碼方式等,返回一個(gè)文件對(duì)象
2、批量處理
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__email__ = "liu.zhong.kun@foxmail.com"
import fileinput
from glob import glob # 使用正則匹配文件
with fileinput.input(files=glob("*.txt"), openhook=fileinput.hook_encoded("utf-8")) as f: # 讀取當(dāng)前目錄下,所有的txt文件
for line in f:
print(f"{fileinput.filename()} -> {line.strip()} | 第{fileinput.filelineno()}行 | 共讀取{fileinput.lineno()}行")3、修改備份
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__email__ = "liu.zhong.kun@foxmail.com"
import fileinput
from glob import glob # 使用正則匹配文件
with fileinput.input(files=glob("*.txt"), inplace=True, backup=".bak") as f: # 讀取當(dāng)前目錄下,所有的txt文件,同時(shí)新建一個(gè)備份文件文件,可以不新建備份文件
for line in f:
print(f"{fileinput.filename()} -> {line.strip()} | 第{fileinput.filelineno()}行 | 共讀取{fileinput.lineno()}行") # 在for循環(huán)里面的print內(nèi)容不會(huì)輸出到控制臺(tái)上,而是直接輸出到文件對(duì)應(yīng)的行里面四、鉤子函數(shù)
在 fileinput.input() 中有一個(gè) openhook 的參數(shù),它支持用戶傳入自定義的對(duì)象讀取方法;
如果沒(méi)有傳入任何勾子,fileinput 默認(rèn)使用的是 open 函數(shù)
1、內(nèi)置函數(shù)
fileinput 內(nèi)置了兩種勾子
fileinput.hook_compressed(filename, mode)
使用 gzip 和 bz2 模塊透明地打開(kāi) gzip 和 bzip2 壓縮的文件(通過(guò)擴(kuò)展名 ‘.gz’ 和 ‘.bz2’ 來(lái)識(shí)別);
如果文件擴(kuò)展名不是 ‘.gz’ 或 ‘.bz2’,文件會(huì)以正常方式打開(kāi)(即使用 open() 并且不帶任何解壓操作);
使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_compressed)
fileinput.hook_encoded(encoding, errors=None)
返回一個(gè)通過(guò) open() 打開(kāi)每個(gè)文件的鉤子,使用給定的 encoding 和 errors 來(lái)讀取文件。
使用示例: fi = fileinput.FileInput(openhook=fileinput.hook_encoded(“utf-8”, “surrogateescape”))
2、自定義函數(shù)
我們定義一個(gè)鉤子函數(shù),來(lái)實(shí)現(xiàn)讀取網(wǎng)絡(luò)資源
#!/usr/bin/env python
# -*- coding: UTF-8 -*-
__author__ = "A.L.Kun"
__file__ = "demo02.py"
__email__ = "liu.zhong.kun@foxmail.com"
import fileinput
from glob import glob # 使用正則匹配文件
from io import StringIO
from requests import get
def getOnlineSource(url, *args, **kwargs):
resp = get(url)
resp.encoding = resp.apparent_encoding
return StringIO(resp.text) # 文件對(duì)象即為字符串流
with fileinput.input("http://www.baidu.com", openhook=getOnlineSource) as f: # 獲取對(duì)應(yīng)url中的資源,并輸出
for line in f:
print(line) # 輸出每一行內(nèi)容,即,等于是輸出io流中的所有內(nèi)偶然到此這篇關(guān)于Python fileinput庫(kù)應(yīng)用詳解的文章就介紹到這了,更多相關(guān)Python fileinput庫(kù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
pytorch .detach() .detach_() 和 .data用于切斷反向傳播的實(shí)現(xiàn)
這篇文章主要介紹了pytorch .detach() .detach_() 和 .data用于切斷反向傳播的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-12-12
python實(shí)現(xiàn)替換word中的關(guān)鍵文字(使用通配符)
今天小編就為大家分享一篇python實(shí)現(xiàn)替換word中的關(guān)鍵文字(使用通配符),具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02
詳解Django框架中用戶的登錄和退出的實(shí)現(xiàn)
這篇文章主要介紹了詳解Django框架中用戶的登錄和退出的實(shí)現(xiàn),Django是重多Python人氣框架中最為知名的一個(gè),需要的朋友可以參考下2015-07-07
Python 給下載文件顯示進(jìn)度條和下載時(shí)間的實(shí)現(xiàn)
這篇文章主要介紹了Python 給下載文件顯示進(jìn)度條和下載時(shí)間的代碼,本文通過(guò)實(shí)例代碼截圖相結(jié)合給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-04-04
使用Python快速進(jìn)行Excel合并的幾種場(chǎng)景
由于工作需要,客戶需要將多個(gè)excel文件合并成一個(gè)excel中,下面這篇文章主要給大家介紹了關(guān)于使用Python快速進(jìn)行Excel合并的幾種場(chǎng)景,文中通過(guò)代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-10-10

