解決python subprocess參數(shù)shell=True踩到的坑
0x01 問(wèn)題現(xiàn)象
寫(xiě)的程序使用subprocess創(chuàng)建子進(jìn)程運(yùn)行其他程序,判斷其他程序運(yùn)行完后進(jìn)行處理。
在subprocess使用了shell=True,判斷用戶(hù)程序退出的代碼如下
while self.proc.poll() is None:
do_something
判斷子進(jìn)程是否運(yùn)行結(jié)束,程序在子進(jìn)程運(yùn)行結(jié)束后,代碼未向下繼續(xù)運(yùn)行,而是卡在了這個(gè)循環(huán)中。
0x02 原因分析
百度后對(duì)shell參數(shù)的解釋如下:
shell=True參數(shù)會(huì)讓subprocess.Popen接受字符串類(lèi)型的變量作為命令,并調(diào)用shell去執(zhí)行這個(gè)字符串,當(dāng)shell=False是,subprocess.Popen只接受數(shù)組變量作為命令,并將數(shù)組的第一個(gè)元素作為命令,剩下的全部作為該命令的參數(shù)。
通過(guò)查看服務(wù)器進(jìn)程可以看到,仍然有進(jìn)程存在,進(jìn)程如下

為shell中運(yùn)行的程序,由此可以得出,shell=true時(shí),子進(jìn)程在運(yùn)行完后,shell并沒(méi)有退出,而是卡在shell命令中,可由進(jìn)程看到。

補(bǔ)充:Python踩坑之旅其一殺不死的Shell子進(jìn)程
1.1 踩坑案例
踩坑的程序是個(gè)常駐的Agent類(lèi)管理進(jìn)程, 包括但不限于如下類(lèi)型的任務(wù)在執(zhí)行:
a. 多線(xiàn)程的網(wǎng)絡(luò)通信包處理
和控制Master節(jié)點(diǎn)交互
有固定Listen端口
b. 定期作業(yè)任務(wù), 通過(guò)subprocess.Pipe執(zhí)行shell命令
c. etc
發(fā)現(xiàn)坑的過(guò)程很有意思:
a.重啟Agent發(fā)現(xiàn)Port被占用了
=> 立刻想到可能進(jìn)程沒(méi)被殺死, 是不是停止腳本出問(wèn)題
=> 排除發(fā)現(xiàn)不是, Agent進(jìn)程確實(shí)死亡了
=> 通過(guò) netstat -tanop|grep port_number 發(fā)現(xiàn)端口確實(shí)有人占用
=> 調(diào)試環(huán)境, 直接殺掉占用進(jìn)程了之, 錯(cuò)失首次發(fā)現(xiàn)問(wèn)題的機(jī)會(huì)
b.問(wèn)題在一段時(shí)間后重現(xiàn), 重啟后Port還是被占用
定位問(wèn)題出現(xiàn)在一個(gè)叫做xxxxxx.sh的腳本, 該腳本占用了Agent使用的端口
=> 奇了怪了, 一個(gè)xxx.sh腳本使用這個(gè)奇葩Port干啥(大于60000的Port, 有興趣的磚友可以想下為什么Agent默認(rèn)使用6W+的端口)
=> review該腳本并沒(méi)有進(jìn)行端口監(jiān)聽(tīng)的代碼
一拍腦袋, c.進(jìn)程共享了父進(jìn)程資源了
=> 溯源該腳本,發(fā)現(xiàn)確實(shí)是Agent啟動(dòng)的任務(wù)中的腳本之一
=> 問(wèn)題基本定位, 該腳本屬于A(yíng)gent調(diào)用的腳本
=> 該Agent繼承了Agent原來(lái)的資源FD, 也就是這個(gè)port
=> 雖然該腳本由于超時(shí)被動(dòng)觸發(fā)了terminate機(jī)制, 但terminate并沒(méi)有干掉這個(gè)子進(jìn)程
=> 該腳本進(jìn)程的父進(jìn)程(ppid) 被重置為了1
d.問(wèn)題****出在腳本進(jìn)程超時(shí)kill邏輯
1.2 填坑解法
通過(guò)代碼review, 找到shell具體執(zhí)行的庫(kù)代碼如下:
self._subpro = subprocess.Popen(
cmd, shell=True, stdout=subprocess.PIPE,
stderr=subprocess.PIPE,
preexec_fn=_signal_handle
)
# 重點(diǎn)是shell=True !
把上述代碼改為:
self._subpro = subprocess.Popen(
cmd.split(), stdout=subprocess.PIPE,
stderr=subprocess.PIPE, preexec_fn=_signal_handle
)
# 重點(diǎn)是去掉了shell=True
1.3 坑位分析
Agent會(huì)在一個(gè)新創(chuàng)建的threading線(xiàn)程中執(zhí)行這段代碼, 如果線(xiàn)程執(zhí)行時(shí)間超時(shí)(xx seconds), 會(huì)調(diào)用 self._subpro.terminate()終止該腳本.
表面正常:
啟用新線(xiàn)程執(zhí)行該腳本
如果出現(xiàn)問(wèn)題,執(zhí)行超時(shí)防止hang住其他任務(wù)執(zhí)行調(diào)用terminate殺死進(jìn)程
深層問(wèn)題:
Python 2.7.x中subprocess.Pipe 如果shell=True, 會(huì)默認(rèn)把相關(guān)的pid設(shè)置為shell(sh/bash/etc)本身(執(zhí)行命令的shell父進(jìn)程), 并非執(zhí)行cmd任務(wù)的那個(gè)進(jìn)程
子進(jìn)程由于會(huì)復(fù)制父進(jìn)程的opened FD表, 導(dǎo)致即使被殺死, 依然保留了擁有這個(gè)Listened Port FD
這樣雖然殺死了shell進(jìn)程(未必死亡, 可能進(jìn)入defunct狀態(tài)), 但實(shí)際的執(zhí)行進(jìn)程確活著. 于是1.1中的坑就被結(jié)實(shí)的踩上了.
1.4 坑后擴(kuò)展
1.4.1 擴(kuò)展知識(shí)
本節(jié)擴(kuò)展知識(shí)包括二個(gè)部分:
Linux系統(tǒng)中, 子進(jìn)程一般會(huì)繼承父進(jìn)程的哪些信息
Agent這種常駐進(jìn)程選擇>60000端口的意義
擴(kuò)展知識(shí)留到下篇末尾講述, 感興趣的可以自行搜索
1.4.1 技術(shù)關(guān)鍵字
Linux系統(tǒng)進(jìn)程
Linux隨機(jī)端口選擇
程序多線(xiàn)程執(zhí)行
Shell執(zhí)行
1.5 填坑總結(jié)
1.子進(jìn)程會(huì)繼承父進(jìn)程的資源信息
2.如果只kill某進(jìn)程的父進(jìn)程, 集成了父進(jìn)程資源的子進(jìn)程會(huì)繼續(xù)占用父進(jìn)程的資源不釋放, 包括但不限于
listened port
opened fd
etc
3.Python Popen使用上, shell的bool狀態(tài)決定了進(jìn)程kill的邏輯, 需要根據(jù)場(chǎng)景選擇使用方式
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
python 遞歸遍歷文件夾,并打印滿(mǎn)足條件的文件路徑實(shí)例
下面小編就為大家?guī)?lái)一篇python 遞歸遍歷文件夾,并打印滿(mǎn)足條件的文件路徑實(shí)例。小編覺(jué)得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧2017-08-08
一文教會(huì)你用python連接并簡(jiǎn)單操作SQLserver數(shù)據(jù)庫(kù)
最近要將數(shù)據(jù)寫(xiě)到數(shù)據(jù)庫(kù)里,學(xué)習(xí)了一下如何用Python來(lái)操作SQLServer數(shù)據(jù)庫(kù),下面這篇文章主要給大家介紹了關(guān)于用python連接并簡(jiǎn)單操作SQLserver數(shù)據(jù)庫(kù)的相關(guān)資料,需要的朋友可以參考下2022-09-09
使用Pytorch+PyG實(shí)現(xiàn)MLP的詳細(xì)過(guò)程
圖神經(jīng)網(wǎng)絡(luò)是最近 AI 領(lǐng)域最熱門(mén)的方向之一,下面這篇文章主要給大家介紹了關(guān)于使用Pytorch+PyG實(shí)現(xiàn)MLP的詳細(xì)過(guò)程,文中通過(guò)實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2023-03-03
python中如何利用matplotlib畫(huà)多個(gè)并列的柱狀圖
python是一個(gè)很有趣的語(yǔ)言,可以在命令行窗口運(yùn)行,下面這篇文章主要給大家介紹了關(guān)于python中如何利用matplotlib畫(huà)多個(gè)并列的柱狀圖的相關(guān)資料,需要的朋友可以參考下2022-01-01
如何將Python代碼轉(zhuǎn)化為可執(zhí)行的程序
在Python中,將代碼轉(zhuǎn)成可以執(zhí)行的程序需要安裝庫(kù)pyinstaller,如果是Windows用戶(hù),打開(kāi)Anaconda?Prompt輸入相對(duì)應(yīng)代碼,下面小編給大家詳細(xì)講解如何將Python代碼轉(zhuǎn)化為可執(zhí)行的程序,感興趣的朋友一起看看吧2024-03-03
python時(shí)間日期函數(shù)與利用pandas進(jìn)行時(shí)間序列處理詳解
python標(biāo)準(zhǔn)庫(kù)包含于日期(date)和時(shí)間(time)數(shù)據(jù)的數(shù)據(jù)類(lèi)型,datetime、time以及calendar模塊會(huì)被經(jīng)常用到,而pandas則可以對(duì)時(shí)間進(jìn)行序列化排序2018-03-03
python 將md5轉(zhuǎn)為16字節(jié)的方法
今天小編就為大家分享一篇python 將md5轉(zhuǎn)為16字節(jié)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-05-05
Python網(wǎng)絡(luò)爬蟲(chóng)項(xiàng)目:內(nèi)容提取器的定義
本篇文章主要介紹了Python網(wǎng)絡(luò)爬蟲(chóng)項(xiàng)目,這能有效的節(jié)省程序員的時(shí)間,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下。2016-10-10
這可能是最好玩的python GUI入門(mén)實(shí)例(推薦)
這篇文章主要介紹了這可能是最好玩的python GUI入門(mén)實(shí)例,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-07-07

