深入淺析python定時(shí)殺進(jìn)程
之前寫了個(gè)python腳本用selenium+phantomjs爬新帖子,在循環(huán)拉取頁面的過程中,phantomjs總是block住,使用WebDriverWait設(shè)置最長(zhǎng)等待時(shí)間無效。用firefox替換phantomjs無改善
因?yàn)檫@個(gè)腳本不會(huì)長(zhǎng)期使用,因此采取臨時(shí)辦法,新開一個(gè)子線程固定周期殺死phantomjs進(jìn)程,這樣selenium就會(huì)在block最多不超過此周期后返回。當(dāng)然在爬蟲腳本中做一些微調(diào)防止部分url被跳過
定時(shí)執(zhí)行任務(wù)采用sched模塊,很多人將其與crontab相提并論
殺死特定進(jìn)程的命令
kill -9 pid命令可以無條件終止對(duì)應(yīng)pid進(jìn)程
獲取名為phantomjs的進(jìn)程pid
ps命令列出進(jìn)程信息
grep過濾得指定名字的進(jìn)程信息
awk '{print $2}'提取第二列pid信息
最終命令為:kill -9 `ps -aux|grep phantomjs|awk '{print $2}'`
python可以用os.system()執(zhí)行shell命令
使用sched模塊周期執(zhí)行任務(wù)
sched模塊使用heapq保存event隊(duì)列,其event為namedtuple類型
sched需要提供兩個(gè)函數(shù),一個(gè)用來獲取時(shí)間變化,一個(gè)用于等待一段時(shí)間,可自定義
基本API
sched.scheduler(time_func, sleep_func) 函數(shù)返回一個(gè)scheduler對(duì)象,timefunc是一個(gè)返回?cái)?shù)字的計(jì)時(shí)函數(shù),而sleepfunc可接受此數(shù)字參數(shù),并延時(shí)相應(yīng)時(shí)間
scheduler.enter(delay, priority, action, argument)在delay時(shí)間段后,用參數(shù)argument調(diào)用action, argument必須是一個(gè)tuple。若要在固定時(shí)刻運(yùn)行,則應(yīng)調(diào)用scheduler.enterabs
scheduler.cancel(event)取消定時(shí)任務(wù)。event為enter函數(shù)返回值
scheduler.run()開始執(zhí)行
任務(wù)時(shí)間重疊
在執(zhí)行任務(wù)時(shí)有可能要block一段時(shí)間,任務(wù)返回后可能已經(jīng)超過下一個(gè)任務(wù)的定時(shí)時(shí)刻,這種情況下會(huì)立刻執(zhí)行下一個(gè)任務(wù),而不會(huì)跳過
周期執(zhí)行
類似于遞歸調(diào)用,寫一個(gè)wrapper function,在任務(wù)里面再次定時(shí)下一次任務(wù)即可
def wrapper(func, delay): scheduler.enter(delay, 0, wrapper, (func, delay)) func()
最終代碼
import os, time, sched
schedule = sched.scheduler(time.time, time.sleep)
cmd = '''kill -9 `ps -aux|grep phantomjs|awk '{print $2}'`
'''
def recycle_eval(c, inc):
schedule.enter(inc, 0, recycle_eval, (c, inc))
os.system(c)
print time.ctime(),'phantomjs killed'
if __name__ == '__main__':
inc = 180
schedule.enter(inc, 0, recycle_eval, (cmd, inc))
schedule.run()
以上所述是小編給大家介紹的python定時(shí)殺進(jìn)程的相關(guān)知識(shí),希望能夠幫助到大家!
- python 判斷一個(gè)進(jìn)程是否存在
- linux系統(tǒng)使用python監(jiān)控apache服務(wù)器進(jìn)程腳本分享
- 使用python 獲取進(jìn)程pid號(hào)的方法
- 使用Python的Supervisor進(jìn)行進(jìn)程監(jiān)控以及自動(dòng)啟動(dòng)
- 淺析Python中的多進(jìn)程與多線程的使用
- python關(guān)閉windows進(jìn)程的方法
- python開啟多個(gè)子進(jìn)程并行運(yùn)行的方法
- 探究Python多進(jìn)程編程下線程之間變量的共享問題
- Python語言實(shí)現(xiàn)獲取主機(jī)名根據(jù)端口殺死進(jìn)程
相關(guān)文章
PyTorch搭建CNN實(shí)現(xiàn)風(fēng)速預(yù)測(cè)
PyTorch是一個(gè)開源的Python機(jī)器學(xué)習(xí)庫,基于Torch,用于自然語言處理等應(yīng)用程序。它不僅能夠?qū)崿F(xiàn)強(qiáng)大的GPU加速,同時(shí)還支持動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)。本文將介紹PyTorch搭建CNN如何實(shí)現(xiàn)風(fēng)速預(yù)測(cè),感興趣的可以學(xué)習(xí)一下2021-12-12
詳解在Anaconda環(huán)境下Python安裝pydot與graphviz的方法
這篇文章主要為大家詳細(xì)介紹了在Anaconda環(huán)境中,安裝Python語言pydot與graphviz兩個(gè)模塊的方法,文中的安裝方法講解詳細(xì),感興趣?的可以了解一下2023-02-02
Python編程中對(duì)文件和存儲(chǔ)器的讀寫示例
這篇文章主要介紹了Python編程中對(duì)文件和存儲(chǔ)器的讀寫示例,包括使用cPickle儲(chǔ)存器存儲(chǔ)對(duì)象的例子,需要的朋友可以參考下2016-01-01
python爬蟲基礎(chǔ)教程:requests庫(二)代碼實(shí)例
這篇文章主要介紹了python爬蟲基礎(chǔ)教程:requests庫(二),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-04-04
python 模擬貸款卡號(hào)生成規(guī)則過程解析
這篇文章主要介紹了python 模擬貸款卡號(hào)生成規(guī)則過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08

