python3爬蟲GIL修改多線程實(shí)例講解
我們打開程序后,會(huì)發(fā)現(xiàn)電腦的內(nèi)存和cpu發(fā)生了變化。在對(duì)于前者上面,自然是希望內(nèi)容占用小,cpu的利用越高越好。那有沒有什么方法可以讓我們的cpu達(dá)到滿狀態(tài)的運(yùn)行效果呢?這就得用到我們所學(xué)的多線程中的知識(shí)了,再正式開始講解之前,我們先來說說操作的思路吧,然后進(jìn)行代碼對(duì)比。
我們都知道,比方我有一個(gè)4核的CPU,那么這樣一來,在單位時(shí)間內(nèi)每個(gè)核只能跑一個(gè)線程,然后時(shí)間片輪轉(zhuǎn)切換。但是Python不一樣,它不管你有幾個(gè)核,單位時(shí)間多個(gè)核只能跑一個(gè)線程,然后時(shí)間片輪轉(zhuǎn)。看起來很不可思議?但是這就是GIL搞的鬼。任何Python線程執(zhí)行前,必須先獲得GIL鎖,然后,每執(zhí)行100條字節(jié)碼,解釋器就自動(dòng)釋放GIL鎖,讓別的線程有機(jī)會(huì)執(zhí)行。這個(gè)GIL全局鎖實(shí)際上把所有線程的執(zhí)行代碼都給上了鎖,所以,多線程在Python中只能交替執(zhí)行,即使100個(gè)線程跑在100核CPU上,也只能用到1個(gè)核。通常我們用的解釋器是官方實(shí)現(xiàn)的CPython,要真正利用多核,除非重寫一個(gè)不帶GIL的解釋器。我們不妨做個(gè)試驗(yàn):
#coding=utf-8
from multiprocessing import Pool
from threading import Thread
from multiprocessing import Process
def loop():
while True:
pass
if __name__ == '__main__':
for i in range(3):
t = Thread(target=loop)
t.start()
while True:
pass
我的電腦是4核,所以我開了4個(gè)線程,看一下CPU資源占有率:
我們發(fā)現(xiàn)CPU利用率并沒有占滿,大致相當(dāng)于單核水平。
而如果我們變成進(jìn)程呢?
我們改一下代碼:
#coding=utf-8
from multiprocessing import Pool
from threading import Thread
from multiprocessing import Process
def loop():
while True:
pass
if __name__ == '__main__':
for i in range(3):
t = Process(target=loop)
t.start()
Pass

結(jié)果直接飆到了100%,說明進(jìn)程是可以利用多核的!
以上就是python3爬蟲GIL修改多線程實(shí)例講解的詳細(xì)內(nèi)容,更多關(guān)于python3爬蟲中的GIL修改多線程的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
入門tensorflow教程之TensorBoard可視化模型訓(xùn)練
在本篇文章中,主要介紹 了TensorBoard 的基礎(chǔ)知識(shí),并了解如何可視化訓(xùn)練模型中的一些基本信息,希望對(duì)大家的TensorBoard可視化模型訓(xùn)練有所幫助2021-08-08
python學(xué)習(xí)之whl文件解釋與安裝詳解
whl格式本質(zhì)上是一個(gè)壓縮包,里面包含了py文件,以及經(jīng)過編譯的pyd文件,下面這篇文章主要給大家介紹了關(guān)于python學(xué)習(xí)之whl文件解釋與安裝的相關(guān)資料,文中通過實(shí)例代碼介紹的非常詳細(xì),需要的朋友可以參考下2022-09-09
Python發(fā)送form-data請(qǐng)求及拼接form-data內(nèi)容的方法
這篇文章主要介紹了Python發(fā)送form-data請(qǐng)求及拼接form-data內(nèi)容的方法,文中采用的是requests的方式發(fā)送multipart/form-data請(qǐng)求,需要的朋友可以參考下2016-03-03

