python 如何用map()函數創(chuàng)建多線程任務

更新時間：2021年04月07日 15:33:08 作者：一只失業(yè)的小菜鳥

這篇文章主要介紹了python 使用map()函數創(chuàng)建多線程任務的操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

對于多線程的使用，我們經常是用thread來創(chuàng)建，比較繁瑣. 在Python中，可以使用map函數簡化代碼。map可以實現多任務的并發(fā)

簡單說明map()實現多線程原理：

task = [‘任務1', ‘任務2', ‘任務3', …]

map 函數一手包辦了序列操作、參數傳遞和結果保存等一系列的操作，map函數負責將線程分給不同的CPU。

在 Python 中有個兩個庫包含了 map 函數： multiprocessing 和它鮮為人知的子庫 multiprocessing.dummy.dummy 是 multiprocessing 模塊的完整克隆，唯一的不同在于 multiprocessing 作用于進程，而 dummy 模塊作用于線程。

代碼如下：

from multiprocessing.dummy import Pool as ThreadPool
import os
import requests
import time
import numpy as np
# 文件夾位置
filepath = r'C:\Users\Administrator\Desktop\ceshi'
pool = ThreadPool(10)#開啟線程數,即一次性拋出的請求數
time_list = []#用來計算時間
xml_list = []#數據集
pathDir = os.listdir(filepath)
for i, allDir in enumerate(pathDir):
 filename = os.path.join('%s%s' % (filepath + '\\', allDir))
 kk = open(filename, 'r', encoding='utf-8').read()
 data = kk.encode('utf-8')
 for k in range(10):
  xml_list.append(data)
def res(data):
 # 訪問目標服務器地址
 url_host = 'https://mp.csdn.net/mdeditor#'
 start = time.clock()
 s = requests.post(url_host, data=data)
 end = time.clock()
 if s.status_code == 200:
  print(end-start)
  time_list.append(end-start)
 else:
  print('請求失敗')
# 傳入的參數,1為函數, 2為參數
result = pool.map(res, xml_list)
all_arr = np.array(time_list)
aver = np.mean(all_arr)
variance = np.var(all_arr)
mid = np.median(all_arr)
min_num = np.min(all_arr)
max_num = np.max(all_arr)
print('平均值 : '+ str(aver))
print('方差 : ' + str(variance))
print('中值 : ' + str(mid))
print('最小值 : ' + str(min_num))
print('最大值 : ' + str(max_num))

個人做的小測試，如果有錯誤的地方希望留言提出意見及建議。

補充：python多進程(multiprocessing)(map)

map的基本使用：

map函數一手包辦了序列操作，參數傳遞和結果保存等一系列的操作。

from multiprocessing.dummy import Pool
poop = Pool(4)  # 4代表電腦是多少核的
results = pool.map(爬取函數,網址列表)

from multiprocessing.dummy import Pool as ThreadPool
import requests
import time
kv = {'user-agent':'Mozilla/5.0'}
def getsource(url):
 html = requests.get(url,headers=kv)
urls = []
for i in range(0,41):
 i = i*50
 newpage = 'https://tieba.baidu.com/f?kw=讀書&ie=utf-8&pn=' + str(i)
 urls.append(newpage)
# 單線程爬取
time1 = time.time()
for each in urls:
 print(each)
 getsource(each)
time2 = time.time()
print('單線程耗時: ' + str(time2-time1))
# 多線程爬取
pool = ThreadPool(8)
time3 = time.time()
results = pool.map(getsource, urls)
pool.close()
pool.join()
time4 = time.time()
print('多線程所消耗時間:' + str(time4 - time3))

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方，望不吝賜教。

您可能感興趣的文章:

全面掌握Python?JSON庫函數與方法學會JSON數據處理
Python提供了內置的JSON庫,允許在Python中解析和序列化JSON數據,本文將深入研究Python中JSON庫的各種函數和方法,為你提供豐富的示例代碼來幫助掌握JSON處理的方方面面
2024-01-01
python-OpenCV 實現將數組轉換成灰度圖和彩圖
今天小編就為大家分享一篇python-OpenCV 實現將數組轉換成灰度圖和彩圖，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-01-01
selenium中常見的表單元素操作方法總結
Selenium可以驅動瀏覽器來執(zhí)行一些操作,也就是說可以讓瀏覽器模擬執(zhí)行一些動作,下面這篇文章主要給大家介紹了關于selenium中常見的表單元素操作方法,需要的朋友可以參考下
2022-02-02
Python實現json對值進行模糊搜索的示例詳解
我經常使用json進行存儲配置，于是常常遇到這樣的問題：如果想要對某個數組里的值進行模糊搜索，同時輸出相關的其他數組相同位置的的值該如何實現呢？本文就來和大家詳細聊聊
2023-01-01
Python中的Selenium異常處理
這篇文章介紹了Python中的Selenium異常處理，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2022-05-05
基于python和flask實現http接口過程解析
這篇文章主要介紹了基于python和flask實現http接口過程解析,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-06-06
解決Pycharm后臺indexing導致不能run的問題
今天小編就為大家分享一篇解決Pycharm后臺indexing導致不能run的問題，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-06-06
Python RobotFramework的安裝過程及應用實戰(zhàn)教程
這篇文章主要介紹了RobotFramework的安裝過程及應用實戰(zhàn)教程,本文通過示例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
2023-08-08
使用pymysql查詢數據庫,把結果保存為列表并獲取指定元素下標實例
這篇文章主要介紹了使用pymysql查詢數據庫,把結果保存為列表并獲取指定元素下標實例，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-05-05
Python安裝OpenCV庫超時失敗解決
使用pip?installopencv-python安裝時,安裝速度很慢,本文主要介紹了Python安裝OpenCV庫超時失敗,具有一定的參考價值,感興趣的可以了解一下
2024-05-05