關(guān)于pytorch多GPU訓(xùn)練實例與性能對比分析

更新時間：2019年08月19日 15:07:30 作者：奏英宇

今天小編就為大家分享一篇關(guān)于pytorch多GPU訓(xùn)練實例與性能對比分析，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

以下實驗是我在百度公司實習(xí)的時候做的，記錄下來留個小經(jīng)驗。

多GPU訓(xùn)練

cifar10_97.23 使用 run.sh 文件開始訓(xùn)練

cifar10_97.50 使用 run.4GPU.sh 開始訓(xùn)練

在集群中改變GPU調(diào)用個數(shù)修改 run.sh 文件

nohup srun --job-name=cf23 $pt --gres=gpu:2 -n1 bash cluster_run.sh $cmd 2>&1 1>>log.cf50_2GPU &

修改 –gres=gpu:2 即可

Python 文件代碼修改

parser.add_argument('--batch_size', type=int, default=96*2, help='batch size')

修改對應(yīng) batch size 大小，保證每塊GPU獲得等量的訓(xùn)練數(shù)據(jù)，因為batch_size的改變會影響訓(xùn)練精度

最容易實現(xiàn)的單GPU訓(xùn)練改為多GPU訓(xùn)練代碼

單GPU：logits, logits_aux = model(input)

多GPU：

if torch.cuda.device_count()>1:#判斷是否能夠有大于一的GPU資源可以調(diào)用

   logits, logits_aux =nn.parallel.data_parallel(model,input)

  else:

   logits, logits_aux = model(input)

缺點：不是性能最好的實現(xiàn)方式

優(yōu)點：代碼嵌入適應(yīng)性強(qiáng)，不容易報錯

性能分析

該圖為1到8GPU訓(xùn)練cifar10——97.23網(wǎng)絡(luò)的實驗對比

可以看到單核訓(xùn)練600輪需要53小時、雙核訓(xùn)練600輪需要26小時、四核16、六核14、八核13。

在可運行7小時的GPU上的對比實驗：單核跑完83輪、雙核跑完163輪、四核跑完266輪

結(jié)論：性價比較高的是使用4～6核GPU進(jìn)行訓(xùn)練，但是多GPU訓(xùn)練對于單GPU訓(xùn)練有所差異，訓(xùn)練的準(zhǔn)確率提升會有所波動，目前發(fā)現(xiàn)的是負(fù)面的影響。

以上這篇關(guān)于pytorch多GPU訓(xùn)練實例與性能對比分析就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

利用Pytorch實現(xiàn)獲取特征圖的方法詳解
這篇文章主要為大家詳細(xì)介紹了如何利用Pytorch實現(xiàn)獲取特征圖，包括提取單個特征圖和提取多個特征圖，文中的示例代碼講解詳細(xì)，需要的可以參考一下
2022-10-10
python實現(xiàn)決策樹ID3算法的示例代碼
這篇文章主要介紹了python實現(xiàn)決策樹ID3算法的示例代碼，小編覺得挺不錯的，現(xiàn)在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-05-05
Keras:Unet網(wǎng)絡(luò)實現(xiàn)多類語義分割方式
本文主要利用U-Net網(wǎng)絡(luò)結(jié)構(gòu)實現(xiàn)了多類的語義分割，并展示了部分測試效果，希望對你有用！
2020-06-06
python利用拉鏈法實現(xiàn)字典方法示例
這篇文章主要介紹了python利用拉鏈法實現(xiàn)字典的方法，文中給出了詳細(xì)的示例代碼，相信對大家具有一定的參考價值，需要的朋友可以們下面來一起看看吧。
2017-03-03
使用Matplotlib創(chuàng)建基本圖表的詳細(xì)指南
Matplotlib 是一個功能強(qiáng)大的 Python 庫,用于創(chuàng)建各種類型的圖表和可視化,在本文中,我們將提供一個完整的指南,介紹如何使用 Matplotlib 創(chuàng)建基本的圖表,包括折線圖、散點圖、柱狀圖和餅圖,感興趣的小伙伴跟著小編一起來看看吧
2024-05-05
Django 配置多站點多域名的實現(xiàn)步驟
這篇文章主要介紹了Django 配置多站點多域名的實現(xiàn)步驟,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2019-05-05
分享Python?的24個編程超好用技巧
這篇文章主要給大家分享Python?的24個編程超好用技巧，下面分享一些python技巧和?tips，這些技巧將根據(jù)其首字母按?A-Z?的順序進(jìn)行展示，具有一定的參考價值，需要的小伙伴可以參考一下
2022-02-02
Python實現(xiàn)的多線程http壓力測試代碼
這篇文章主要介紹了Python實現(xiàn)的多線程http壓力測試代碼,結(jié)合實例形式分析了Python多線程操作的相關(guān)實現(xiàn)技巧,需要的朋友可以參考下
2017-02-02
基于python計算滾動方差(標(biāo)準(zhǔn)差)talib和pd.rolling函數(shù)差異詳解
這篇文章主要介紹了基于python計算滾動方差(標(biāo)準(zhǔn)差)talib和pd.rolling函數(shù)差異詳解，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-06-06
淺談Keras參數(shù) input_shape、input_dim和input_length用法
這篇文章主要介紹了淺談Keras參數(shù) input_shape、input_dim和input_length用法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-06-06