FocusAny專注高效的AI工具條 v0.8.02.4MB / 04-13
LinkAndroid 全能手機連接助手 v0.6.024.6MB / 03-15
PESCMS RENT房租管理系統(tǒng) v1.0.0104KB / 11-16
ECHO個人博客主題網(wǎng)頁模板 v1.015.1MB / 08-25
優(yōu)雅草便民tools工具 v1.0.61.25MB / 05-01
抖音熱門短劇在線搜索引擎 v1.0911KB / 03-20
名揚銀河企業(yè)建站源碼 v2.0.26.7MB / 03-19
AGECMS商業(yè)會云管理_電子名片 v1.0.194KB / 03-13
帝國cms看雪時間軸博客趣靜態(tài)模板 v1.04.23MB / 02-02
Apache Superset數(shù)據(jù)探查與可視化平臺 v3.1.2144.6MB / 04-21
-
Spyder 集成開發(fā)環(huán)境 v6.0.5 其它源碼 / 11.48MB
-
TensorFlow(谷歌機器學(xué)習(xí)系統(tǒng)) v2.19.0 正式官方版 其它源碼 / 54MB
-
Netdata性能實時監(jiān)測工具 v2.3.2 其它源碼 / 10.3MB
-
-
-
-
-
Godot游戲引擎 v4.4.1 其它源碼 / 15.1MB
-
Vuls漏洞掃描器 v0.30.0 源碼包 其它源碼 / 1.2MB
-
Bootstrap框架 v5.3.5 其它源碼 / 6.24MB
詳情介紹
Horovod是針對TensorFlow,Keras,PyTorch和Apache MXNet的分布式深度學(xué)習(xí)培訓(xùn)框架。Horovod的目標(biāo)是使分布式深度學(xué)習(xí)快速且易于使用。
Horovod由LF AI和數(shù)據(jù)基金會(LF AI&Data)托管。如果您是一家致力于在人工智能,機器和深度學(xué)習(xí)中使用開源技術(shù)的公司,并希望在這些領(lǐng)域中支持開源項目的社區(qū),請考慮加入LF AI和數(shù)據(jù)基金會。有關(guān)誰參與以及Horovod如何扮演角色的詳細(xì)信息,請閱讀Linux Foundation公告。
安裝
要安裝Horovod:
1、安裝CMake
2、如果您已從PyPI安裝TensorFlow ,請確保已安裝g++-4.8.5或g++-4.9或更高版本。
如果您已從PyPI安裝了PyTorch ,請確保已安裝g++-4.9或更高版本。
如果您已經(jīng)從Conda安裝了任何一個軟件包,請確保gxx_linux-64已安裝Conda軟件包。
3、安裝horovodpip包。
要在CPU上運行:
$ pip install horovod
要在具有NCCL的GPU上運行:
$ HOROVOD_GPU_OPERATIONS = NCCL點安裝horovod
$ HOROVOD_GPU_OPERATIONS=NCCL pip install horovod
用法
要使用Horovod,請在程序中添加以下內(nèi)容:
1、運行hvd.init()以初始化Horovod。
2、將每個GPU固定到一個進程,以避免資源爭用。
通常每個進程設(shè)置一個GPU,將其設(shè)置為local rank。服務(wù)器上的第一個進程將被分配第一個GPU,第二個進程將被分配第二個GPU,依此類推。
3、通過工人人數(shù)來衡量學(xué)習(xí)率。
同步分布式培訓(xùn)中的有效批處理規(guī)模是根據(jù)工人人數(shù)來衡量的。學(xué)習(xí)率的提高彌補了批量大小的增加。
4、將優(yōu)化器包裝在中hvd.DistributedOptimizer。
分布式優(yōu)化器將梯度計算委托給原始優(yōu)化器,使用allreduce或allgather對梯度求平均,然后應(yīng)用這些平均梯度。
5、將等級0的初始變量狀態(tài)廣播到所有其他進程。
當(dāng)使用隨機權(quán)重開始訓(xùn)練或從檢查點恢復(fù)訓(xùn)練時,這是確保所有工人進行一致初始化的必要步驟。
6、修改您的代碼以僅在工作程序0上保存檢查點,以防止其他工作程序破壞它們。
使用TensorFlow v1的示例(有關(guān)完整的培訓(xùn)示例,請參閱示例目錄):
import tensorflow as tf
import horovod.tensorflow as hvd
# Initialize Horovod
hvd.init()
# Pin GPU to be used to process local rank (one GPU per process)
config = tf.ConfigProto()
config.gpu_options.visible_device_list = str(hvd.local_rank())
# Build model...
loss = ...
opt = tf.train.AdagradOptimizer(0.01 * hvd.size())
# Add Horovod Distributed Optimizer
opt = hvd.DistributedOptimizer(opt)
# Add hook to broadcast variables from rank 0 to all other processes during
# initialization.
hooks = [hvd.BroadcastGlobalVariablesHook(0)]
# Make training operation
train_op = opt.minimize(loss)
# Save checkpoints only on worker 0 to prevent other workers from corrupting them.
checkpoint_dir = '/tmp/train_logs' if hvd.rank() == 0 else None
# The MonitoredTrainingSession takes care of session initialization,
# restoring from a checkpoint, saving to a checkpoint, and closing when done
# or an error occurs.
with tf.train.MonitoredTrainingSession(checkpoint_dir=checkpoint_dir,
config=config,
hooks=hooks) as mon_sess:
while not mon_sess.should_stop():
# Perform synchronous training.
mon_sess.run(train_op)
運行Horovod
下面的示例命令顯示了如何運行分布式訓(xùn)練。有關(guān)更多詳細(xì)信息,請參見Run Horovod,包括RoCE / InfiniBand調(diào)整和處理掛起的技巧。
1、要在具有4個GPU的計算機上運行:
$ horovodrun -np 4 -H localhost:4 python train.py
2、要在具有4個GPU的4臺計算機上運行:
$ horovodrun -np 16 -H server1:4,server2:4,server3:4,server4:4 python train.py
3、要在不使用horovodrun包裝的情況下使用Open MPI運行,請參閱使用Open MPI運行Horovod。
4、要在Docker中運行,請參閱Docker中的Horovod。
5、要在Kubernetes中運行,MPI運算符,Helm Chart,F(xiàn)fDL和Polyaxon。
6、要在Spark上運行。
7、要在Ray上運行。
8、在Singularity運行
9、要在LSF HPC集群(例如Summit)中運行
下載地址
人氣源碼
相關(guān)文章
-
FocusAny專注高效的AI工具條 v0.8.0FocusAny 是一個專注高效的AI工具條,可以使用 Alt / Option+空格 一鍵喚起,通過插件快速安裝,可以擴展出非常多的功能...
-
LinkAndroid 全能手機連接助手 v0.6.0LinkAndroid是一個輕松連接安卓與電腦,暢享投屏、文件管理、應(yīng)用管理、截屏、錄屏、安裝應(yīng)用等一站式便捷體驗,讓工作更高效!歡迎需要的朋友下載使用...
-
PESCMS RENT房租管理系統(tǒng) v1.0.0PESCMS RENT(下稱PR)是一款基于GPLv2協(xié)議發(fā)布的開源房租管理系統(tǒng),程序基于Golang + VUE3編寫,歡迎需要的朋友下載使用...
-
ECHO個人博客主題網(wǎng)頁模板 v1.0ECHO個人主題網(wǎng)頁模板是一款適合個人圖文寫作與博客的主題。主題極簡優(yōu)雅,采用經(jīng)典獨特的三欄設(shè)計,保留線條和足夠的留白,展現(xiàn)您文字、圖片間的美...
-
優(yōu)雅草便民tools工具 v1.0.6優(yōu)雅草便民工具--便民tools工具tools-前端已接數(shù)據(jù),優(yōu)雅草小工具-數(shù)據(jù)來自優(yōu)雅草api賦能-優(yōu)雅草便民工具是一款由成都市一顆優(yōu)雅草科技有限公司打造的便民查詢公益工具,歡...
-
抖音熱門短劇在線搜索引擎 v1.0一個非常哇塞的在線短劇搜索頁面,接口已經(jīng)對接好了,上傳源碼到服務(wù)器解壓就能直接用,有能力的可以自己改接口自己寫自己的接口...
-
名揚銀河企業(yè)建站源碼 v2.0.2名揚銀河企業(yè)建站系統(tǒng),適用于無代碼基礎(chǔ)的新手,快速搭建企業(yè)網(wǎng)站,程序內(nèi)置了多項實用功能及插件,能夠便捷的對網(wǎng)站進行修改、調(diào)整、優(yōu)化等方面進行操作...
-
AGECMS商業(yè)會云管理_電子名片 v1.0.1AGECMS商業(yè)會云管理電子名片是一款專為商務(wù)人士設(shè)計的全方位互動電子名片軟件。它結(jié)合了現(xiàn)代商務(wù)交流的便捷性與高效性,通過數(shù)字化的方式,歡迎需要的朋友下載使用...
-
帝國cms看雪時間軸博客趣靜態(tài)模板 v1.0帝國cms看雪時間軸博客趣靜態(tài)模板是一款女生唯美簡潔個人博客靜態(tài)頁面模板,藍(lán)色時間軸個人網(wǎng)頁模板,下雪空間個人模板,喜歡的網(wǎng)友可以用開源程序帝國cms標(biāo)簽仿站建設(shè)...
-
Apache Superset數(shù)據(jù)探查與可視化平臺 v3.1.2Superset可視化平臺是Airbnb(知名在線房屋短租公司)開源的數(shù)據(jù)探查與可視化平臺(曾用名 Panoramix、Caravel ),該工具在可視化、易用性和交互性上非常有特色...
下載聲明
☉ 解壓密碼:www.dhdzp.com 就是本站主域名,希望大家看清楚,[ 分享碼的獲取方法 ]可以參考這篇文章
☉ 推薦使用 [ 迅雷 ] 下載,使用 [ WinRAR v5 ] 以上版本解壓本站軟件。
☉ 如果這個軟件總是不能下載的請在評論中留言,我們會盡快修復(fù),謝謝!
☉ 下載本站資源,如果服務(wù)器暫不能下載請過一段時間重試!或者多試試幾個下載地址
☉ 如果遇到什么問題,請評論留言,我們定會解決問題,謝謝大家支持!
☉ 本站提供的一些商業(yè)軟件是供學(xué)習(xí)研究之用,如用于商業(yè)用途,請購買正版。
☉ 本站提供的Horovod分布式深度學(xué)習(xí)框架 v0.28.1資源來源互聯(lián)網(wǎng),版權(quán)歸該下載資源的合法擁有者所有。








