淺談pytorch中的BN層的注意事項(xiàng)
最近修改一個(gè)代碼的時(shí)候,當(dāng)使用網(wǎng)絡(luò)進(jìn)行推理的時(shí)候,發(fā)現(xiàn)每次更改測(cè)試集的batch size大小竟然會(huì)導(dǎo)致推理結(jié)果不同,甚至產(chǎn)生錯(cuò)誤結(jié)果,后來發(fā)現(xiàn)在網(wǎng)絡(luò)中定義了BN層,BN層在訓(xùn)練過程中,會(huì)將一個(gè)Batch的中的數(shù)據(jù)轉(zhuǎn)變成正太分布,在推理過程中使用訓(xùn)練過程中的參數(shù)對(duì)數(shù)據(jù)進(jìn)行處理,然而網(wǎng)絡(luò)并不知道你是在訓(xùn)練還是測(cè)試階段,因此,需要手動(dòng)的加上,需要在測(cè)試和訓(xùn)練階段使用如下函數(shù)。
model.train() or model.eval()
BN類的定義見pytorch中文參考文檔
補(bǔ)充知識(shí):關(guān)于pytorch中BN層(具體實(shí)現(xiàn))的一些小細(xì)節(jié)
最近在做目標(biāo)檢測(cè),需要把訓(xùn)好的模型放到嵌入式設(shè)備上跑前向,因此得把各種層的實(shí)現(xiàn)都用C手?jǐn)]一遍,,,此為背景。
其他層沒什么好說的,但是BN層這有個(gè)小坑。pytorch在打印網(wǎng)絡(luò)參數(shù)的時(shí)候,只打出weight和bias這兩個(gè)參數(shù)。咦,說好的BN層有四個(gè)參數(shù)running_mean、running_var 、gamma 、beta的呢?一開始我以為是pytorch把BN層的計(jì)算簡(jiǎn)化成weight * X + bias,但馬上反應(yīng)過來應(yīng)該沒這么簡(jiǎn)單,因?yàn)閜ytorch中只有可學(xué)習(xí)的參數(shù)才稱為parameter。上網(wǎng)找了一些資料但都沒有說到這么細(xì)的,畢竟大部分用戶使用時(shí)只要模型能跑起來就行了,,,于是開始看BN層有哪些屬性,果然發(fā)現(xiàn)了熟悉的running_mean和running_var,原來pytorch的BN層實(shí)現(xiàn)并沒有不同。這里吐個(gè)槽:為啥要把gamma和beta改叫weight、bias啊,很有迷惑性的好不好,,,
扯了這么多,干脆捋一遍pytorch里BN層的具體實(shí)現(xiàn)過程,幫自己理清思路,也可以給大家提供參考。再吐槽一下,在網(wǎng)上搜“pytorch bn層”出來的全是關(guān)于這一層怎么用的、初始化時(shí)要輸入哪些參數(shù),沒找到一個(gè)pytorch中BN層是怎么實(shí)現(xiàn)的,,,
眾所周知,BN層的輸出Y與輸入X之間的關(guān)系是:Y = (X - running_mean) / sqrt(running_var + eps) * gamma + beta,此不贅言。其中g(shù)amma、beta為可學(xué)習(xí)參數(shù)(在pytorch中分別改叫weight和bias),訓(xùn)練時(shí)通過反向傳播更新;而running_mean、running_var則是在前向時(shí)先由X計(jì)算出mean和var,再由mean和var以動(dòng)量momentum來更新running_mean和running_var。所以在訓(xùn)練階段,running_mean和running_var在每次前向時(shí)更新一次;在測(cè)試階段,則通過net.eval()固定該BN層的running_mean和running_var,此時(shí)這兩個(gè)值即為訓(xùn)練階段最后一次前向時(shí)確定的值,并在整個(gè)測(cè)試階段保持不變。
以上這篇淺談pytorch中的BN層的注意事項(xiàng)就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實(shí)現(xiàn)模擬登錄網(wǎng)易郵箱的方法示例
這篇文章主要介紹了Python實(shí)現(xiàn)模擬登錄網(wǎng)易郵箱的方法,結(jié)合實(shí)例形式分析了Python基于urllib2及cookielib模塊的http請(qǐng)求、數(shù)據(jù)傳輸及交互相關(guān)操作技巧,需要的朋友可以參考下2018-07-07
python實(shí)現(xiàn)讀取Excel內(nèi)容并展示成json
這篇文章主要為大家詳細(xì)介紹了如何使用python實(shí)現(xiàn)讀取Excel內(nèi)容并展示成json功能,文中的示例代碼講解詳細(xì),感興趣的小伙伴可以參考一下2023-12-12
Python實(shí)現(xiàn)FTP文件定時(shí)自動(dòng)下載的步驟
這篇文章主要介紹了Python實(shí)現(xiàn)FTP文件定時(shí)自動(dòng)下載的示例,幫助大家更好的理解和使用python,感興趣的朋友可以了解下2020-12-12
python使用代理IP爬取貓眼電影專業(yè)評(píng)分?jǐn)?shù)據(jù)
在編寫爬蟲程序的過程中,IP封鎖無(wú)疑是一個(gè)常見且棘手的問題,盡管網(wǎng)絡(luò)上存在大量的免費(fèi)IP代理網(wǎng)站,但其質(zhì)量往往參差不齊,令人堪憂,本篇文章中介紹一下如何使用Python的Requests庫(kù)和BeautifulSoup庫(kù)來抓取貓眼電影網(wǎng)站上的專業(yè)評(píng)分?jǐn)?shù)據(jù),需要的朋友可以參考下2024-03-03
pytorch 更改預(yù)訓(xùn)練模型網(wǎng)絡(luò)結(jié)構(gòu)的方法
今天小編就為大家分享一篇pytorch 更改預(yù)訓(xùn)練模型網(wǎng)絡(luò)結(jié)構(gòu)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-08-08
解決django的template中如果無(wú)法引用MEDIA_URL問題
這篇文章主要介紹了解決django的template中如果無(wú)法引用MEDIA_URL問題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-04-04
Python之使用adb shell命令啟動(dòng)應(yīng)用的方法詳解
今天小編就為大家分享一篇Python之使用adb shell命令啟動(dòng)應(yīng)用的方法詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01

