java寫卷積神經(jīng)網(wǎng)絡(luò)(CupCnn簡(jiǎn)介)
前言
在機(jī)器學(xué)習(xí)中,卷積神經(jīng)網(wǎng)絡(luò)是一種深度前饋人工神經(jīng)網(wǎng)絡(luò),已成功地應(yīng)用于圖像識(shí)別。目前,很多的車牌識(shí)號(hào)識(shí)別,人臉識(shí)別等都采用卷積神經(jīng)網(wǎng)絡(luò),可以說(shuō)卷積神經(jīng)網(wǎng)絡(luò)在圖像識(shí)別方面取得了巨大的成功。當(dāng)前開源的深度學(xué)習(xí)框架有很多了,比如caffe,tensorflow,torch等,這些深度學(xué)習(xí)框架包含了完善的卷積神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn),那么,為什么我們還要自己寫卷積神經(jīng)網(wǎng)絡(luò)?直接用這些開源的深度學(xué)習(xí)框架多好,又快又省事,性能好穩(wěn)定,bug少。是的,如果你只是使用卷積神經(jīng)網(wǎng)絡(luò)做一些應(yīng)用,并不在意它的工作原理,那你大可不必自己費(fèi)神費(fèi)力的寫卷積神經(jīng)網(wǎng)絡(luò),可如果你想完全掌握卷積神經(jīng)網(wǎng)絡(luò)的工作原理,古人云:紙上得來(lái)終覺(jué)淺,覺(jué)知此時(shí)要躬行。所以,你很有必要自己實(shí)現(xiàn)一遍卷積神經(jīng)網(wǎng)絡(luò),從而加深對(duì)它的認(rèn)識(shí)。
什么是CupCnn
CupCnn是個(gè)用java寫的卷積神經(jīng)網(wǎng)絡(luò),我在工作之余,為了加深對(duì)卷積神經(jīng)網(wǎng)絡(luò)的認(rèn)識(shí),實(shí)現(xiàn)了它。它足夠簡(jiǎn)潔,表現(xiàn)也不錯(cuò),非常適合初學(xué)者參考使用。它的源碼可以從github下載:CupCnn
你不用擔(dān)心它的協(xié)議什么的限制,您可以用它來(lái)做任何事,任意修改它,如果它能對(duì)你有所幫助,希望能給個(gè)星星?。?!
^-^^-^^-^
設(shè)計(jì)的思路
我希望它是以足夠簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò),這樣有利于初學(xué)者學(xué)習(xí)。所以我沒(méi)有實(shí)現(xiàn)那些并發(fā)加速的東西,這保證的代碼的簡(jiǎn)介性。設(shè)計(jì)的時(shí)候,我將卷積神經(jīng)網(wǎng)絡(luò)分為四個(gè)模塊:Network(layer blob loss active),這點(diǎn)可以從包名中看出來(lái)。layer,loss,active都有一個(gè)基類,整個(gè)神經(jīng)網(wǎng)絡(luò)的編程都是面向基類的。Network是綜合這四個(gè)模塊,統(tǒng)籌和調(diào)度資源的中心,每個(gè)layer都會(huì)有一個(gè)Network的實(shí)例,這樣可以輕松的通過(guò)Network獲得各種數(shù)據(jù),比如獲取每一層的輸出,diff等。
設(shè)計(jì)框圖如下:

參數(shù)的保存對(duì)于java而言就非常簡(jiǎn)單了,實(shí)現(xiàn)Serializable接口就可以快速實(shí)現(xiàn)參數(shù)的序列化和反序列化。CupCnn只對(duì)data目錄下的Blob和BlobParams兩個(gè)實(shí)現(xiàn)了Serializable接口,所有的參數(shù)都由這兩個(gè)實(shí)現(xiàn)。
目前的表現(xiàn)
全連接神經(jīng)網(wǎng)絡(luò)
目前,在mnist數(shù)據(jù)集上,全連接神經(jīng)網(wǎng)絡(luò)(全連接(100)+全連接(30)+全連接(10)+softmax),訓(xùn)練30個(gè)epoes,準(zhǔn)確率為96.76
卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(6個(gè)特征)+最大值池化+卷積(6個(gè)特征)+全連接(512)+全連接(30)+全連接(10)+softmax),在學(xué)習(xí)速率為0.2的情況下,訓(xùn)練30個(gè)epoes,準(zhǔn)確率為97.79.我相信經(jīng)過(guò)進(jìn)一步參數(shù)調(diào)優(yōu),在充分訓(xùn)練的情況下,準(zhǔn)確率能達(dá)到更高。
卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練快照如下:
begin train
epoe: 0 lossValue: 2.3019369891560455 lr: 0.2 accuracy is 0.13
epoe: 0 lossValue: 2.0722489482105195 lr: 0.2 accuracy is 0.44
epoe: 0 lossValue: 1.2423286194012682 lr: 0.2 accuracy is 0.72
epoe: 0 lossValue: 0.7860529560675255 lr: 0.2 accuracy is 0.79
epoe: 0 lossValue: 0.6272194196176664 lr: 0.2 accuracy is 0.87
epoe: 0 lossValue: 0.5240051326725808 lr: 0.2 accuracy is 0.84
epoe: 0 lossValue: 0.27637563581928026 lr: 0.2 accuracy is 0.95
epoe: 0 lossValue: 0.35585388987055083 lr: 0.2 accuracy is 0.92
epoe: 0 lossValue: 0.441971528417802 lr: 0.2 accuracy is 0.92
epoe: 0 lossValue: 0.25637710325999674 lr: 0.2 accuracy is 0.95
epoe: 0 lossValue: 0.39872273532502 lr: 0.2 accuracy is 0.9
epoe: 1 lossValue: 0.264085484522027 lr: 0.16000000000000003 accuracy is 0.91
epoe: 1 lossValue: 0.22754066024803088 lr: 0.16000000000000003 accuracy is 0.96
epoe: 1 lossValue: 0.30256420975577103 lr: 0.16000000000000003 accuracy is 0.96
epoe: 1 lossValue: 0.18149648622985948 lr: 0.16000000000000003 accuracy is 0.99
epoe: 1 lossValue: 0.177239938748327 lr: 0.16000000000000003 accuracy is 0.96
epoe: 1 lossValue: 0.15041993009777443 lr: 0.16000000000000003 accuracy is 0.98
epoe: 1 lossValue: 0.10759545752665524 lr: 0.16000000000000003 accuracy is 1.0
CupCnn的使用
目前,CupCnn實(shí)現(xiàn)了mnist數(shù)據(jù)集上的測(cè)試,在src/test下,MnistTest是main函數(shù)的入口,具體的神經(jīng)網(wǎng)絡(luò)的搭建在MnistNetwork類中。在MnistNetwork類中,buildConvNetwork和buildFcNetwork分別實(shí)現(xiàn)
了搭建卷積神經(jīng)網(wǎng)絡(luò)和搭建全連接神經(jīng)網(wǎng)絡(luò)。得益于java良好的跨平臺(tái)屬性,你下載完CupCnn的源碼后,使用eclipse打開該項(xiàng)目,然后直接運(yùn)行,應(yīng)該就能開始在mnist數(shù)據(jù)集上訓(xùn)練和測(cè)試了。
構(gòu)建神經(jīng)網(wǎng)絡(luò)
public void buildNetwork(){
//首先構(gòu)建神經(jīng)網(wǎng)絡(luò)對(duì)象,并設(shè)置參數(shù)
network = new Network();
network.setBatch(100);
network.setLoss(new LogLikeHoodLoss());
//network.setLoss(new CrossEntropyLoss());
optimizer = new SGDOptimizer(0.2);
network.setOptimizer(optimizer);
//buildFcNetwork();
buildConvNetwork();
network.prepare();
}
setBatch()函數(shù)設(shè)置一個(gè)批次里有多少?gòu)垐D片。
setLoss()設(shè)置要是用的損失函數(shù)。CupCnn實(shí)現(xiàn)了交叉熵?fù)p失函數(shù)和對(duì)數(shù)似然損失函數(shù)。
setOptimizer()設(shè)置要是用的優(yōu)化器。CupCnn只實(shí)現(xiàn)了SGD優(yōu)化器,如果您實(shí)現(xiàn)了更好的優(yōu)化器,并且愿意提交到CupCnn,那本人深表歡迎。
構(gòu)建全連接神經(jīng)網(wǎng)絡(luò)
private void buildFcNetwork(){
//給network添加網(wǎng)絡(luò)層
InputLayer layer1 = new InputLayer(network,new BlobParams(network.getBatch(),1,28,28));
network.addLayer(layer1);
FullConnectionLayer layer2 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),784,1,1));
layer2.setActivationFunc(new ReluActivationFunc());
network.addLayer(layer2);
FullConnectionLayer layer3 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),100,1,1));
layer3.setActivationFunc(new ReluActivationFunc());
network.addLayer(layer3);
FullConnectionLayer layer4 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),30,1,1));
layer4.setActivationFunc(new SigmodActivationFunc());
network.addLayer(layer4);
FullConnectionLayer layer5 = new FullConnectionLayer(network,new BlobParams(network.getBatch(),10,1,1));
layer5.setActivationFunc(new ReluActivationFunc());
network.addLayer(layer5);
SoftMaxLayer sflayer = new SoftMaxLayer(network,new BlobParams(network.getBatch(),10,1,1));
network.addLayer(sflayer);
}
正如上面代碼展示的一樣,每一個(gè)Layer都需要一個(gè)network,它是Network的實(shí)例,Network是全局的管理者和資源的調(diào)度者,有了Network的引用,我們可以輕易的獲得到每一層的輸出的數(shù)據(jù),輸出的誤差等。此外,每一層都需要一個(gè)指定當(dāng)前層輸出數(shù)據(jù)塊大小的參數(shù),該參數(shù)告訴某一層你需要輸出多少數(shù)據(jù)。比如神經(jīng)網(wǎng)絡(luò)的最后一層是SoftMaxLayer ,它需要輸出到底是哪個(gè)數(shù)字,這個(gè)數(shù)字用長(zhǎng)度為10的向量表示,比如數(shù)字7,那么SoftMaxLayer 應(yīng)該輸出第8個(gè)元素的值為1,其他元素的值為0。卷積層和池化層需要更多的參數(shù),因?yàn)樗麄兌加幸粋€(gè)kernel,對(duì)卷積層而言,它叫卷積核,卷積層的實(shí)現(xiàn)每此每個(gè)方向的stride也就是步長(zhǎng)都是1,這點(diǎn)還有改進(jìn)的余地。對(duì)于池化層,你出來(lái)需要傳入池化核的參數(shù)外,還需要傳入水平方向和垂直方向的步長(zhǎng),這是必須的。
訓(xùn)練和測(cè)試
搭建好神經(jīng)網(wǎng)絡(luò)后,你需要調(diào)用network.prepare()方法,該方法會(huì)根據(jù)每一層的數(shù)據(jù)參數(shù)創(chuàng)建輸出數(shù)據(jù)塊和誤差數(shù)據(jù)塊。因此該方法的調(diào)用是必須的。
public void train(List<DigitImage> imgList,int epoes){
System.out.println("begin train");
int batch = network.getBatch();
double loclaLr = optimizer.getLr();
for(int e=0;e<epoes;e++){
Collections.shuffle(imgList);
for(int i=0;i<imgList.size()-batch;i+=batch){
List<Blob> inputAndLabel = buildBlobByImageList(imgList,i,batch,1,28,28);
double lossValue = network.train(inputAndLabel.get(0), inputAndLabel.get(1));
if(i>batch && i/batch%50==0){
System.out.print("epoe: "+e+" lossValue: "+lossValue+" "+" lr: "+optimizer.getLr()+" ");
testInner(inputAndLabel.get(0), inputAndLabel.get(1));
}
}
if(loclaLr>0.001){
loclaLr*=0.8;
optimizer.setLr(loclaLr);
}
}
}
public void test(List<DigitImage> imgList){
System.out.println("begin test");
int batch = network.getBatch();
int correctCount = 0;
int i = 0;
for(i=0;i<imgList.size()-batch;i+=batch){
List<Blob> inputAndLabel = buildBlobByImageList(imgList,i,batch,1,28,28);
Blob output = network.predict(inputAndLabel.get(0));
int[] calOutLabels = getBatchOutputLabel(output.getData());
int[] realLabels = getBatchOutputLabel(inputAndLabel.get(1).getData());
for(int kk=0;kk<calOutLabels.length;kk++){
if(calOutLabels[kk] == realLabels[kk]){
correctCount++;
}
}
}
double accuracy = correctCount/(1.0*i+batch);
System.out.println("test accuracy is "+accuracy+" correctCount "+correctCount);
}
如上,調(diào)用Network的 train即可訓(xùn)練,調(diào)用Network的predict方法即可測(cè)試。
參數(shù)的保存和加載
public void saveModel(String name){
network.saveModel(name);
}
public void loadModel(String name){
network = new Network();
network.loadModel(name);
network.prepare();
}
調(diào)用Network的saveModel和loadModel可分別實(shí)現(xiàn)參數(shù)的保存和加載,你只需要傳入一個(gè)文件名即可。當(dāng)我們通過(guò)保存的參數(shù)創(chuàng)建神經(jīng)網(wǎng)絡(luò)的時(shí)候,我們需要先new 一個(gè)Network,然后調(diào)用這個(gè)network的loadModel加載已保存的參數(shù),然后不要忘記調(diào)用prepare方法創(chuàng)建每一層的輸出數(shù)據(jù)塊和誤差數(shù)據(jù)塊。
目前的完成情況及未來(lái)的計(jì)劃
目前,實(shí)現(xiàn)的層有:全連接,卷積,最大值池化層,平均值池化層,softmax層。實(shí)現(xiàn)的激活函數(shù)有:sigmod,tanh,relu.
實(shí)現(xiàn)的損失函數(shù)有:交叉熵,對(duì)數(shù)似然。實(shí)現(xiàn)的優(yōu)化為:SGD。參數(shù)已經(jīng)能save和load.接下來(lái)會(huì)添加droupout層,還會(huì)嘗試添加cifar-10上的例子。
此外,我會(huì)寫一些文章,回顧自己寫CupCnn過(guò)程中的思考可問(wèn)題,供初學(xué)者參考,大神請(qǐng)繞道。感興趣的可以繼續(xù)關(guān)注,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
Java Date時(shí)間類型的操作實(shí)現(xiàn)
本文主要介紹Java Date 日期類型,以及Calendar的怎么獲取時(shí)間,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-03-03
SpringBoot在 POM 中引入本地 JAR 包的方法
在開發(fā) Spring Boot 應(yīng)用程序時(shí),您可能需要使用本地 JAR 包來(lái)添加自定義庫(kù)或功能,本文將介紹在 Spring Boot 項(xiàng)目的 POM 文件中如何引入本地 JAR 包,感興趣的朋友跟隨小編一起看看吧2023-08-08
spring/springboot整合dubbo詳細(xì)教程
今天教大家如何使用spring/springboot整合dubbo,文中有非常詳細(xì)的圖文介紹及代碼示例,對(duì)正在學(xué)習(xí)java的小伙伴有很好地幫助,需要的朋友可以參考下2021-05-05
SpringBoot+Vue跨域配置(CORS)問(wèn)題得解決過(guò)程
在使用 Spring Boot 和 Vue 開發(fā)前后端分離的項(xiàng)目時(shí),跨域資源共享(CORS)問(wèn)題是一個(gè)常見的挑戰(zhàn),接下來(lái),我將分享我是如何一步步解決這個(gè)問(wèn)題的,包括中間的一些試錯(cuò)過(guò)程,希望能夠幫助到正在經(jīng)歷類似問(wèn)題的你2024-08-08
spring boot 若依系統(tǒng)整合Ueditor部署時(shí)上傳圖片錯(cuò)誤問(wèn)題
這篇文章主要介紹了spring boot 若依系統(tǒng)整合Ueditor部署時(shí)上傳圖片錯(cuò)誤問(wèn)題,本文給大家分享問(wèn)題解決方法,對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-10-10
Springboot整合GateWay+Nacos實(shí)現(xiàn)動(dòng)態(tài)路由
本文主要介紹了Springboot整合GateWay+Nacos實(shí)現(xiàn)動(dòng)態(tài)路由,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2024-08-08

