Pytorch搭建SRGAN平臺提升圖片超分辨率

更新時間：2022年04月29日 17:37:32 作者：Bubbliiiing

這篇文章主要為大家介紹了Pytorch搭建SRGAN平臺提升圖片超分辨率，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪

網絡構建

一、什么是SRGAN

SRGAN出自論文Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network。

如果將SRGAN看作一個黑匣子，其主要的功能就是輸入一張低分辨率圖片，生成高分辨率圖片。

該文章提到，普通的超分辨率模型訓練網絡時只用到了均方差作為損失函數，雖然能夠獲得很高的峰值信噪比，但是恢復出來的圖像通常會丟失高頻細節(jié)。

SRGAN利用感知損失(perceptual loss)和對抗損失(adversarial loss)來提升恢復出的圖片的真實感。

二、生成網絡的構建

生成網絡的構成如上圖所示，生成網絡的作用是輸入一張低分辨率圖片，生成高分辨率圖片。：

SRGAN的生成網絡由三個部分組成。

1、低分辨率圖像進入后會經過一個卷積+RELU函數。

2、然后經過B個殘差網絡結構，每個殘差結構都包含兩個卷積+標準化+RELU，還有一個殘差邊。

3、然后進入上采樣部分，在經過兩次上采樣后，原圖的高寬變?yōu)樵瓉淼?倍，實現分辨率的提升。

前兩個部分用于特征提取，第三部分用于提高分辨率。

import math
import torch
from torch import nn
class ResidualBlock(nn.Module):
    def __init__(self, channels):
        super(ResidualBlock, self).__init__()
        self.conv1 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.bn1 = nn.BatchNorm2d(channels)
        self.prelu = nn.PReLU(channels)
        self.conv2 = nn.Conv2d(channels, channels, kernel_size=3, padding=1)
        self.bn2 = nn.BatchNorm2d(channels)
    def forward(self, x):
        short_cut = x
        x = self.conv1(x)
        x = self.bn1(x)
        x = self.prelu(x)
        x = self.conv2(x)
        x = self.bn2(x)
        return x + short_cut
class UpsampleBLock(nn.Module):
    def __init__(self, in_channels, up_scale):
        super(UpsampleBLock, self).__init__()
        self.conv = nn.Conv2d(in_channels, in_channels * up_scale ** 2, kernel_size=3, padding=1)
        self.pixel_shuffle = nn.PixelShuffle(up_scale)
        self.prelu = nn.PReLU(in_channels)
    def forward(self, x):
        x = self.conv(x)
        x = self.pixel_shuffle(x)
        x = self.prelu(x)
        return x
class Generator(nn.Module):
    def __init__(self, scale_factor, num_residual=16):
        upsample_block_num = int(math.log(scale_factor, 2))
        super(Generator, self).__init__()
        self.block_in = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=9, padding=4),
            nn.PReLU(64)
        )
        self.blocks = []
        for _ in range(num_residual):
            self.blocks.append(ResidualBlock(64))
        self.blocks = nn.Sequential(*self.blocks)
        self.block_out = nn.Sequential(
            nn.Conv2d(64, 64, kernel_size=3, padding=1),
            nn.BatchNorm2d(64)
        )
        self.upsample = [UpsampleBLock(64, 2) for _ in range(upsample_block_num)]
        self.upsample.append(nn.Conv2d(64, 3, kernel_size=9, padding=4))
        self.upsample = nn.Sequential(*self.upsample)
    def forward(self, x):
        x = self.block_in(x)
        short_cut = x
        x = self.blocks(x)
        x = self.block_out(x)
        upsample = self.upsample(x + short_cut)
        return torch.tanh(upsample)

三、判別網絡的構建

判別網絡的構成如上圖所示：

SRGAN的判別網絡由不斷重復的卷積+LeakyRELU和標準化組成。
對于判斷網絡來講，它的目的是判斷輸入圖片的真假，它的輸入是圖片，輸出是判斷結果。

判斷結果處于0-1之間，利用接近1代表判斷為真圖片，接近0代表判斷為假圖片。

判斷網絡的構建和普通卷積網絡差距不大，都是不斷的卷積對圖片進行下采用，在多次卷積后，最終接一次全連接判斷結果。

實現代碼如下：

class Discriminator(nn.Module):
    def __init__(self):
        super(Discriminator, self).__init__()
        self.net = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=3, padding=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 64, kernel_size=3, stride=2, padding=1),
            nn.BatchNorm2d(64),
            nn.LeakyReLU(0.2),
            nn.Conv2d(64, 128, kernel_size=3, padding=1),
            nn.BatchNorm2d(128),
            nn.LeakyReLU(0.2),
            nn.Conv2d(128, 128, kernel_size=3, stride=2, padding=1),
            nn.BatchNorm2d(128),
            nn.LeakyReLU(0.2),
            nn.Conv2d(128, 256, kernel_size=3, padding=1),
            nn.BatchNorm2d(256),
            nn.LeakyReLU(0.2),
            nn.Conv2d(256, 256, kernel_size=3, stride=2, padding=1),
            nn.BatchNorm2d(256),
            nn.LeakyReLU(0.2),
            nn.Conv2d(256, 512, kernel_size=3, padding=1),
            nn.BatchNorm2d(512),
            nn.LeakyReLU(0.2),
            nn.Conv2d(512, 512, kernel_size=3, stride=2, padding=1),
            nn.BatchNorm2d(512),
            nn.LeakyReLU(0.2),
            nn.AdaptiveAvgPool2d(1),
            nn.Conv2d(512, 1024, kernel_size=1),
            nn.LeakyReLU(0.2),
            nn.Conv2d(1024, 1, kernel_size=1)
        )
    def forward(self, x):
        batch_size = x.size(0)
        return torch.sigmoid(self.net(x).view(batch_size))

訓練思路

SRGAN的訓練可以分為生成器訓練和判別器訓練：
每一個step中一般先訓練判別器，然后訓練生成器。

一、判別器的訓練

在訓練判別器的時候我們希望判別器可以判斷輸入圖片的真?zhèn)?，因此我們的輸入就是真圖片、假圖片和它們對應的標簽。

因此判別器的訓練步驟如下：

1、隨機選取batch_size個真實高分辨率圖片。

2、利用resize后的低分辨率圖片，傳入到Generator中生成batch_size個虛假高分辨率圖片。

3、真實圖片的label為1，虛假圖片的label為0，將真實圖片和虛假圖片當作訓練集傳入到Discriminator中進行訓練。

二、生成器的訓練

在訓練生成器的時候我們希望生成器可以生成極為真實的假圖片。因此我們在訓練生成器需要知道判別器認為什么圖片是真圖片。

因此生成器的訓練步驟如下：

1、將低分辨率圖像傳入生成模型，得到虛假高分辨率圖像，將虛假高分辨率圖像獲得判別結果與1進行對比得到loss。（與1對比的意思是，讓生成器根據判別器判別的結果進行訓練）。

2、將真實高分辨率圖像和虛假高分辨率圖像傳入VGG網絡，獲得兩個圖像的特征，通過這兩個圖像的特征進行比較獲得loss

利用SRGAN生成圖片

SRGAN的庫整體結構如下：

一、數據集的準備

在訓練前需要準備好數據集，數據集保存在datasets文件夾里面。

二、數據集的處理

打開txt_annotation.py，默認指向根目錄下的datasets。運行txt_annotation.py。
此時生成根目錄下面的train_lines.txt。

三、模型訓練

在完成數據集處理后，運行train.py即可開始訓練。

訓練過程中，可在results文件夾內查看訓練效果：

以上就是Pytorch搭建SRGAN平臺提升圖片超分辨率的詳細內容，更多關于Pytorch搭建SRGAN圖片超分辨率的資料請關注腳本之家其它相關文章！

Python實現KNN鄰近算法
這篇文章主要為大家詳細介紹了Python實現KNN鄰近算法，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-01-01
Python Django的安裝配置教程圖文詳解
Django是一個開放源代碼的Web應用框架，由Python寫成，Django是重量級選手中最有代表性的一位。許多成功的網站和APP都基于Django。這篇文章主要介紹了Python Django的安裝配置,需要的朋友可以參考下
2019-07-07
python traceback捕獲并打印異常的方法
這篇文章主要介紹了python traceback捕獲并打印異常的方法，小編覺得挺不錯的，現在分享給大家，也給大家做個參考。一起跟隨小編過來看看吧
2018-08-08
Flask框架Flask-Login用法分析
這篇文章主要介紹了Flask框架Flask-Login用法,結合實例形式分析了Flask-Login插件進行登錄驗證的相關操作技巧與注意事項,需要的朋友可以參考下
2018-07-07
在Python中移動目錄結構的方法
這篇文章主要介紹了在Python中移動目錄結構的方法,需要的朋友可以參考下
2016-01-01
利用Python實現在PDF文檔中插入文字水印
在傳播PDF文檔的過程中,如何有效地保護文檔的版權和所有權,防止非法復制和濫用,成為了一個不可忽視的問題,所以給PDF文檔添加水印便成了一種行之有效的保護手,本文將展示如何使用Python在PDF文檔中插入文字水印,實現高效的PDF文檔處理,需要的朋友可以參考下
2024-04-04
Python 經典算法100及解析(小結)
這篇文章主要介紹了Python 經典算法100及解析，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2019-09-09
Python實現將json文件生成C語言的結構體的腳本分享
這篇文章主要為大家詳細介紹了Python如何實現將json文件生成C語言的結構體，文中的示例代碼講解詳細，感興趣的小伙伴可以跟隨小編一起學習一下
2022-09-09
Android+OpenCv4實現邊緣檢測及輪廓繪制出圖像最大邊緣
最近工作需求，需要用opencv來先做一個demo，掃描照片進行邊緣檢測和最大邊緣，就整理出來介紹一下，感興趣的小伙伴們可以參考一下
2021-05-05
python自動化測試Data?Driven?Testing(DDT)用例解析
這篇文章主要為大家介紹了python自動化測試Data?Driven?Testing(DDT)用例解析，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進步，早日升職加薪
2023-09-09

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

Pytorch搭建SRGAN平臺提升圖片超分辨率

目錄

網絡構建

一、什么是SRGAN

二、生成網絡的構建

三、判別網絡的構建

訓練思路

一、判別器的訓練

二、生成器的訓練

利用SRGAN生成圖片

一、數據集的準備

二、數據集的處理

三、模型訓練

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线 免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

Pytorch搭建SRGAN平臺提升圖片超分辨率

目錄

網絡構建

一、什么是SRGAN

二、生成網絡的構建

三、判別網絡的構建

訓練思路

一、判別器的訓練

二、生成器的訓練

利用SRGAN生成圖片

一、數據集的準備

二、數據集的處理

三、模型訓練

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具

国产无遮挡裸体免费直播视频,久久精品国产蜜臀av,动漫在线视频一区二区,欧亚日韩一区二区三区,久艹在线免费视频,国产精品美女网站免费,正在播放 97超级视频在线观看,斗破苍穹年番在线观看免费,51最新乱码中文字幕

一、什么是SRGAN

二、生成網絡的構建

一、數據集的準備

三、模型訓練