pytorch?dataset實(shí)戰(zhàn)案例之讀取數(shù)據(jù)集的代碼

更新時(shí)間：2022年10月21日 10:59:17 作者：半島鐵子_

這篇文章主要介紹了pytorch?dataset實(shí)戰(zhàn)案例讀取數(shù)據(jù)集的相關(guān)知識(shí),這段代碼可以作為讀取數(shù)據(jù)集的一個(gè)DataSet類(lèi)的基礎(chǔ)類(lèi)，可以擴(kuò)充進(jìn)行修改，以后有類(lèi)似需要可以拿過(guò)來(lái)修改，本文結(jié)合實(shí)例代碼給大家詳細(xì)講解，需要的朋友可以參考下

概述

最近在跑一篇圖像修復(fù)論文的代碼，配置好環(huán)境之后開(kāi)始運(yùn)行，發(fā)現(xiàn)數(shù)據(jù)一直加載不進(jìn)去。
害，還是得看人家代碼咋寫(xiě)的，一句一句看邏輯，準(zhǔn)能找出問(wèn)題。通讀dataset后，發(fā)現(xiàn)了問(wèn)題所在，終于成功加載了數(shù)據(jù)集。

項(xiàng)目結(jié)構(gòu)與代碼

項(xiàng)目結(jié)構(gòu)

主要的目的就是從數(shù)據(jù)集中讀取到彩色圖像和掩碼圖像。
代碼
代碼中涉及到torch.transforms、合并路徑等知識(shí)點(diǎn)，我在代碼中都進(jìn)行了詳細(xì)的注釋?zhuān)窂揭獙?duì)照著項(xiàng)目結(jié)構(gòu)，如果自己用的話(huà)要根據(jù)項(xiàng)目結(jié)構(gòu)去將相對(duì)路徑改過(guò)來(lái)。
dataset.py ：當(dāng)前的工作路徑：…\OT-GAN-for-Inpainting-master\src\data

import os
import math
import numpy as np
from glob import glob

from random import shuffle
from PIL import Image, ImageFilter

import torch
import torchvision.transforms.functional as F
import torchvision.transforms as transforms
from torch.utils.data import Dataset, DataLoader



class InpaintingData(Dataset):
    def __init__(self, args):
        super(Dataset, self).__init__()     # 繼承Dataset的父類(lèi)的初始化函數(shù)
        self.w = self.h = args.image_size   # 通過(guò)args傳入新的屬性---圖像的w和h
        self.mask_type = args.mask_type     # 通過(guò)args傳入新的屬性---mask_type

        # image and mask 
        self.image_path = []    #創(chuàng)建image_path的數(shù)組
        for ext in ['*.jpg', '*.png']:  # 獲取每一個(gè)后綴為.jpg或者.png的圖片，為ext
            # 將dir_image、data_train和ext拼接作為圖片的路徑，并將其存入到數(shù)組image_path之中,glob()獲取一個(gè)lsit集合
            self.image_path.extend(glob(os.path.join(args.dir_image, args.data_train, ext)))
        self.mask_path = glob(os.path.join(args.dir_mask, args.mask_type, '*.png')) #拼接dir_mask、mask_type和路徑下所有的.png作為mask_path

        # augmentation 
        self.img_trans = transforms.Compose([   #接收一個(gè) transforms方法的list為參數(shù)，將這些操作組合到一起，返回一個(gè)新的tranforms
            transforms.RandomResizedCrop(args.image_size),  #隨機(jī)隨機(jī)長(zhǎng)寬比裁剪，大小為image_size
            transforms.RandomHorizontalFlip(), #隨機(jī)水平翻轉(zhuǎn)
            transforms.ColorJitter(0.05, 0.05, 0.05, 0.05), #改變圖像的亮度、對(duì)比度、飽和度和色調(diào)。
            transforms.ToTensor()])     # 轉(zhuǎn)為tensor，并歸一化至[0-1]
        self.mask_trans = transforms.Compose([
            transforms.Resize(args.image_size, interpolation=transforms.InterpolationMode.NEAREST), #將輸入圖像調(diào)整為給定的大小，interpolation是插值方式，此處是默認(rèn)值NEAREST
            transforms.RandomHorizontalFlip(),  #隨機(jī)水平翻轉(zhuǎn)
            transforms.RandomRotation(  #隨機(jī)旋轉(zhuǎn)
                (0, 45), interpolation=transforms.InterpolationMode.NEAREST), #(0, 45)是角度
        ])

    def __len__(self):  # __len__和__getitem__DataSet類(lèi)必須實(shí)現(xiàn)的靜態(tài)方法
        return len(self.image_path)

    def __getitem__(self, index):
        # load image
        image = Image.open(self.image_path[index]).convert('RGB') #獲取圖像，并將其轉(zhuǎn)化為RGB（3x8位像素）模式
        filename = os.path.basename(self.image_path[index]) #獲取圖片的路徑

        if self.mask_type == 'pconv': #如果mask_type為pconv
            index = np.random.randint(0, len(self.mask_path)) #隨機(jī)從mask_path中獲取一個(gè)下標(biāo)
            mask = Image.open(self.mask_path[index])    #根據(jù)下標(biāo)獲取mask圖片
            mask = mask.convert('L')    #將mask圖片轉(zhuǎn)化為L(zhǎng)(8位像素的黑白圖片，0表示黑，255表示白)模式
        else:   # 構(gòu)造mask，有mask數(shù)據(jù)集的話(huà)就運(yùn)行不到這里
            mask = np.zeros((self.h, self.w)).astype(np.uint8) #構(gòu)造與h和w一樣大的圖片，都用0填充，并將其轉(zhuǎn)換為uint8
            mask[self.h // 4:self.h // 4 * 3, self.w // 4:self.w // 4 * 3] = 1
            mask = Image.fromarray(m).convert('L')

        # augment
        image = self.img_trans(image) * 2. - 1. # 數(shù)據(jù)標(biāo)準(zhǔn)化，將輸出限定在一定的范圍
        mask = F.to_tensor(self.mask_trans(mask))   # 將轉(zhuǎn)化后的mask圖像轉(zhuǎn)化為tensor

        return image, mask, filename    #返回


if __name__ == '__main__':
    from attrdict import AttrDict

    args = {
        'dir_image': '../../examples/logos',
        'data_train': 'image',
        'dir_mask': '../../examples/logos/mask',
        'mask_type': 'pconv',
        'image_size': 512
    }
    args = AttrDict(args) # 將上面定義的參數(shù)傳入AttrDict()作為新參數(shù)

    data = InpaintingData(args)     #創(chuàng)建InpaintingData對(duì)象
    print(len(data), len(data.mask_path))   #輸出data的長(zhǎng)度，mask的長(zhǎng)度
    img, mask, filename = data[0]   # 獲取第一張圖片
    print(img.size(), mask.size(), filename)    #打印上述信息

輸出：

再Debug一下看：
如下圖所示，執(zhí)行玩加載數(shù)據(jù)的代碼之后，已經(jīng)成功獲取到數(shù)據(jù)

總結(jié)

這段代碼可以作為讀取數(shù)據(jù)集的一個(gè)DataSet類(lèi)的基礎(chǔ)類(lèi)，可以擴(kuò)充進(jìn)行修改，以后有類(lèi)似需要可以拿過(guò)來(lái)修改。

參考資料

[1] https://github.com/researchmm/AOT-GAN-for-Inpainting

到此這篇關(guān)于pytorch dataset實(shí)戰(zhàn)----讀取數(shù)據(jù)集的文章就介紹到這了,更多相關(guān)pytorch 讀取數(shù)據(jù)集內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: