pytorch tensor計算三通道均值方式
tensor計算三通道均值
今天用pytorch處理圖像時,涉及到了計算均值的問題,整理一下解決思路。
第一種思路
tensor轉(zhuǎn)換為numpy再進行處理
import torch
import cv2
img = cv2.imread("image path")
tensor_img = torch.from_numpy((img[:, :, ::-1] / 255.0)[None, ...].transpose(0, 3, 1, 2)).cuda()
?
...
?
numpy_img = (tensor_img.detach().cpu().numpy().transpose(2, 3, 1, 0).squeeze() * 255)[:, :, ::-1]
?
ave_color = np.mean(numpy_img , axis=(0, 1))如果圖像里有0值,不想計入運算:
numpy_img[numpy_img == 0] = np.nan ave_color = np.nanmean(numpy_img, axis=(0, 1))
由于tensor和numpy來回轉(zhuǎn)換會消耗資源、性能。
又查了一番,直接在tensor中計算(非零均值計算)
reshape_tensor_img = tensor_img.view(tensor_img.size(0), tensor_img.size(1), -1) ave_color = reshape_tensor_img.mean(2) ? # mean value without 0 non_zero_img = reshape_tensor_img[reshape_tensor_img.nonzero(as_tuple=True)] ave_color = non_zero_img.view(reshape_tensor_img.size(0), reshape_tensor_img.size(1), -1).mean(2)
計算完均值,想要加法運算的時候也會碰上一點維度上的麻煩,需要維度轉(zhuǎn)換一下。
reshape_ave_color = ave_color.view(ave_color.size(0), ave_color.size(1), 1, 1) add_img = tensor_img + reshape_ave_color
Pytorch tensor的運算
tensor操作
1. 新建
A、torch.Tensor(shape)/torch.FloatTensor(shape):隨機初始化一個維度為shape的張量。

B、torch.randn(shape):用均值為0,方差為1的高斯分布初始化一個shape的張量。

C、torch.rand(shape):在區(qū)間[0,1]上均勻分布,初始化一個shape的張量。

2、Tensor的變換
A、view / reshape
兩個用法差不多,都是用來改變一個張量的數(shù)據(jù)分布。

注:(2,-1)中的-1會自動計算剩下的維度。
B、squeeze / unsqueeze
第一個是用來壓縮維度為1的張量,如(6,1,32,32).squeeze()之后就變?yōu)?6,32,32);第二個是用來增加一個維度。具體看實例如下:

注:squeeze中不帶參數(shù),是將所有維度為1的地方去掉,帶參數(shù)是去指定維度為1的地方,若指定的維度不為1,則不變。

注:在指定的維度上插入一個大小為1的新維度。
C、expand / repeat
這兩個都是進行數(shù)據(jù)的擴充操作,第一個是擴充到指定的維度大小,第二個函數(shù)的參數(shù)維度上擴充的倍數(shù)。一般結(jié)合上面2.B中的函數(shù)使用。

D、 t / transpose / permute
這三個函數(shù)用來數(shù)據(jù)維度之間的調(diào)整,第一個只能用于2D。

E、broadcasting機制
相當(dāng)于自動完成了unsqueeze+expand的操作,但是相比節(jié)省內(nèi)存空間。

通過broadcasting機制,張量可以直接和標量進行相加。
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python使用MoviePy實現(xiàn)編輯音視頻并添加字幕
MoviePy是一個用于視頻編輯的Python模塊,它可被用于一些基本操作,本文主要介紹了如何使用編輯音視頻并添加字幕,感興趣的小伙伴可以了解下2024-01-01
python人工智能tensorflow常見損失函數(shù)LOSS匯總
這篇文章主要為大家介紹了python人工智能tensorflowf常見損失函數(shù)LOSS匯總,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2022-05-05
使用Pytorch Geometric進行鏈接預(yù)測的實現(xiàn)代碼
PyTorch Geometric (PyG)是構(gòu)建圖神經(jīng)網(wǎng)絡(luò)模型和實驗各種圖卷積的主要工具,在本文中我們將通過鏈接預(yù)測來對其進行介紹,文中有詳細的代碼示例供大家參考,需要的朋友可以參考下2023-10-10
實例講解Python爬取網(wǎng)頁數(shù)據(jù)
這篇文章給大家通過實例講解了Python爬取網(wǎng)頁數(shù)據(jù)的步驟以及操作過程,有興趣的朋友跟著學(xué)習(xí)下吧。2018-07-07
在notepad++中實現(xiàn)直接運行python代碼
今天小編就為大家分享一篇在notepad++中實現(xiàn)直接運行python代碼,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-12-12
對matplotlib改變colorbar位置和方向的方法詳解
今天小編就為大家分享一篇對matplotlib改變colorbar位置和方向的方法詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-12-12
Python實現(xiàn)實時監(jiān)測可視化數(shù)據(jù)大屏
實時監(jiān)測的可視化數(shù)據(jù)大屏是一種非常有用的工具,可以幫助我們實時了解數(shù)據(jù)的變化和趨勢,下面我們將介紹如何使用Python代碼實現(xiàn)實時監(jiān)測的可視化數(shù)據(jù)大屏,需要的可以參考一下2023-06-06

