DLSS 4讓幀數(shù)突破顯示極限! 技嘉RTX 5080超級(jí)雕顯卡評(píng)測(cè)
RTX 50系的游戲旗艦RTX 5080顯卡已經(jīng)于1月29日解禁,也就是大年初一。不過相信彼時(shí)大家正沉浸在新春佳節(jié)的氛圍中,鮮有人關(guān)注顯卡評(píng)測(cè)。今天繼續(xù)為大家?guī)鞟ORUS Geforce RTX 5080 MASTER 16G的顯卡評(píng)測(cè),此前沒有關(guān)注RTX 5080首測(cè)的朋友,可以再詳細(xì)的了解一下。

本代RTX 5080顯卡依然定位4K高分辨率下的高幀光追游戲,并且在Blackwell架構(gòu)中新引入了DLSS 4,不僅可以做到電競(jìng)級(jí)幀率,甚至部分游戲中,能夠超越300幀,甚至400幀!
另外作為每一代的準(zhǔn)旗艦級(jí)產(chǎn)品,不僅游戲方面實(shí)力強(qiáng)大,同時(shí)憑借大顯存,亦可擔(dān)當(dāng)生產(chǎn)力工具,是萬元以下最具實(shí)力的多面手。
在整個(gè)RTX 50系顯卡中,AI的比重都有著明顯提升,不管在架構(gòu)層面、游戲領(lǐng)域,還是內(nèi)容創(chuàng)作,AI已經(jīng)做到各個(gè)應(yīng)用領(lǐng)域的底層覆蓋,包括任何級(jí)別顯卡都可使用的DLSS 4 AI多幀生成、針對(duì)內(nèi)容創(chuàng)作的神經(jīng)網(wǎng)絡(luò)渲染,以及直播會(huì)議應(yīng)用NVIDIA Broadcast。AI不再局限于文生圖和語言問答那么顯而易見,而是融入到了我們的日常生活中。

本次我們?cè)u(píng)測(cè)的顯卡為AORUS MASTER超級(jí)雕,是技嘉的高端旗艦系列,不管是用料規(guī)格還是實(shí)際的性能跑分都無愧于超級(jí)雕的名號(hào),下面我們先來看看AORUS Geforce RTX 5080 MASTER 16G這張顯卡的外觀。
AORUS Geforce RTX 5080 MASTER 16G概覽
AORUS Geforce RTX 5080 MASTER 16G的包裝依然沿襲了家族風(fēng)格設(shè)計(jì),正面除了高端AORUS系列的logo標(biāo)志外,還有象征著旗艦地位的MASTER超級(jí)雕圖騰,主視覺下方則是NVIDIA的規(guī)范色調(diào)和型號(hào)標(biāo)志。


配件方面AORUS Geforce RTX 5080 MASTER 16G除了擁有標(biāo)準(zhǔn)的顯卡支架、和8pin*3轉(zhuǎn)16pin(12+4)轉(zhuǎn)接線。不過最醒目的要數(shù)這個(gè)散熱風(fēng)扇,下面我們也會(huì)詳細(xì)說明它的用法。

AORUS Geforce RTX 5080 MASTER 16G的整體外觀設(shè)計(jì)與RTX 40系的風(fēng)格相仿,不過在細(xì)節(jié)上仍有較大的變化。整體尺寸為360×150×75mm,采用3.5槽設(shè)計(jì)。

AORUS Geforce RTX 5080 MASTER 16G整體采用純黑色設(shè)計(jì),不過相比前代更具有立體感。飾邊的彩虹色流暢線條營(yíng)造出廣闊的空間感,同時(shí)也為純黑色的導(dǎo)流罩增添了一絲活力。
風(fēng)扇周圍的圖案和漩渦靈感設(shè)計(jì)突出了動(dòng)態(tài) 三環(huán)燈效,營(yíng)造出迷人的光線和運(yùn)動(dòng)相互作用。正面采用分層紋理,具有不同的飾面,將力量與優(yōu)雅完美融合。

AORUS Geforce RTX 5080 MASTER 16G的主動(dòng)散熱部分,采用仿生風(fēng)扇設(shè)計(jì)。葉片設(shè)計(jì)靈感來源于鷹的翅膀空氣動(dòng)力學(xué),有效降低了風(fēng)阻和噪音,在低噪音表現(xiàn)的同時(shí),可將風(fēng)壓提升高達(dá)53.6%,風(fēng)量提升12.5%。同時(shí)正逆轉(zhuǎn)的運(yùn)行方式,可減少相鄰風(fēng)扇之間的擾流并提高氣流壓力。
內(nèi)部采用雙滾珠軸承結(jié)構(gòu),比傳統(tǒng)結(jié)構(gòu)具有更好的耐熱性和效率,使用壽命更長(zhǎng)。并且當(dāng)GPU溫度較低或處于較低負(fù)載時(shí),風(fēng)扇將會(huì)自動(dòng)停止運(yùn)轉(zhuǎn),提供零噪音的舒適體驗(yàn)。

AORUS Geforce RTX 5080 MASTER 16G依然采用了上一代的RGB炫彩光輪設(shè)計(jì),可通過GCC軟件選擇燈光效果或與GCC中的其他設(shè)備同步。不過這種光輪設(shè)計(jì),必須要在顯卡有一定負(fù)載的情況下才能看到。

在顯卡側(cè)面,LCD顯示屏不僅顯示顯卡信息,還可自定義文本、圖片和 GIF。還可以通過 GCC(技嘉智能管家) 調(diào)整燈光效果。

在視頻輸出接口上,AORUS Geforce RTX 5080 MASTER16G采用了HDMI 2.1b*1 + DP2.1b*3的四接口設(shè)計(jì)。
其中DP 2.1b接口為UHBR20規(guī)格,可達(dá) 80Gbps 帶寬,最高支持8K (7680x4320)@165Hz(DSC);4K (3840x2160)@480Hz(DSC)。另外需要注意的是,要達(dá)到 80Gbps 帶寬需要DP80LL認(rèn)證的線材。

本次AORUS Geforce RTX 5080 MASTER 16G的TDP官方給出的為360W,搭載單16pin(12+4)輔助供電,建議電源850W。

AORUS Geforce RTX 5080 MASTER 16G的電源接口設(shè)計(jì)具備指示燈提示功能,用于提高使用安全性并避免因連接問題導(dǎo)致的隱患:熄滅表示電源連接正常;亮起表示電源線未連接;閃爍則表示電源異常。
另外這張顯卡的電源接口同樣有著人性化設(shè)計(jì),它的連接位置下凹,遠(yuǎn)離顯卡邊緣,這樣在裝入機(jī)箱中,可增加線材與機(jī)箱擋板的空間,減少電源線彎折的風(fēng)險(xiǎn),提升16pin電源接口的兼容性和安全性。

AORUS Geforce RTX 5080 MASTER 16G采用了一體化金屬背板,放射性的線條由AORUS的圖騰延伸至I/O區(qū)邊緣,而右側(cè)為大面積裸露的散熱鰭片。
同時(shí)在內(nèi)部散熱系統(tǒng)上,采用了大型均熱板直接與 GPU 接觸,再加上復(fù)合式熱管,可快速將 GPU 和 VRAM 的熱量傳遞到散熱器。

AORUS Geforce RTX 5080 MASTER 16G采用了彎角鰭片設(shè)計(jì),棱角分明且不等的鰭片高度設(shè)計(jì)有效地引導(dǎo)鰭片之間的氣流,從而增加與空氣的接觸表面積并提高散熱效率。

包裝內(nèi)附贈(zèng)的散熱風(fēng)扇可置于背板尾部,裸露的散熱鰭片上方,增加主動(dòng)散熱效果,有助于將鰭片熱量快速帶走。在風(fēng)扇底部有橡膠墊,可沿背板的輪廓扣入,豎裝顯卡也無需擔(dān)心掉落。不過風(fēng)扇的連接線均需要裝在主板上,對(duì)于主板針腳接口緊張的用戶不太友好。
GCC(技嘉智能管家)
GCC(技嘉智能管家)是適用于GIGABYTE產(chǎn)品的統(tǒng)一軟件。它提供更加直觀的界面,允許用戶實(shí)時(shí)調(diào)整核心頻率、電壓、風(fēng)扇模式和功耗。

在GCC燈效界面,如果使用配套的技嘉主板,默認(rèn)則會(huì)開啟燈光同步,此時(shí)無法單獨(dú)調(diào)節(jié)顯卡風(fēng)扇燈效,需斷開同步。

單獨(dú)調(diào)節(jié)顯卡燈效后可分別調(diào)節(jié)風(fēng)扇、背板以及側(cè)面的燈光效果,默認(rèn)情況三處燈光會(huì)同時(shí)改變,燈效共有多達(dá)12種。如果想實(shí)時(shí)預(yù)覽的話,可以打開烤機(jī)軟件讓顯卡負(fù)載,否則風(fēng)扇不轉(zhuǎn)的情況下燈光是不亮的。


在性能界面,可分別監(jiān)控和調(diào)節(jié)板卡的參數(shù),不過這更多的是為進(jìn)階玩家準(zhǔn)備的。普通用戶看看就好,也盡量不要調(diào)節(jié)。

最后在LCD Panel界面,可調(diào)節(jié)顯卡側(cè)面屏幕的顯示效果,除了預(yù)設(shè)的幾種效果,也可自定義GIF或圖片進(jìn)行上傳。
NVIDIA RTX Blackwell架構(gòu)
GeForce RTX 50系顯卡由全新的NVIDIA BlackWell架構(gòu)打造,本次評(píng)測(cè)的RTX 5080則采用GB203核心,配備10752個(gè)CUDA,84個(gè)RT Cores;336個(gè)Tensor Cores和336個(gè)紋理單元。

完整的GB202核心包括12個(gè)圖形處理集群(GPCs);96個(gè)紋理處理集群(TPCs);192個(gè)流式多處理器(SMs),和一個(gè)512bit總位寬,包含16個(gè)32bit內(nèi)存控制器的內(nèi)存接口。

對(duì)應(yīng)到我們熟悉的數(shù)字,則是24576個(gè)CUDA,192個(gè)RT Cores;768個(gè)Tensor Cores以及768個(gè)紋理單元。由于第5代Tensor Cores采用了更高速的FP4運(yùn)算,完整的GB202可達(dá)到恐怖的4000 AI TOPS;而第4代RT Cores采用的新的幾何運(yùn)算模型,也讓它可以達(dá)到360 RT TFLOPS。

RTX 5090 PCB
另外,每個(gè)SM單元中還包含兩個(gè)FP64內(nèi)核,總共384個(gè)。FP64內(nèi)核主要目的是確保帶有FP64代碼的程序可正常運(yùn)行,并確保準(zhǔn)其確性。這對(duì)于某些專業(yè)領(lǐng)域來說至關(guān)重要,比如醫(yī)學(xué)或?qū)I(yè)計(jì)算領(lǐng)域。

GPC是GPU中占據(jù)主導(dǎo)地位的高級(jí)模塊,所有關(guān)鍵的圖形處理單元都位于GPC中。在RTX 50系中,GPC整體的布局變化不大。
每個(gè)GPC包含一個(gè)專用的光柵引擎,兩個(gè)ROP分區(qū)。每個(gè)分區(qū)包含8個(gè)單獨(dú)的ROP單元和8個(gè)TPC,每個(gè)TPC包含1個(gè)變形引擎和兩個(gè)SM單元。
完整的GB202核心還包含128MB的L2緩存。大緩存的變更自RTX 40系顯卡便已開始,所有程序都可以受益于這個(gè)高速大容量的緩存池,而光線跟蹤(特別是路徑跟蹤)等復(fù)雜操作將產(chǎn)生巨大的好處。

SM單元是GPU架構(gòu)中的核心組件,在GPU并行處理中發(fā)揮著關(guān)鍵作用,它通過其各種核心(CUDA,Tensor,RT),高效的warp調(diào)度,內(nèi)存管理以及對(duì)AI等現(xiàn)代工作負(fù)載的支持實(shí)現(xiàn)大規(guī)模并行。本代RTX 50系顯卡中SM單元的變化非常大,下面我們?cè)敿?xì)來了解一下。
完整的GB202核心包含192個(gè)SM單元,每個(gè)SM包含128個(gè)CUDA核心;1個(gè)第4代RT Core;4個(gè)第5代Tensor Core;4個(gè)紋理單元。1個(gè)256KB的寄存器文件和128KB的L1共享緩存,它可以根據(jù)圖形和計(jì)算工作負(fù)載的需要配置不同的大小。

在Blackwell架構(gòu)的SM單元中,INT32整數(shù)運(yùn)算的數(shù)量增加了一倍。與Ada架構(gòu)的SM單元相比,實(shí)現(xiàn)了INT32與FP32內(nèi)核的完全統(tǒng)一。不過在時(shí)鐘周期內(nèi),統(tǒng)一內(nèi)核只能作為FP32或INT32內(nèi)核運(yùn)行。

與Blackwell架構(gòu)一同推出的還有GDDR7顯存,采用pam3信號(hào)技術(shù),它有著更高頻率與更低電壓的特點(diǎn)。
本代RTX 5090配備28 Gbps GDDR7顯存,峰值顯存帶寬可達(dá)1792GB/s/秒,而RTX 5080配備更高的30 Gbps時(shí)鐘頻率的GDDR7顯存,峰值內(nèi)存帶寬可達(dá)960 GB/秒。結(jié)合新的引腳編碼方案,GDDR7實(shí)現(xiàn)了顯著增強(qiáng)的信噪比(SNR)。
通過增加信道密度、改進(jìn)的pam3信噪比、先進(jìn)的均衡方案、重新設(shè)計(jì)的時(shí)鐘架構(gòu)和增強(qiáng)的I/O訓(xùn)練,GDDR7提供了更高的帶寬。這些進(jìn)步還顯著提高了能源效率,提供了更好的性能和延長(zhǎng)電池壽命,特別是在移動(dòng)端,或功率受限的系統(tǒng)中。
Blackwell 第4代RT Core
在第4代RT Core中,簡(jiǎn)單來說它相比Ada架構(gòu),在渲染光線追蹤場(chǎng)景時(shí),提供了兩倍光線三角形相交測(cè)試吞吐量,并引入了Mega Geometry的結(jié)構(gòu)算法。

Opacity Micromap Engine
不透明微引擎在Ada架構(gòu)中已經(jīng)引入,這里不再過多講述,它主要的作用是優(yōu)化光線追蹤渲染,可大幅減輕著色器的工作負(fù)擔(dān)。
比如樹葉之類的復(fù)雜物體,不同的光線都會(huì)影響它的表現(xiàn)狀態(tài),以及樹葉之間的光線反彈,所以對(duì)于光線追蹤的計(jì)算量是巨大的。

不過Opacity Micromap Engine可以將光線追蹤特性烘焙到不透明蒙版中,所以那些不規(guī)則形狀和半透明的對(duì)象,也就能夠更快更精準(zhǔn)的渲染出來,從而極大減輕著色器的工作負(fù)擔(dān)。
RTX Mega Geometry
除了上面提到的Opacity Micromap Engine,在BlackWell架構(gòu)中,還引入了Mega Geometry(大型幾何)的運(yùn)算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

新的Blackwell RT核心包含一個(gè)Triangle ClusterIntersection Engine三角形群集交集引擎,它能夠進(jìn)一步加速大型幾何的光線追蹤,同時(shí)它的工作還包含標(biāo)準(zhǔn)的光線三角形交集測(cè)試。Linear Swept Spheres則主要用于光線追蹤中精細(xì)的幾何形狀,比如發(fā)絲。
RTX Mega Geometry的理念與虛幻5引擎的Nanite虛擬微多邊形幾何體系統(tǒng)相同,在現(xiàn)代游戲中,模型更加細(xì)致,需要渲染的工作量大幅增加,如果全部按照最精細(xì)的級(jí)別處理,將會(huì)耗費(fèi)極大的計(jì)算資源,所以將LOD分級(jí)便應(yīng)運(yùn)而生。

簡(jiǎn)單來說,就是根據(jù)一個(gè)物體距離攝像機(jī)的遠(yuǎn)近,來調(diào)節(jié)物體的細(xì)節(jié)水平。此前《黑神話:悟空》便應(yīng)用了這樣的技術(shù),它消除了LOD的繁瑣任務(wù),可以掃描并導(dǎo)入極高精細(xì)程度的模型。并且,這不會(huì)影響性能。仍然可以獲得實(shí)時(shí)幀速率。
在RTX Mega Geometry中提供了新的BVH構(gòu)建功能,它采用三角形集群作為一級(jí)基元。新的集群加速結(jié)構(gòu)Cluster-level Acceleration Structures(CLAS)可以從256個(gè)三角形空間緊湊批次中生成,然后使用CLAS集合作為輸入來構(gòu)建最終的BVH。

不過虛幻5引擎并非專為Blackwell而設(shè)計(jì),RTX Mega Geometry的工作只是更高效的讓游戲引擎調(diào)用API。由于其輸入?yún)?shù)完全由GPU內(nèi)存驅(qū)動(dòng),游戲引擎可以在GPU上更高效的運(yùn)行LOD選擇、動(dòng)畫、剔除等邏輯。同時(shí)最大限度減少對(duì)CPU的往返,進(jìn)而減少與BVH管理相關(guān)的CPU開銷。

然而在更加精細(xì)化的游戲引擎中,按照傳統(tǒng)的流程,應(yīng)用程序必須從場(chǎng)景中的每一幀的所有對(duì)象中構(gòu)建一個(gè)頂層加速結(jié)構(gòu)。而隨著更大的世界規(guī)模以及繁雜的場(chǎng)景物體,僅靠LOD分級(jí)仍然難以實(shí)現(xiàn)質(zhì)的變化。
為了解決這個(gè)問題,RTX Mega Geometry引入了一種新型的頂層加速結(jié)構(gòu)(TLAS),稱為分區(qū)頂層加速結(jié)構(gòu)(PTLAS)。

它無需在每一幀都從頭開始構(gòu)建一個(gè)新的TLAS,PTLAS能夠辨別從一幀到另一幀,哪些對(duì)象是靜態(tài)的。
應(yīng)用程序通過將對(duì)象聚合到分區(qū)中,并僅更新那些已更改的對(duì)象來節(jié)省開銷。

例如,游戲可以將靜態(tài)游戲世界的各個(gè)部分放入所屬的分區(qū)中,同時(shí)將動(dòng)態(tài)對(duì)象分離到每幀重建的“全局分區(qū)”中。與傳統(tǒng)的TLAS相比,請(qǐng)求的分區(qū)更新越少,節(jié)省的運(yùn)行時(shí)開銷就越大。
另外好消息是,RTX Mega Geometry可通過底層API進(jìn)行擴(kuò)展支持,適用于所有支持光線追蹤的NVIDIA GPU,也就是從圖靈架構(gòu)(Turing)開始。

不過Blackwell的第4代RT Core是專門為RTXMega Geometry而設(shè)計(jì)的,硬件中的特殊集群引擎實(shí)現(xiàn)了幾何和BVH數(shù)據(jù)的新壓縮方案,同時(shí)是第3代RT Core光線三角形相交率的2倍。因此,Blackwell架構(gòu)可以實(shí)現(xiàn)用更小的顯存,更高效的處理這些內(nèi)容。
Linear Swept Spheres (LSS)
LSS(線性掃描球體)是Blackwell架構(gòu)中新增的圖形語言,它極大地簡(jiǎn)化了復(fù)雜頭發(fā)和毛發(fā)的渲染開銷,并能提升質(zhì)量。

此前渲染頭發(fā)仍然需要最基礎(chǔ)的三角形來表達(dá)物體,如圖所示,發(fā)絲中的一個(gè)線段需要6個(gè)三角形,而一根頭發(fā)便需要無數(shù)個(gè)三角形來確保其精度。比如我們的頭發(fā)則需要600萬個(gè)三角形來表達(dá)。

Blackwell架構(gòu)的RT Core引入了LSS新語言的支持,它類似于鑲嵌曲線,允許靈活地近似各種鏈型。并且球體也更適合發(fā)行構(gòu)建。
LSS的引入可以讓發(fā)型構(gòu)建,減少3倍的數(shù)據(jù)量,速度大約快了2倍,并可以使用更少的顯存,獲得更高的幀數(shù)。
Blackwell 第5代Tensor Core
本代架構(gòu)除了RT Core進(jìn)行了改進(jìn)升級(jí),專門負(fù)責(zé)AI及高性能計(jì)算的Tensor Core也迎來了重大升級(jí)。
與NVIDIA Ada Tensor Cores一樣,Blackwell架構(gòu)的Tensor Cores支持FP16、BF16、TF32、INT8、INT4和Hopper的FP8 Transformer Engine。
Blackwell還增加了對(duì)FP4和FP6 Tensor Core操作的新支持,以及新的第二代FP8 Transformer Engine。
FP4精度支持
FP4提供了一種較低的量化方法,類似于文件壓縮,可以減小模型大小,提升生成速度。與FP16精度(大多數(shù)型號(hào)發(fā)布的默認(rèn)方法)相比,F(xiàn)P4只需要不到一半的顯存。FP4使用NVIDIA TensorRT提供的量化方法,幾乎沒有質(zhì)量損失。

例如,目前最強(qiáng)的AI繪畫模型FLUX.dev ,在FP16上需要超過23GB的顯存,而這意味著它只能由每一代的期間產(chǎn)品RTX 4090,RTX 5090和專業(yè)GPU來支持。
而對(duì)于FP4,F(xiàn)LUX.dev測(cè)試對(duì)顯存的需求將少于10GB,讓更多80級(jí)和70級(jí)的顯卡均能在本地運(yùn)行。

在性能和效果對(duì)比上,使用帶有FP16的RTX 4090,F(xiàn)LUX.dev模型可以通過30個(gè)步驟在15秒內(nèi)生成圖像。使用帶有FP4的RTX 5090,只需5秒多一點(diǎn)就可以生成圖像。
DLSS 4
DLSS 4是本代RTX 50系顯卡帶來的重大更新,對(duì)于玩家來說它也是最能實(shí)際感受到的。最新版本DLSS 4帶來了新的多幀生成(MFG),具有更快的性能和更低的顯存使用等特性。包含超分辨率(SR),光線重建(RR)和深度學(xué)習(xí)抗鋸齒(DLAA)模型,可進(jìn)一步增強(qiáng)圖像質(zhì)量和穩(wěn)定性。

這些新技術(shù)由RTX 50系GPU和第5代Tensor Cores支持,并由云端的NVIDIA Al超級(jí)計(jì)算機(jī)提供支持。不過對(duì)于手持RTX 40系或更早期顯卡的玩家還無緣體會(huì)。DLSS 4新增的多幀生成,目前僅支持RTX 50系顯卡。
Multi Frame Generation(多幀生成)
DLSS多幀生成能夠通過每個(gè)傳統(tǒng)渲染幀,生成多達(dá)三幀的額外幀來提高FPS。新的幀生成AI模型相比之前的幀生成方法快40%,使用的顯存減少30%,并且每個(gè)渲染幀只需要運(yùn)行一次就可以生成多個(gè)幀。高效的AI模型代替了上一代的硬件光流模型,從而加快了光流場(chǎng)的生成速度,并顯著降低了生成額外幀的計(jì)算成本。


從生成幀的層面來說,上一代DLSS 3幀生成基于CPU的幀節(jié)奏,而這種方式可能會(huì)讓生成的幀與額外的幀混合在一起,導(dǎo)致每幀之間的幀節(jié)奏不太一致,影響平滑性。
為了解決生成多幀的復(fù)雜性,Blackwell架構(gòu)將幀節(jié)奏邏輯轉(zhuǎn)移到顯示引擎,使GPU能夠更精確地管理顯示時(shí)序,從而避免與額外幀混合的情況,進(jìn)而提升幀生成的準(zhǔn)確性及穩(wěn)定性。

而第5代Tensor Cores擁有更高的計(jì)算能力,這使得它們能夠更快地執(zhí)行計(jì)算光流和生成多幀的一系列AI模型。并更好地調(diào)度DLSS AI處理、圖形渲染和幀速度算法。
Transformer模型
此前DLSS所用的模型為Convolutional Neural Network,即我們熟悉的卷積神經(jīng)網(wǎng)絡(luò)(CNN),CNN的工作原理是將像素局部聚集在一起,并以樹的形式從低到高地進(jìn)行分析數(shù)據(jù)。這種結(jié)構(gòu)的計(jì)算效率很高,這也是為什么它被稱為卷積神經(jīng)網(wǎng)絡(luò)。

而DLSS 4引入了基于Transformer的AI模型,用于DLSS超分辨率、DLSS光線重建和深度學(xué)習(xí)抗鋸齒(DLAA),從而提高圖像質(zhì)量和渲染平滑度?;赥ransformer模型體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò),擅長(zhǎng)處理涉及順序和結(jié)構(gòu)化數(shù)據(jù)的任務(wù)。簡(jiǎn)單來說,就是Transformer能夠抓住“重點(diǎn)”,可以更好地理解和渲染復(fù)雜場(chǎng)景。

與CNN模型相比,Transformer更容易在更大的像素窗口中識(shí)別更遠(yuǎn)距離的模式,具有一定的學(xué)習(xí)能力和“前瞻性”。
本代DLSS 4將基于CNN的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),轉(zhuǎn)變?yōu)榛赥ransformer的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),在許多場(chǎng)景下圖像質(zhì)量都有著顯著提升。
Shader Execution Reordering (SER) 2.0
Shader Execution Reordering(著色器重排序)是在RTX 40系架構(gòu)中引入的一項(xiàng)技術(shù),它可以使帶有光追的程序有效地重組GPU上的大量并行線程,以最大限度地利用硬件。

因?yàn)檫B貫執(zhí)行神經(jīng)工作負(fù)載的線程可以直接發(fā)送到Tensor Core,所以SER也顯著加速了神經(jīng)著色。在Blackwell架構(gòu)中,SER的核心重排序邏輯效率是原來的兩倍,減少了重排序開銷并提高了精度。從而進(jìn)一步提高了該功能的有效性。這項(xiàng)功能更多地是為應(yīng)用程序開發(fā)者而設(shè)計(jì),它僅需一個(gè)小的API改動(dòng),即可執(zhí)行重排序操作,進(jìn)而提升總體項(xiàng)目的負(fù)載性能。
測(cè)試平臺(tái)簡(jiǎn)介
首先介紹一下測(cè)試平臺(tái),為了保障AORUS Geforce RTX 5080 MASTER 16G的性能發(fā)揮,我們的平臺(tái)也再次進(jìn)行了全面更新。

除了AORUS Geforce RTX 5080 MASTER 16G這張顯卡,處理器選擇了AMD R7 9800X3D游戲神U。
為了方便觀察DLSS 4在畫質(zhì)上的提升和4K高幀率帶來的游戲變化。我們選擇了技嘉FO32U2P OLED顯示器,這款顯示器采用了4K@240Hz的高分高刷規(guī)格,可完美適配DLSS 4的多幀生成。而99%的DCI-P3色域覆蓋,更可細(xì)致入微地觀察Transformer模型帶來的細(xì)節(jié)提升。

本次RTX 50系顯卡采用了帶寬速率更高的PCIe5.0x16,應(yīng)用于顯卡的PCIe5.0x16帶寬速度高達(dá)128GB/s,用于固態(tài)硬盤的PCIe5.0x4也高達(dá)32GB/s,致態(tài)TiPro9000,實(shí)測(cè)順序讀寫速度高達(dá)14526.95MB/s和13869.24MB/s,達(dá)到“滿血”級(jí)別,可大幅提升操作系統(tǒng)/大型游戲/創(chuàng)作軟件的響應(yīng)和加載速度。

首先看一下GPU-Z的參數(shù),最新的2.62版本已經(jīng)能夠識(shí)別GPU信息。AORUSGeforce RTX 5080 MASTER 16G采用GB203核心,采用與上一代相同的TSMC 4nm定制工藝(TSMC 4nm 4N NVIDIACustomProcess),芯片面積378mm2,相比于RTX 5090的750mm2小了一半。值得注意的是,在RTX 50系顯卡中,使用了PCIE×165.0帶寬。
顯卡擁有10752個(gè)CUDA,Boost頻率達(dá)到了2805MHz,相比公版的2617MHz,提升非常大。采用16GB GDDR7顯存,位寬為256bit,實(shí)際的顯存帶寬達(dá)到了960 GB/s,光柵單元和紋理單元為112/336。
理論性能測(cè)試
下面先進(jìn)行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:

在針對(duì)顯卡DX11性能的3DMARK FS套裝測(cè)試中,AORUS Geforce RTX 5080 MASTER 16G的提升對(duì)比RTX 4080 SUPER,在三檔分辨率中的提升分別為,15%/24%/26%,綜合提升約為22%。

而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,AORUS Geforce RTX 5080 MASTER 16G相較RTX 4080 SUPER的提升分別為:TS提升18%;TSE提升18%,綜合提升約為18%。

PortRoyal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng),AORUS Geforce RTX 5080 MASTER 16G相較RTX 4080 SUPER的提升約為26%。
綜合來看,AORUS Geforce RTX 5080 MASTER 16G的理論性能相較RTX 4080 SUPER的提升約為22%。
下面我們?cè)賮砜纯?DMARK中新增的一些具體應(yīng)用場(chǎng)景的測(cè)試。

Speed Way這項(xiàng)測(cè)試結(jié)合了實(shí)時(shí)光線追蹤和傳統(tǒng)渲染技術(shù)來測(cè)量顯卡性能。場(chǎng)景含有光線追蹤反射、實(shí)時(shí)全局光照、網(wǎng)格著色器、體積照明、粒子和后處理效果。所以SW的測(cè)試基本可以看做次世代3A游戲基準(zhǔn)。
AORUS Geforce RTX 5080 MASTER 16G對(duì)比RTX 4080 SUPER,提升為25%。

在DLSS的理論測(cè)試中,有著較大變化,共分為兩種模型。DLSS 2及DLSS 3采用上一代的CNN模型,而最新的多幀生成,則采用了Transformer模型,并且多幀生成可調(diào)節(jié)生成幀的數(shù)量。
從測(cè)試結(jié)果來看,DLSS 4 2X基本可以看作是DLSS 3的幀生成,而相比上一代DLSS 3,DLSS 4 4X模式下,幀數(shù)綜合提升在75%左右,其中在4K和8K提升非常大,在79%左右。而8K分辨率,80及顯卡也是史無前例的達(dá)到163幀的成績(jī)。
通過DLSS的理論測(cè)試,不難發(fā)現(xiàn)8K高刷對(duì)于RTX 50系顯卡來說早已不是觸不可及的目標(biāo),而在4K分辨率下,更是突破目前旗艦顯示器的上限,達(dá)到306幀。
下面我們先實(shí)際測(cè)試DLSS 4在游戲中的表現(xiàn)如何,能否達(dá)到理論測(cè)試的提升效果。
DLSS 4性能測(cè)試
本次DLSS 4在解禁首日,便可支持75款游戲或應(yīng)用。除了游戲中首發(fā)支持外,對(duì)于尚未集成的游戲,可在NVIDIA app中進(jìn)行直接調(diào)節(jié)非常方便。

在DLSS 4的測(cè)試中,首先來看《賽博朋克2077》,目前該游戲隨著RTX 50系顯卡的性能解禁,也已經(jīng)更新了DLSS 4,如果首發(fā)買了顯卡,也可自行測(cè)試一番。
《賽博朋克2077》
下面的測(cè)試中我們會(huì)進(jìn)行多角度對(duì)比,來看看不同DLSS的設(shè)置下,三檔畫質(zhì)的幀數(shù)表現(xiàn)。

在所有測(cè)試中,為保證縮放比例固定,我們均選擇在DLSS 質(zhì)量模式下進(jìn)行。
傳統(tǒng)DLSS 2的測(cè)試中,使用CNN模型DLSS,可以看到即便是AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下,光追超級(jí)畫質(zhì)也僅有69幀,而在光追超速模式下為43幀,無法做到流暢運(yùn)行。

DLSS 3的測(cè)試依然為CNN模型,增加幀生成??梢钥吹紻LSS 3已經(jīng)可以大幅提升幀數(shù),相較DLSS 2,在4K超級(jí)畫質(zhì)/光追超級(jí)/光追加速 的提升分別為63%/62%/70%,綜合提升65%。

在DLSS 4的測(cè)試中,模型更改為Transformer,開啟多幀生成,首先測(cè)試3X下的表現(xiàn)。
AORUS Geforce RTX 5080 MASTER 16G在4K超級(jí)畫質(zhì)/光追超級(jí)/光追加速中,相較DLSS 3幀生成的提升分別為27%/37%/42%,將幀率再次拉至新高度,即便在光追超級(jí)畫質(zhì)下,也能達(dá)到153幀的電競(jìng)級(jí)幀率。
另外注意,在1080p分辨率的超級(jí)畫質(zhì)中,已經(jīng)達(dá)到了驚人的477幀!雖然僅僅是超級(jí)畫質(zhì),但這依然是標(biāo)準(zhǔn)的3A游戲《賽博朋克2077》。

DLSS 4最后的測(cè)試為Transformer模型4X幀生成模式,在4K超級(jí)畫質(zhì)/光追超級(jí)/光追加速中,相較DLSS 4的3X幀生成的提升分別為26%/26%/29%,即便在光追加速畫質(zhì)中,此時(shí)光追加速畫質(zhì)也已經(jīng)來到了127幀。
除了幀數(shù)上的提升,DLSS 4對(duì)于畫質(zhì)表現(xiàn)如何,下面我們來看看實(shí)機(jī)截圖對(duì)比。

可以看到在采用Transformer模型的DLSS 4中,物體表面的紋理細(xì)節(jié)更清晰。即便是沒有模型面覆蓋的銹跡,DLSS 4依然能精準(zhǔn)還原。

同理,墻上的裂紋在DLSS 4中有更明顯的痕跡。并且整體畫面相較于DLSS 3,更通透明亮。大家也可下載4K圖片自行比對(duì)。
《漫威爭(zhēng)鋒》
《漫威爭(zhēng)鋒》是近期大火的FPS+MOBA類網(wǎng)游,最初被看作《守望先鋒》的替代品,但實(shí)際游玩效果,無論畫面還是玩法,都更勝一籌。
截至目前,Steam已經(jīng)有超過18萬評(píng)價(jià),整體為特別好評(píng)。而且《漫威爭(zhēng)鋒》是免費(fèi)網(wǎng)游,大家下載嘗鮮DLSS 4。

對(duì)于一款競(jìng)技網(wǎng)游來說,高幀率比畫面更重要,使用AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下,DLSS 2質(zhì)量模式已經(jīng)能夠達(dá)到114幀的高幀率。

在4K分辨率下的DLSS 3幀生成模式中,相比DLSS 2在質(zhì)量模式中提升了31%,達(dá)到149幀的電競(jìng)級(jí)幀率。

而在DLSS 4 4X多幀生成中,4K分辨率相比DLSS 3質(zhì)量模式再提升89%,達(dá)到281幀。至于大部分超高刷的1080p FPS電競(jìng)顯示器,544幀也已經(jīng)完全能夠頂格跑滿了。

在畫面對(duì)比中,DLSS 4 4X的四檔畫質(zhì)也很難看出區(qū)別,角色的頭發(fā)、衣服,遠(yuǎn)處的建筑涂繪,基本都和原生畫質(zhì)分毫不差。
《霍格沃茲之遺》

《霍格沃茲之遺》同樣新增了對(duì)DLSS 4的支持,測(cè)試分為超高畫質(zhì),與打開光追后的超高畫質(zhì)兩種參數(shù)。在無光追的情況下,AORUS Geforce RTX 5080 MASTER 16G運(yùn)行這款游戲毫無壓力,即便均為DLSS質(zhì)量模式下,4K DLSS 4 4X模式也有347幀。

打開光追后,這款游戲?qū)τ谂渲靡蠹ぴ?,不過可以看到在1080p分辨率下與2K分辨率幀數(shù)基本相同,應(yīng)該是低分辨率下優(yōu)化尚存在問題。

打開光追后,雖然對(duì)于配置要求激增,但同樣畫面表現(xiàn)有著明顯區(qū)別,其中最明顯的則是水體,能夠明顯看出隨著深度不同,水體顏色的變化。

另外光線重建則能夠修復(fù)一些畫面的細(xì)節(jié)表現(xiàn),比如圖中圈出的部位,開啟光線重建后,建筑的光影層次更分明。
《Alan Wake 2》
在《Alan Wake 2(心靈殺手2)》的測(cè)試中,我們選擇默認(rèn)高畫質(zhì),不過可以注意到并非所有選項(xiàng)都開至最高,如體積光和體積聚光燈質(zhì)量。

《Alan Wake 2(心靈殺手2)》是被譽(yù)為次世代最強(qiáng)畫面的游戲,對(duì)于配置需求極高,但同時(shí)畫面表現(xiàn)堪稱完美。AORUS Geforce RTX 5080 MASTER 16G在不開啟光追的情況下,4K分辨率DLSS 4 4X 質(zhì)量模式下,可達(dá)250幀左右。

而在開啟光追極致畫面后,即便有著DLSS 4多幀生成的加持,AORUS Geforce RTX 5080 MASTER 16G也只有114幀左右。


《Alan Wake 2》整體畫面較為昏暗,但光影氛圍刻畫非常到位。在開啟光追后,陰影的表現(xiàn)更清晰,更符合真實(shí)的物理表現(xiàn),同時(shí)水體與《霍格沃茲之遺》相同,均能夠表現(xiàn)出水潭的深淺,相比原生畫質(zhì),游戲的代入感更強(qiáng)。
常規(guī)游戲性能測(cè)試
除了支持DLSS 4的游戲,我們同樣測(cè)試了一些主流的3A大作和支持DLSS 3的游戲,為更多玩家提供參考方向。

《黑神話:悟空》是一款婦孺皆知的國(guó)產(chǎn)虛幻5巨制,自帶DLSS 3幀生成。我們的兩項(xiàng)測(cè)試也全部開啟幀生成,均為影視級(jí)畫質(zhì)。實(shí)測(cè)AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下最高已經(jīng)達(dá)到了133幀。

在《黑神話:悟空》中,開啟全景光追后,部分幀數(shù)反而更高,這一問題至少目前在benchmark中并未修復(fù)。
從AORUS Geforce RTX 5080 MASTER 16G這張卡的實(shí)測(cè)結(jié)果來看,4K分辨率下開關(guān)光追在超級(jí)性能模式中幀數(shù)差別不大,而從我們此前的測(cè)試來看,使用虛幻5引擎的《黑神話:悟空》不同DLSS檔位下的畫質(zhì)幾乎沒有差距。
如果扔想獲得比較高的畫質(zhì),可以選擇性能模式游玩,對(duì)于很多風(fēng)景黨來說,可既享受高幀率的同時(shí),又不損失畫質(zhì)。

《燕云十六聲》是網(wǎng)易開發(fā)的一款國(guó)產(chǎn)武俠大作,在DLSS 2的測(cè)試中,2K與4K的成績(jī)幾乎完全相同。這絕對(duì)是目前游戲優(yōu)化尚不完善,至少在低分辨率下AORUS Geforce RTX 5080 MASTER 16G的表現(xiàn)應(yīng)該更好。

而在DLSS 3的測(cè)試中,仍然出現(xiàn)了DLSS 2中的問題。不過在4K分辨率下AORUS Geforce RTX 5080 MASTER 16G大部分DLSS成績(jī)均在200幀左右徘徊,超級(jí)性能更是達(dá)到了231幀。

近來同樣大火的《三角洲行動(dòng)》測(cè)試中,DLSS 2的優(yōu)化同樣有些問題。不過AORUS Geforce RTX 5080 MASTER 16G在4K分辨率DLSS質(zhì)量模式下,達(dá)到172幀的電競(jìng)級(jí)幀率,性能模式更是達(dá)到206幀。

加入幀生成的測(cè)試后,低分辨率下的幀數(shù)表現(xiàn)恢復(fù)了正常。并且AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下的成績(jī),均在200幀以上。不管是大戰(zhàn)場(chǎng)還是戰(zhàn)役,都無足為懼。


《地平線5》也是顯卡測(cè)試的常駐游戲,其憑借出色的優(yōu)化,在原生效果下即可跑出優(yōu)秀的成績(jī)。AORUS Geforce RTX 5080 MASTER 16G在DLSS 3 4K分辨率下再創(chuàng)新高,達(dá)到194幀的成績(jī)。

在《刺客信條:幻景》中,我們關(guān)閉游戲的自適應(yīng)幀率,分別測(cè)試DLSS不同擋位與原生畫質(zhì)下的差異。
AORUS Geforce RTX 5080 MASTER 16G在4K分辨率原生畫質(zhì)下即可達(dá)到百幀的成績(jī),而在DLSS超級(jí)性能擋位中,達(dá)到185幀。

在《無主之地3》中,AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分別為:1080p提升5%;2K提升11%;4K提升19%,綜合提升12%。在純光柵化游戲幀數(shù)對(duì)比中,《無主之地3》比較能概括RTX 5080與RTX 4080 SUPER的光柵化性能的綜合差距。

《光明記憶:無限》的光追測(cè)試軟件是獨(dú)立于游戲的測(cè)試工具,比游戲中用到的光線追蹤技術(shù)更多,雖然游戲較老,但對(duì)于性能要求卻非常高,本次測(cè)試條件為“RTX最高/DLSS質(zhì)量”。
性能方面,AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分別為:1080p提升14%;2K提升18%;4K提升21%,綜合提升18%。
專業(yè)軟件測(cè)試
本代RTX 5080擁有16GB的顯存,而且新架構(gòu)對(duì)于內(nèi)容創(chuàng)作軟件同樣有優(yōu)化,下面我們分別測(cè)試了不同類別的專業(yè)軟件,來看看實(shí)際效果。
V-Ray6
V-Ray6對(duì)于GPU的測(cè)試分為RTX與CUDA,這里主要看RTX成績(jī),其中RTX測(cè)試相比RTX 4080 SUPER(7047)首測(cè)時(shí)提升35%左右。
UL Procyon


本次測(cè)試UL提供了FLUX.1 Dev繪畫模型的FP4測(cè)試,該模型在FP16上運(yùn)行需要超過23GB的顯存,而這意味著它只能由每一代的期間產(chǎn)品RTX 4090,RTX 5090和專業(yè)GPU來支持。但FP4只需要不到一半的顯存。而且FP4使用NVIDIA TensorRT提供的量化方法,幾乎沒有質(zhì)量損失。更小的顯存消耗讓更多80級(jí)和70級(jí)的顯卡均能在本地運(yùn)行。
Blackwell架構(gòu)新的Tensor Core特性不僅讓生成所需的顯存顯著減少,在生成時(shí)間也有大幅降低,平均4張圖片即可節(jié)省20秒時(shí)間。

FP4渲染生成圖片

FP8渲染生成圖片
在結(jié)果對(duì)比中,F(xiàn)P8和FP4所生成的圖片效果是相同的,在細(xì)節(jié)和圖片精度上均有著良好表現(xiàn)。
Keyshot 2024

Keyshot是一款專注于模擬光線追蹤的渲染軟件,并可分別調(diào)用CPU或GPU進(jìn)行渲染,下面我們看下最終的渲染時(shí)間和結(jié)果。

使用AORUS Geforce RTX 5080 MASTER 16G渲染一張4K分辨率,采樣率為1000的圖片,最終用時(shí)99秒左右。

而使用CPU渲染(AMD R7 9800X3D),則需要1小時(shí)35分鐘左右。并且從圖片細(xì)節(jié)來看,兩種渲染方式幾乎沒有不同。所以GPU對(duì)于內(nèi)容創(chuàng)作者來說,效率的提升是不言而喻的。
NVIDIA Broadcast
NVIDIA Broadcast是一款用于直播或會(huì)議的AI軟件,目前隨著RTX 50系的發(fā)布,也進(jìn)行了版本更新。

新版NVIDIA Broadcast界面更小巧,縱向布局也更方便視頻直播中調(diào)節(jié)選項(xiàng)。

NVIDIA Broadcast一些經(jīng)典效果更方便開啟,其中目光接觸功能非常適合遠(yuǎn)程會(huì)議,即便眼睛盯著屏幕,也能讓參與人員時(shí)刻注意到你的眼睛,并且還有一定“大眼”效果。

虛擬補(bǔ)光仍是測(cè)試版功能,它可以在光線較暗的情況下進(jìn)行面部的AI補(bǔ)光,看你看起來仍然處于光線較好的環(huán)境中。

在新的NVIDIA Broadcast中,還增加了GPU利用率的顯示,當(dāng)軟件中功能全部打開時(shí),對(duì)于GPU的占用率還是非常高的,比較適合會(huì)議等不需要過多GPU參與的場(chǎng)景。而如果是游戲直播,則可適當(dāng)關(guān)閉AI效果,以降低GPU利用率。
不過目前新版NVIDIA Broadcast仍處于測(cè)試階段,實(shí)際效果與GPU開銷應(yīng)以正式版為準(zhǔn)。
NVIDIA App
新版的NVIDIA app代替了原來的GFE軟件,并且功能更強(qiáng)大,使用起來也更方便。最主要的是,它不用登陸了,即下即用。

在NVIDIA app首頁(yè)除了顯示最新的驅(qū)動(dòng)信息,還新增了NVIDIA周邊軟件的下載,比如AI繪畫Canvas;圖像視頻對(duì)比工具ICAT;性能測(cè)試工具FrameView等等,不用再去NVIDIA官網(wǎng)尋找。

從APP中強(qiáng)制開啟DLSS 4的功能上面已有介紹,不過目前并不是所有游戲和軟件均支持此功能。

系統(tǒng)界面中則更多的是調(diào)試類功能,如顯示器、視頻、超頻等。

其中性能界面提供了較為詳細(xì)的監(jiān)控和超頻選項(xiàng),需要注意的是新手如果想嘗試超頻,盡量不要改變電壓,這個(gè)選項(xiàng)輕則掉驅(qū)動(dòng),重則燒毀顯卡。
另外玩家可放心大膽地使用NVIDIA app中的性能自動(dòng)調(diào)優(yōu)功能,經(jīng)過NVIDIA反復(fù)驗(yàn)證過的參數(shù)都是在安全范圍內(nèi),并且出現(xiàn)問題的話,這張卡仍然具備保修資格。

NVIDIA信息浮窗是游戲中很好的輔助工具,要開啟此功能,需要在APP主界面的設(shè)置一欄中,開啟按鈕,之后按【ALT+Z】即可呼出邊欄。

按【ALT+R】可呼出統(tǒng)計(jì)數(shù)據(jù)的浮窗,功能設(shè)置和自由度的調(diào)節(jié)也非常豐富,最主要的是相當(dāng)簡(jiǎn)便。
功耗及溫度測(cè)試
功耗測(cè)試中,我們選擇FurMark2軟件進(jìn)行拷機(jī)測(cè)試,并采用AIDA64檢測(cè)信息。

FurMark軟件截至目前,尚無法檢測(cè)到GPU信息,部分溫度識(shí)別有誤。我們主要看藍(lán)色的AIDA64信息。AORUS Geforce RTX 5080 MASTER 16G在1小時(shí)左右的烤機(jī)測(cè)試中GPU溫度為71℃;顯存溫度為70℃。另外可以看到在TDP 100%的滿載情況下,整卡功耗為360W。

除了滿載烤機(jī),我們也實(shí)測(cè)了游戲中顯卡的真實(shí)數(shù)據(jù)表現(xiàn)。測(cè)試選擇《賽博朋克2077》benchmark,4K分辨率下光追加速畫質(zhì),并開啟DLSS 4 4X多幀生成,將顯卡性能拉滿??梢钥吹紸ORUS Geforce RTX 5080 MASTER 16G的平均功耗為328W。

進(jìn)行功耗檢測(cè)的同時(shí),我們也調(diào)出了延遲數(shù)據(jù),在DLSS 4 4X多幀生成的環(huán)境下,游戲平均延遲為63ms左右。證明即便有多張AI生成幀參與到游戲中,我們依然能獲得比較“跟手”的操作體驗(yàn)。
DLSS 4讓幀數(shù)突破顯示極限!
在RTX 50系NVIDIA Blackwell架構(gòu)中,大家可以明顯感受到內(nèi)部結(jié)構(gòu)的調(diào)整,不僅僅是簡(jiǎn)單的CUDA數(shù)量增加、FP算力增強(qiáng)。NVIDIA讓更多的計(jì)算單元或引擎,均開始為AI“服務(wù)”,讓算力成為AI模型的后盾。這一點(diǎn)其實(shí)與此前所有的GPU均不同,包括NVIDIA自己的RTXGPU。
如果說RTX 30系和RTX40系顯卡是靠硬件算力來推動(dòng)AI工作,那么RTX 50系顯卡的硬件算力則成為了AI應(yīng)用的“保障性”條件,一切的改變都是為了讓AI有更充足的“后盾”。而相輔相成的,AI技術(shù)的應(yīng)用,也讓計(jì)算有了更低的開銷。

其中最顯著的就是DLSS 4的多幀生成,在仍保持較低延遲的體驗(yàn)中,幀數(shù)能夠提升數(shù)倍。本次DLSS 4之所以有如此大的改變,除了架構(gòu)本身的變動(dòng),另一方面則是從CNN替換到Transformer模型,讓AI從中發(fā)揮更多作用,不再只是單純的計(jì)算,更利用AI的長(zhǎng)處,做到宏觀把控,進(jìn)一步增強(qiáng)生成幀的穩(wěn)定性和質(zhì)量。
并且從長(zhǎng)遠(yuǎn)來看,后續(xù)70和60級(jí)別的產(chǎn)品,憑借DLSS 4的多幀生成,都可以做到暴力的越級(jí)體驗(yàn)。讓主流顯卡體驗(yàn)2K或4K高幀游戲不再是夢(mèng)想。
而從顯示器行業(yè)的角度來說,過去高分高刷顯示器的性能嚴(yán)重過剩,幾乎沒有游戲能碰到上限。但隨著DLSS 4的推出也鞭策著顯示器行業(yè)有了更大的進(jìn)步空間。至少?gòu)睦碚摐y(cè)試來看,8K 150幀已經(jīng)不是問題了。

除了游戲方面,F(xiàn)P4運(yùn)算的引入,也讓內(nèi)容創(chuàng)作進(jìn)一步提速。更少的顯存需求、更快的運(yùn)算速度,以及無可挑剔的生成質(zhì)量,都可以讓過去常規(guī)的任務(wù),提速增量。而對(duì)于規(guī)模更大的項(xiàng)目,也讓不可能變?yōu)榭赡堋?/p>
本次評(píng)測(cè)的AORUS Geforce RTX 5080 MASTER 16G是技嘉旗艦系列顯卡,坦白講,外觀設(shè)計(jì)相比RTX 40系順眼了許多,雖然仍然都是黑色,但整體的層次感和小裝飾,起到了畫龍點(diǎn)睛的作用。

另外則是隨卡附帶的散熱風(fēng)扇,雖然此前也有類似的設(shè)計(jì),但更多的還是裝飾意義較大。而AORUSGeforce RTX 5080 MASTER 16G這個(gè)散熱風(fēng)扇則是實(shí)打?qū)嵉暮糜?。滿載烤機(jī)溫度59℃,對(duì)于一張RTX 5080而且是高頻率的顯卡來說,簡(jiǎn)直是奇跡。通常只有采用水冷散熱才能達(dá)到這個(gè)效果。
可能有玩家會(huì)覺得,這個(gè)風(fēng)扇裝上去沒有那么美觀,但它方便的地方就在于可以隨時(shí)拆卸,而且風(fēng)扇針腳和燈光針腳都可以熱插拔,日常使用高溫的情況下救急也是非常方便的。
本次評(píng)測(cè)的AORUS Geforce RTX 5080 MASTER 16G顯卡已經(jīng)在技嘉各大官方電商有售,想率先體驗(yàn)DLSS 4的爆炸性能,可以關(guān)注一下。
相關(guān)文章

DLSS 4再次定義電子游戲! NVIDIA GeForce RTX 5080 FE顯卡評(píng)測(cè)
RTX 5080卻是有著NVIDIA自家推出的 Founders Edition公版設(shè)計(jì)產(chǎn)品,而且這次的Founders Edition設(shè)計(jì)非常精湛,稱其為工業(yè)藝術(shù)品也毫不為過,下面我們就來看看詳細(xì)測(cè)評(píng)2025-02-14
DLSS 4大力水手更猛了! iGame GeForce RTX 5080 Ultra W OC 16GB評(píng)測(cè)
今天我們來看看七彩虹 iGame GeForce RTX 5080 Ultra W OC 16GB顯卡,帶著對(duì)于RTX 50系顯卡性能與游戲表現(xiàn)的好奇,搶先幫大家測(cè)試了一波,如果你也對(duì)RTX 5080感興趣,可以2025-02-14
黑金設(shè)計(jì)搭配 DLSS 4! 影馳GeForce RTX 5080魔刃顯卡評(píng)測(cè)
今天,我們就將目光投向影馳 GeForce RTX 5080 魔刃顯卡,這款顯卡定位 RTX 50 系列中的中高端市場(chǎng),下面我們就來看看詳細(xì)測(cè)評(píng)2025-02-11
經(jīng)典性價(jià)比次旗艦乘上DLSS 4東風(fēng)! 耕升 GeForce RTX 5080 追風(fēng)顯卡評(píng)測(cè)
耕升推出了新一代GeForce RTX 50系列產(chǎn)品,包括炫光、踏雪、追風(fēng)等系列,今天我們就來看看追風(fēng)顯卡性能測(cè)評(píng)2025-02-11
DLSS 4性能全力沖鋒! 耕升RTX5080炫光OC顯卡拆解超頻測(cè)試
繼GeForce RTX 5090 D之后,RTX 5080也相約面世,在這里要為大家推薦的是來自耕升的玩燈高手——GeForce RTX 5080炫光OC2025-02-08
GeForce RTX 5080和RTX 4090誰是顯卡之王? 7款游戲性能實(shí)測(cè)
RTX 5080上市后,性能備受關(guān)注,它和上一代旗艦RTX 4090誰更強(qiáng)?一種論調(diào)聲稱其性能非常炸裂,另外一種論調(diào)聲稱其性能提升幅度并不大,下面我們就來看看實(shí)際測(cè)評(píng)2025-02-08
DLSS4開啟電競(jìng)級(jí)3A新時(shí)代 技嘉RTX 5080 AERO雪鷹顯卡全面評(píng)測(cè)
作為全球一線板卡廠商的技嘉,為玩家們推出了超級(jí)雕(黑/白)、魔鷹、雪鷹和風(fēng)魔、等一系列產(chǎn)品線的旗艦顯卡,今天我們就來看看RTX 5080 AERO雪鷹顯卡測(cè)評(píng)2025-02-08








