DLSS 4讓幀數(shù)突破顯示極限! 技嘉RTX 5080超級雕顯卡評測
完整的GB202核心包含192個SM單元,每個SM包含128個CUDA核心;1個第4代RT Core;4個第5代Tensor Core;4個紋理單元。1個256KB的寄存器文件和128KB的L1共享緩存,它可以根據(jù)圖形和計算工作負載的需要配置不同的大小。

在Blackwell架構(gòu)的SM單元中,INT32整數(shù)運算的數(shù)量增加了一倍。與Ada架構(gòu)的SM單元相比,實現(xiàn)了INT32與FP32內(nèi)核的完全統(tǒng)一。不過在時鐘周期內(nèi),統(tǒng)一內(nèi)核只能作為FP32或INT32內(nèi)核運行。

與Blackwell架構(gòu)一同推出的還有GDDR7顯存,采用pam3信號技術(shù),它有著更高頻率與更低電壓的特點。
本代RTX 5090配備28 Gbps GDDR7顯存,峰值顯存帶寬可達1792GB/s/秒,而RTX 5080配備更高的30 Gbps時鐘頻率的GDDR7顯存,峰值內(nèi)存帶寬可達960 GB/秒。結(jié)合新的引腳編碼方案,GDDR7實現(xiàn)了顯著增強的信噪比(SNR)。
通過增加信道密度、改進的pam3信噪比、先進的均衡方案、重新設(shè)計的時鐘架構(gòu)和增強的I/O訓練,GDDR7提供了更高的帶寬。這些進步還顯著提高了能源效率,提供了更好的性能和延長電池壽命,特別是在移動端,或功率受限的系統(tǒng)中。
Blackwell 第4代RT Core
在第4代RT Core中,簡單來說它相比Ada架構(gòu),在渲染光線追蹤場景時,提供了兩倍光線三角形相交測試吞吐量,并引入了Mega Geometry的結(jié)構(gòu)算法。

Opacity Micromap Engine
不透明微引擎在Ada架構(gòu)中已經(jīng)引入,這里不再過多講述,它主要的作用是優(yōu)化光線追蹤渲染,可大幅減輕著色器的工作負擔。
比如樹葉之類的復雜物體,不同的光線都會影響它的表現(xiàn)狀態(tài),以及樹葉之間的光線反彈,所以對于光線追蹤的計算量是巨大的。

不過Opacity Micromap Engine可以將光線追蹤特性烘焙到不透明蒙版中,所以那些不規(guī)則形狀和半透明的對象,也就能夠更快更精準的渲染出來,從而極大減輕著色器的工作負擔。
RTX Mega Geometry
除了上面提到的Opacity Micromap Engine,在BlackWell架構(gòu)中,還引入了Mega Geometry(大型幾何)的運算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

新的Blackwell RT核心包含一個Triangle ClusterIntersection Engine三角形群集交集引擎,它能夠進一步加速大型幾何的光線追蹤,同時它的工作還包含標準的光線三角形交集測試。Linear Swept Spheres則主要用于光線追蹤中精細的幾何形狀,比如發(fā)絲。
RTX Mega Geometry的理念與虛幻5引擎的Nanite虛擬微多邊形幾何體系統(tǒng)相同,在現(xiàn)代游戲中,模型更加細致,需要渲染的工作量大幅增加,如果全部按照最精細的級別處理,將會耗費極大的計算資源,所以將LOD分級便應(yīng)運而生。

簡單來說,就是根據(jù)一個物體距離攝像機的遠近,來調(diào)節(jié)物體的細節(jié)水平。此前《黑神話:悟空》便應(yīng)用了這樣的技術(shù),它消除了LOD的繁瑣任務(wù),可以掃描并導入極高精細程度的模型。并且,這不會影響性能。仍然可以獲得實時幀速率。
在RTX Mega Geometry中提供了新的BVH構(gòu)建功能,它采用三角形集群作為一級基元。新的集群加速結(jié)構(gòu)Cluster-level Acceleration Structures(CLAS)可以從256個三角形空間緊湊批次中生成,然后使用CLAS集合作為輸入來構(gòu)建最終的BVH。

不過虛幻5引擎并非專為Blackwell而設(shè)計,RTX Mega Geometry的工作只是更高效的讓游戲引擎調(diào)用API。由于其輸入?yún)?shù)完全由GPU內(nèi)存驅(qū)動,游戲引擎可以在GPU上更高效的運行LOD選擇、動畫、剔除等邏輯。同時最大限度減少對CPU的往返,進而減少與BVH管理相關(guān)的CPU開銷。

然而在更加精細化的游戲引擎中,按照傳統(tǒng)的流程,應(yīng)用程序必須從場景中的每一幀的所有對象中構(gòu)建一個頂層加速結(jié)構(gòu)。而隨著更大的世界規(guī)模以及繁雜的場景物體,僅靠LOD分級仍然難以實現(xiàn)質(zhì)的變化。
為了解決這個問題,RTX Mega Geometry引入了一種新型的頂層加速結(jié)構(gòu)(TLAS),稱為分區(qū)頂層加速結(jié)構(gòu)(PTLAS)。

它無需在每一幀都從頭開始構(gòu)建一個新的TLAS,PTLAS能夠辨別從一幀到另一幀,哪些對象是靜態(tài)的。
應(yīng)用程序通過將對象聚合到分區(qū)中,并僅更新那些已更改的對象來節(jié)省開銷。

例如,游戲可以將靜態(tài)游戲世界的各個部分放入所屬的分區(qū)中,同時將動態(tài)對象分離到每幀重建的“全局分區(qū)”中。與傳統(tǒng)的TLAS相比,請求的分區(qū)更新越少,節(jié)省的運行時開銷就越大。
另外好消息是,RTX Mega Geometry可通過底層API進行擴展支持,適用于所有支持光線追蹤的NVIDIA GPU,也就是從圖靈架構(gòu)(Turing)開始。

不過Blackwell的第4代RT Core是專門為RTXMega Geometry而設(shè)計的,硬件中的特殊集群引擎實現(xiàn)了幾何和BVH數(shù)據(jù)的新壓縮方案,同時是第3代RT Core光線三角形相交率的2倍。因此,Blackwell架構(gòu)可以實現(xiàn)用更小的顯存,更高效的處理這些內(nèi)容。
Linear Swept Spheres (LSS)
LSS(線性掃描球體)是Blackwell架構(gòu)中新增的圖形語言,它極大地簡化了復雜頭發(fā)和毛發(fā)的渲染開銷,并能提升質(zhì)量。

此前渲染頭發(fā)仍然需要最基礎(chǔ)的三角形來表達物體,如圖所示,發(fā)絲中的一個線段需要6個三角形,而一根頭發(fā)便需要無數(shù)個三角形來確保其精度。比如我們的頭發(fā)則需要600萬個三角形來表達。

Blackwell架構(gòu)的RT Core引入了LSS新語言的支持,它類似于鑲嵌曲線,允許靈活地近似各種鏈型。并且球體也更適合發(fā)行構(gòu)建。
LSS的引入可以讓發(fā)型構(gòu)建,減少3倍的數(shù)據(jù)量,速度大約快了2倍,并可以使用更少的顯存,獲得更高的幀數(shù)。
相關(guān)文章

DLSS 4再次定義電子游戲! NVIDIA GeForce RTX 5080 FE顯卡評測
RTX 5080卻是有著NVIDIA自家推出的 Founders Edition公版設(shè)計產(chǎn)品,而且這次的Founders Edition設(shè)計非常精湛,稱其為工業(yè)藝術(shù)品也毫不為過,下面我們就來看看詳細測評2025-02-14
DLSS 4大力水手更猛了! iGame GeForce RTX 5080 Ultra W OC 16GB評測
今天我們來看看七彩虹 iGame GeForce RTX 5080 Ultra W OC 16GB顯卡,帶著對于RTX 50系顯卡性能與游戲表現(xiàn)的好奇,搶先幫大家測試了一波,如果你也對RTX 5080感興趣,可以2025-02-14
黑金設(shè)計搭配 DLSS 4! 影馳GeForce RTX 5080魔刃顯卡評測
今天,我們就將目光投向影馳 GeForce RTX 5080 魔刃顯卡,這款顯卡定位 RTX 50 系列中的中高端市場,下面我們就來看看詳細測評2025-02-11
經(jīng)典性價比次旗艦乘上DLSS 4東風! 耕升 GeForce RTX 5080 追風顯卡評測
耕升推出了新一代GeForce RTX 50系列產(chǎn)品,包括炫光、踏雪、追風等系列,今天我們就來看看追風顯卡性能測評2025-02-11
DLSS 4性能全力沖鋒! 耕升RTX5080炫光OC顯卡拆解超頻測試
繼GeForce RTX 5090 D之后,RTX 5080也相約面世,在這里要為大家推薦的是來自耕升的玩燈高手——GeForce RTX 5080炫光OC2025-02-08
GeForce RTX 5080和RTX 4090誰是顯卡之王? 7款游戲性能實測
RTX 5080上市后,性能備受關(guān)注,它和上一代旗艦RTX 4090誰更強?一種論調(diào)聲稱其性能非常炸裂,另外一種論調(diào)聲稱其性能提升幅度并不大,下面我們就來看看實際測評2025-02-08
DLSS4開啟電競級3A新時代 技嘉RTX 5080 AERO雪鷹顯卡全面評測
作為全球一線板卡廠商的技嘉,為玩家們推出了超級雕(黑/白)、魔鷹、雪鷹和風魔、等一系列產(chǎn)品線的旗艦顯卡,今天我們就來看看RTX 5080 AERO雪鷹顯卡測評2025-02-08








