性能飆升12.5倍! Intel銳炫B580/B570顯卡性能測評
要知道,銳炫A750兩年多前首發(fā)的時候,還是要289美元。
銳炫B570顯卡則要等到明年1月16日才會開賣,定價219美元起。

其實,Lunar Lake即酷睿Ultra 200V系列處理器中已經(jīng)率先應(yīng)用Xe2架構(gòu)的核顯,也就是銳炫140V、銳炫130V,如今終于來到了桌面獨立顯卡,未來還會陸續(xù)進入筆記本獨立顯卡、車載方案、嵌入式方案等。
Intel表示,Xe2架構(gòu)相對于初代,重點就是提升各方面的效率,包括更高的利用率、更好的負載分配、更好的軟件開銷等等。
同時,Xe架構(gòu)誕生兩年多來,Intel一直在努力完善驅(qū)動、游戲的生態(tài)支持,先后迭代了50多個版本的驅(qū)動,新游戲0日支持超過120款,游戲適配優(yōu)化數(shù)量也比當初增加了2.5倍。



這就是Xe2的整體架構(gòu)圖,主體依然是渲染切片,這是整個SoC芯片的基本結(jié)構(gòu),配合指令前端、二級緩存構(gòu)成一個整體,和第一代如出一轍,基本沒啥變化。
每個渲染切片內(nèi)包含4個Xe核心(計算引擎)、4個光追單元,以及4個采樣器、幾何單元、光柵單元、HiZ單元(層次Z)、兩個像素后端等模塊。
各個部分的具體變化,下邊拆開來講。

二代Xe2核心除了繼續(xù)原生支持SIMD16指令,還增加了對SIMD32的支持,雖然不是原生,但執(zhí)行SIMD32指令是沒問題的,從而能夠更好地分配計算資源,還支持64位原子操作。
每個Xe核心內(nèi)部,包含8個512位的矢量引擎(XVE)、8個2048位的XMX引擎,比上代減少了足足一半,可能調(diào)度效率會更高、更靈活。
這一次,Intel為每個Xe核心加入了多達256KB容量的一級緩存、本地共享緩存(SLM),大大減輕了對二級緩存的依賴。

XVE矢量引擎除了支持SIMD16/SIMD32,還支持矩陣擴展,包括INT2、INT4、INT8、FP16、BF16、TF32等數(shù)據(jù)類型,其中TF32是針對AI優(yōu)化的數(shù)據(jù)格式還擴展了Math、FP64支持。
另外,它還支持三路并發(fā),包括FP、INT/EM、XMX,指令調(diào)度和執(zhí)行效率更高。
對比初代,XVE引擎現(xiàn)在更小巧(基本可以視為砍半),應(yīng)該也會更靈活。

光追部分,Intel也做了大刀闊斧地改進,整體結(jié)構(gòu)沒太大變化,但是規(guī)模和性能高得多,比如遍歷流水線從2條增至3條、方盒相交增大1.5倍、三角形相交增大2倍、BVH(包圍盒層次結(jié)構(gòu))緩存增大2倍來到16KB。
這樣的規(guī)模當然遠遠沒法和NVIDIA相比,甚至不如AMD,但提升也是相當明顯的,應(yīng)該能夠達到基本可用的水平,當然更有賴于游戲的適配和優(yōu)化。

媒體引擎包含兩個相同的多媒體解碼器(MFX),但注意它和Lunar Lake里集成的核顯媒體引擎略有不同,沒有XMX硬件編解碼單元,因此不支持VVC(H.266)硬解碼。

這就是BMG-G21,二代銳炫顯卡首發(fā)的GPU核心芯片。
它總共有5個渲染切片、20個Xe2核心、20個光追單元、160個XMX引擎、20個紋理采樣器、10個像素后端,以及2個多格式X編解碼器,還有多達18MB二級緩存、192位顯存。
各家的GPU架構(gòu)設(shè)計不同,所以核心規(guī)模不具備直接可比性,但如果將這些與NVIDIA GPU類比,那就相當于80個ROP光柵單元、160個TMU紋理單元。
這是因為,紋理采樣器轉(zhuǎn)換為TMU的比例是1:8,像素后端與ROP的轉(zhuǎn)換比例同樣是1:8。

按照Intel的首發(fā),經(jīng)過優(yōu)化的第二代Xe核心,性能提高了70%,能效提高了50%。
相關(guān)文章

超頻達2850MHz! 藍戟銳炫B580系列顯卡正式發(fā)布
Intel銳炫B580/B570顯卡正式發(fā)布,英特爾昨日正式推出了代號為Battlemage的第二代銳炫B系列顯卡,首發(fā)型號包括銳炫B580和B570,距離第一代A系列首次亮相已經(jīng)過去兩年多的時2024-12-05
影馳GEFORCE RTX 4070Ti SUPER 金屬大師Plus OC顯卡全面評測
影馳上架了 GeForce RTX 4070Ti SUPER 金屬大師 Plus OC 顯卡,與之前 RTX 4070Ti SUPER 金屬大師不同,這是一塊 OC 還帶 Plus 的版本,下面我們就來看看這款顯卡的測評2024-12-05
蘋果放大招了? 蘋果 M4 Ultra顯卡性能超越RTX 4090
蘋果即將推出的M4 Ultra芯片可能會在性能上帶來驚喜,其圖形性能有望超越英偉達的RTX 4090,這是目前市面上最強大的消費級顯卡2024-11-12
在顯卡性能對比中,1650明顯優(yōu)于960,其性能領(lǐng)先30%左右,參數(shù)對比顯示,1650的流處理器數(shù)量雖然少了128個,但晶體管數(shù)量多了1660個,顯存多了2GB,基礎(chǔ)頻率和加速頻率分別高了31%2024-10-28
盡享極致游戲體驗! 索泰GeForce RTX 4090 D TRINITY顯卡評測
憑借著強勁的性能,索泰GeForce RTX 4090 D TRINITY 月白給人留下了頗為深刻的印象,下面我們就來看看這款顯卡性能測評2024-10-26
在性能對比中,盡管GTX 1650為10系顯卡,但與GTX 970相比,存在約20%的性能差距,970顯卡在游戲幀數(shù)、流處理器數(shù)量、核心面積等方面均優(yōu)于1650,盡管1650的能耗比較優(yōu)異,但從整2024-10-25
1650ti和3050差距多少 1650ti和3050顯卡對比詳解
NVIDIA GeForce RTX 3050相較于GTX 1650 Ti在移動端顯卡性能上約有40%的提升,3050具有更多流處理器和略高的加速頻率,盡管基礎(chǔ)頻率略低,通過測試不同游戲在1080p下的表現(xiàn),302024-10-25
顯卡作為提升電腦性能的關(guān)鍵部件,性能與價格是選購的主要考量,性能強的顯卡更受歡迎,但價格差異大,推薦幾款雙十一性價比高的顯卡,七彩虹RTX4060戰(zhàn)斧豪華版、藍寶石RX6750GR2024-10-23
只要清灰降畫質(zhì)就能再戰(zhàn)? GTX 1050 Ti顯卡游戲性能測評
GeForce GTX 1050 Ti這款老顯卡的口碑很不錯,但它畢竟已經(jīng)是8年前的老產(chǎn)品,本文的測試目的就是評估GeForce GTX 1050 Ti在清灰,調(diào)低畫質(zhì)(1080P低)之后,還能否流暢運行2024-10-11
3080ti和rx7800xt玩游戲選哪個 3080ti和rx7800xt顯卡游戲性能測試
3080ti和rx7800xt均為高性能顯卡,3080ti在生產(chǎn)力優(yōu)化上表現(xiàn)更佳,而rx7800xt在價格上更具優(yōu)勢,如果主要用途是游戲,rx7800xt的性價比更高;若涉及到生產(chǎn)力任務(wù),例如視頻編輯2024-10-11






