兩種GPU之間的延遲對比 AMD RDNA2完勝NVIDIA安培

CPU緩存與內(nèi)存延遲測試，相信大家都有所耳聞，但是GPU同樣的測試卻幾乎沒人做過。

ChipsAndCheese就做了一次特別的測試，對比考察了AMD、NVIDIAGPU架構(gòu)的緩存、顯存遲問題。

首先是AMDRDNA2、NVIDIAAmpere兩家最新架構(gòu)的比拼，代表是RX6900XT、RTX3090，前者在幾乎所有階段都完勝。

RNDA2架構(gòu)創(chuàng)新性地加入了InfinityCache無限緩存，提升帶寬的同時，延遲也可圈可點(diǎn)，二級緩存命中率上只增加了大約20ns的延遲，明顯低于Ampere。

更驚人的是，RDNA2顯存延遲和Ampere幾乎一模一樣，但是別忘了，Ampere只有兩個層級的緩存，RDNA2卻有四個。

Ampere的緩存架構(gòu)更加傳統(tǒng)，SM陣列私有一級緩存到二級緩存要增加超過100ns的延遲，RDNA2從零級緩存到二級緩存則只增加了約66ns。看起來，GA102核心面積過大，也直接增加了延遲。

這正好可以解釋AMDRDNA2架構(gòu)在低分辨率下性能、能效更優(yōu)秀，因?yàn)槎壘彺妗⑷壘彺嫜舆t很低，更適合執(zhí)行較小的負(fù)載。Ampere則相反，高負(fù)載下優(yōu)勢明顯，比如說4K分辨率。

說完了GPU之間的對比，那么GPU、CPU放在一起怎么樣呢？這里以RX6900XT、Intel四代酷睿i7-4770為例來看看。

CPU的緩存自然不是一個級別的，所以這里Y軸用了線性數(shù)據(jù)，可以看到全程大大低于RDNA2，搭配DDR3-1600CL9內(nèi)存延遲只有63ns，RX6900XT、GDDR6的組合則有226ns，另外末級緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIAGPU，包括Maxwell架構(gòu)的GTX980Ti、Pascal架構(gòu)的GTX1080、Turing架構(gòu)的RTX2060Mobile。

Maxwell、Pascal其實(shí)差不多，前者整體略高一些，可能是受制于芯片面積較大、核心頻率較低。

Turing則已經(jīng)有了Ampere的樣子，一級緩存延遲低得多，二級差不多，奇怪的是顯存延遲在32MB之后偏高，原因未知。

AMD考察了TeraScale架構(gòu)的HD5850/6950、GCN架構(gòu)的HD7970，再加上RX6900XT，很明顯在逐代降低，而且是各級緩存都在同時進(jìn)步。

編輯：jq

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

amd

amd

+關(guān)注

關(guān)注
25

文章
5570

瀏覽量
135987
cpu

cpu

+關(guān)注

關(guān)注
68

文章
11049

瀏覽量
216129
數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7246

瀏覽量
91163
gpu

gpu

+關(guān)注

關(guān)注
28

文章
4916

瀏覽量
130729

精選推薦
更多

文章

資料

帖子

MPS MPM3695GPJ-20電源模塊產(chǎn)品特性

MPS芯源系統(tǒng)
9小時前

270 閱讀

傳統(tǒng)路線與其利天下的分水嶺，無刷電鉆驅(qū)動方案對比--【其利天下】

其利天下技術(shù)
1天前

353 閱讀

智多晶PLL使用注意事項(xiàng)

智多晶
1天前

274 閱讀

【飛凌嵌入式】基于i.MX9352開發(fā)板M核的FreeRTOS設(shè)計(jì)例程

飛凌嵌入式
1天前

359 閱讀

HZ-T536-SP_EVM：藏在Labubu百萬身價(jià)背后的“中國芯”

合眾恒躍
1天前

525 閱讀

Cisco VoIP配置技術(shù)

王靜
5.94 MB

10積分

87下載

交流調(diào)速系統(tǒng)_陳伯時

湖中月
3.86 MB

免費(fèi)

0下載

FRDM-KL26Z芯片數(shù)據(jù)手冊

jfzhangjin
6457KB

1積分

11下載

DIY相機(jī)間隔計(jì)PCB設(shè)計(jì)

jefljel
0.04 MB

免費(fèi)

0下載

高效快速響應(yīng)，1A，28V輸入同步降壓調(diào)節(jié)器YS1601數(shù)據(jù)手冊

楊豐奎
0.48 MB

2積分

0下載

【RA4L1-SENSOR】02 LCD上顯示ADC采樣電壓值

jf_83922529
18小時前

83 閱讀

【RA4L1-SENSOR】01 ADC單次掃描采集外部電壓輸入+串口輸出

jf_83922529
18小時前

202 閱讀

【RA4L1-SENSOR】電子相冊

gtbestom
18小時前

198 閱讀

【正點(diǎn)原子STM32MP257開發(fā)板試用】介紹、上電測試、系統(tǒng)連接

jf_07365693
1天前

302 閱讀

無線應(yīng)用射頻微波電路設(shè)計(jì)

yuu_cool
1天前

313 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

兩種GPU之間的延遲對比 AMD RDNA2完勝NVIDIA安培

評論