Ampere架構(gòu)和RDNA 2架構(gòu)顯存延遲測(cè)試 Infinity Cache顯示優(yōu)勢(shì)
- 來(lái)源:超能網(wǎng)
- 作者:超能網(wǎng)
- 編輯:豆角
經(jīng)過(guò)了多年的發(fā)展,GPU也具備了多層緩存的結(jié)構(gòu)。這些精心設(shè)計(jì)的緩存架構(gòu),可以填補(bǔ)顯存和計(jì)算單元之間讀寫速度不匹配的矛盾,與CPU的緩存有類似的作用。
由于GPU架構(gòu)的不同,不同芯片設(shè)計(jì)廠商對(duì)其緩存的設(shè)計(jì)也不一樣。在Ampere架構(gòu)上,英偉達(dá)仍然堅(jiān)持使用相對(duì)傳統(tǒng)的L1和L2緩存兩級(jí)結(jié)構(gòu)。AMD在RDNA 2架構(gòu)上,則采用了L0、L1、L2和Infinity Cache,事實(shí)上Infinity Cache是充當(dāng)了L3緩存的角色。近期Chips and Cheese發(fā)布了一項(xiàng)新研究,比較了英偉達(dá)與AMD最新顯卡的顯存延遲情況。
Chips and Cheese采用了OpenCL編寫的指針追蹤基準(zhǔn),用于評(píng)估GPU顯存緩存中的延遲。在測(cè)試?yán)?,使用的是Radeon RX 6800 XT和GeForce RTX 3090顯卡。測(cè)試結(jié)果表明,RDNA 2架構(gòu)比Ampere架構(gòu)具有更低的顯存延遲。
在測(cè)試中,英偉達(dá)GA102的L1和L2緩存之間的延遲超過(guò)了100ns,而AMD Navi 21的L0至L2緩存之間的延遲為66ns,加上Infinity Cache僅增加了20ns的額外延遲。這可能可以解釋為什么RDNA 2架構(gòu)在較低分辨率的時(shí)候會(huì)有更出色的性能表現(xiàn),而Ampere架構(gòu)需要更多并行運(yùn)算才能有更好的發(fā)揮。
無(wú)論英偉達(dá)還是AMD,都注意到了大型高效緩存的重要性。英偉達(dá)GA100(Ampere)的L2緩存已經(jīng)增加到了40MB,是GV100(Volta)的七倍。AMD則率先使用了高帶寬的設(shè)計(jì),類似的結(jié)構(gòu)也有用于CDNA架構(gòu)的Instinct系列,在Radeon RX系列中(RDNA)為游戲開發(fā)了Infinity Cache。
Chips and Cheese還比較了英偉達(dá)和AMD較老的一些架構(gòu),總體而言都在不斷改善。不過(guò)AMD每一代架構(gòu)都隨有一定程度的降低,相對(duì)來(lái)說(shuō)更明顯。
玩家點(diǎn)評(píng) (0人參與,0條評(píng)論)
熱門評(píng)論
全部評(píng)論