在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

AMD全新GPU架構(gòu)解析 性能提升14%功耗降低23%

旺材芯片 ? 來(lái)源:yxw ? 2019-06-12 14:23 ? 次閱讀

E3 2019游戲大會(huì)期間,AMD正式發(fā)布了基于7nm新工藝、Navi新核心、RDNA新架構(gòu)的新一代顯卡Radeon RX 5700系列,包括RX 5700 XT、RX 5700兩款型號(hào),均面向規(guī)模最為龐大的甜點(diǎn)級(jí)市場(chǎng)和主流游戲玩家。

AMD發(fā)布的新一代RX 5700系列顯卡基于7nm新工藝和Navi新核心,而在底層是全新的RDNA架構(gòu),已經(jīng)走過(guò)七年半的GCN架構(gòu)就此揮手作別。

這些年來(lái),很多用戶(hù)玩家尤其是A飯一直期待一個(gè)全新的GPU架構(gòu),但這種事兒的難度遠(yuǎn)超一般人想象,某種程度上設(shè)計(jì)一個(gè)新的GPU架構(gòu)甚至要比設(shè)計(jì)一個(gè)新的CPU架構(gòu)還要難。RDNA架構(gòu)就花費(fèi)了AMD研發(fā)團(tuán)隊(duì)長(zhǎng)達(dá)四年的時(shí)間,凝聚了無(wú)數(shù)人的心血,也開(kāi)啟了AMD顯卡歷史上第五代重大架構(gòu)的新時(shí)代。

2000年前,R100核心是A卡的第一代架構(gòu),用的還是固定單元設(shè)計(jì),3D幾何轉(zhuǎn)換和光照效果如今看起來(lái)都極為原始。

2001-2007年的R200-R500是第二代架構(gòu),簡(jiǎn)單的VS紋理著色器、PS像素著色器分離式設(shè)計(jì),不同的只是比例不同,整個(gè)渲染流水線(xiàn)就像一個(gè)單通道的單行道。

2008-2011年的第三代TeraScale架構(gòu)(代表核心R600)實(shí)現(xiàn)了一個(gè)飛躍,VS、PS融合為統(tǒng)一著色器,也就是我們常說(shuō)的流處理器,支持VLIW(超長(zhǎng)指令字),然后就是2011-2019年的GCN架構(gòu)(代表核心Southern Islands),統(tǒng)一著色器加獨(dú)立的標(biāo)量、矢量單元,二者比例為1:4。

如今,迎來(lái)了全新的RDNA(Radeon DNA),還是統(tǒng)一著色器,但標(biāo)量和矢量單元走向融合,支持SIMT(單指令多線(xiàn)程) ILP(指令集并行),類(lèi)似CPU處理器的SIMD(單指令多數(shù)據(jù)流),單線(xiàn)程性能和指令集執(zhí)行效率大大提升。

需要強(qiáng)調(diào)的是,RDNA是一個(gè)全方位重新設(shè)計(jì)的架構(gòu),并不是GCN的又一個(gè)升級(jí)版,也不是與GCN的混合體,只是集成了GCN架構(gòu)的指令以保持向下兼容,現(xiàn)有技術(shù)仍然可以在RDNA架構(gòu)上得到支持。

RDNA架構(gòu)將是AMD GPU顯卡未來(lái)多年的基石,接下來(lái)我們將看到采用7nm+工藝的第二代版本RDNA 2,看路線(xiàn)圖有望明年初和我們見(jiàn)面。

除了RDNA新架構(gòu),Navi核心還有7nm工藝、GDDR6顯存、PCIe 4.0總線(xiàn)、Radeon媒體引擎、Radeon顯示引擎等諸多全新特性。

Navi 10核心集成了103億個(gè)晶體管,相比Vega 64 125億個(gè)少了大約18%,而核心面積只有251平方毫米,相比Vega 64 495平方毫米更是小了足足一半,因此單位面積性能提升了足足1.3倍。

盡管晶體管更少、面積更小,Navi 10核心的性能相比于Vega 64卻提升了14%,同時(shí)功耗降低了23%,能效比因此大漲50%。

純架構(gòu)性能上,Navi相比于Vega在同等功耗、同等配置下提升多達(dá)50%,反應(yīng)到實(shí)際產(chǎn)品上,這貢獻(xiàn)了產(chǎn)品性能提升的60%左右,另外有大約25%來(lái)自7nm新工藝的加持,還有約15%來(lái)自頻率以及功耗的改進(jìn)。

AMD表示,RDNA架構(gòu)的設(shè)計(jì)理念主要有四個(gè)方面,性能上要滿(mǎn)足在現(xiàn)代游戲負(fù)載需求,能效上要充分優(yōu)化功耗和帶寬利用率,功能上要壯大生態(tài),擴(kuò)展性上要從移動(dòng)到桌面到云端通吃。

為實(shí)現(xiàn)上述目標(biāo),RDNA架構(gòu)主要從三大方面進(jìn)行了變革,包括CU計(jì)算單元、緩存、流水線(xiàn),接下來(lái)我們逐一和大家分享,但鑒于GPU架構(gòu)的技術(shù)性太強(qiáng),我們只是蜻蜓點(diǎn)水地大致看一下,最后還有AMD關(guān)于光線(xiàn)追蹤的規(guī)劃。

新的計(jì)算單元設(shè)計(jì)一共分為40組,每組2個(gè)標(biāo)量處理器、64個(gè)流處理器、4個(gè)64位雙線(xiàn)性過(guò)濾單元,總計(jì)80個(gè)、2560個(gè)、160個(gè),執(zhí)行延遲更低,單線(xiàn)程性能更強(qiáng),緩存效率更高,整體計(jì)算能效比GCN架構(gòu)有著巨大的提升,而且可適應(yīng)從游戲到計(jì)算各種負(fù)載。

多級(jí)緩存一致性可以帶來(lái)更低的延遲、更高的帶寬、更低的功耗,包括各處零級(jí)緩存、512KB一級(jí)緩存、4MB二級(jí)緩存。

整個(gè)圖形引擎也做了重新調(diào)整,更加順暢高效,包括幾何引擎、64個(gè)紋理單元、4個(gè)異步計(jì)算引擎(ACE),負(fù)載分配更加均衡,可以在更低的功耗下達(dá)成更高的頻率,能效更高。

CU計(jì)算單元方面,雖然看起來(lái)每一組還是64個(gè)流處理器,數(shù)量沒(méi)變,但這個(gè)數(shù)字是AMD反復(fù)設(shè)計(jì)后與處理資源最為平衡的的組合,同時(shí)整個(gè)計(jì)算單元的結(jié)構(gòu)進(jìn)行了徹底重組,和GCN時(shí)代完全不一樣了。

RDNA架構(gòu)下,每個(gè)CU計(jì)算單元的標(biāo)量解碼和發(fā)射單元、矢量解碼和發(fā)射單元、調(diào)度器的數(shù)量都增加了一倍來(lái)到兩個(gè),指令處理率因此也提升一倍。

同時(shí),四個(gè)SIM16矢量單元、四個(gè)SIMD4特殊功能單元變?yōu)閮蓚€(gè)SIMD32、兩個(gè)SIMD8,比如64個(gè)線(xiàn)程可組合為兩個(gè)Wave32,然后由兩個(gè)SIMD32執(zhí)行兩個(gè)Wave32,實(shí)現(xiàn)單時(shí)鐘周期指令發(fā)射(之前需要四個(gè)),SIMD ALU單元的利用率也從25%來(lái)到了100%,而且支持Wave32、Wave64兩種執(zhí)行模式,以應(yīng)對(duì)不同負(fù)載需求。

此外,為了強(qiáng)化資源調(diào)度和利用的效率,RDNA架構(gòu)還將每?jī)蓚€(gè)CU計(jì)算單元緊密地捆綁在了一起,組成一個(gè)工作組處理器(Work Group Processor),使得可用ALU單元、寄存器數(shù)量翻番,緩存帶寬更是之前的四倍。

緩存方面,RDNA架構(gòu)設(shè)計(jì)了一套多級(jí)一致性結(jié)構(gòu),每個(gè)雙CU組合內(nèi)都有自己的零級(jí)緩存,與ALU單元的載入帶寬翻番,增加了四組新的一級(jí)緩存(都是16-way 128KB),降低了二級(jí)緩存(16-way 4MB)的擁堵,整體延遲和功耗大大減低。

按照AMD的說(shuō)法,零級(jí)緩存的延遲降低了21%,一二級(jí)緩存降低24%,內(nèi)存延遲也低了7%。

另外在一致性多級(jí)緩存下,到處都支持Delta數(shù)據(jù)壓縮(DCC/圖中箭頭黃色部分),提高傳輸率,同時(shí)還改進(jìn)了色彩壓縮算法,可供顯示引擎讀取,著色器也能同時(shí)讀寫(xiě)壓縮的色彩數(shù)據(jù)。

圖形引擎流水線(xiàn)方面進(jìn)行了大刀闊斧的重組,包括四個(gè)增強(qiáng)的ACE異步計(jì)算引擎,地位更加中心化的結(jié)合處理器(包含四個(gè)原語(yǔ)單元),64個(gè)像素單元。

異步計(jì)算一直是A卡的獨(dú)門(mén)絕技,也是起在DX12、Vulkan API下表現(xiàn)更好的關(guān)鍵,如今得到增強(qiáng)后,可以更精準(zhǔn)地實(shí)時(shí)控制其他模塊。

有趣的是,RDNA GPU架構(gòu)設(shè)計(jì)也借鑒了Zen CPU架構(gòu)設(shè)計(jì)的一些先進(jìn)理念,尤其是在時(shí)鐘門(mén)控方面,效率和能效極高,同時(shí)還減少了達(dá)到更高頻率所需要的邏輯層級(jí)。

Radeon顯示引擎也大幅躍進(jìn),支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR,針對(duì)高分辨率HR顯示器優(yōu)化,可輸出4K/240Hz、8K/60Hz,而且都只需一根數(shù)據(jù)線(xiàn)即可達(dá)成,同時(shí)還優(yōu)化了VR頭顯顯示。

Radeon多媒體引擎則大大改進(jìn)了視頻編解碼,增加了新的H.265 HDR/WCG編碼器,全面支持H.264 1080p600、4K150、8K30解碼和1080p360、4K90編碼,H.265 1080p360、4K90、8K24解碼和1080p360、4K60編碼,VP9 4K90、8K24解碼,整體編碼速度加快40%。

對(duì)于大家非常關(guān)注的光線(xiàn)追蹤支持,GCN、RDNA架構(gòu)都沒(méi)有專(zhuān)門(mén)的硬件單元加速,不過(guò)事實(shí)上,AMD ProRender、Radeon Rays都早就支持了光線(xiàn)追蹤,分別面向內(nèi)容創(chuàng)作渲染和游戲開(kāi)發(fā)。

在下一代RDNA架構(gòu)上,AMD會(huì)通過(guò)硬件單元,支持特定的光線(xiàn)追蹤效果在游戲中實(shí)時(shí)渲染,而即便到了更遙遠(yuǎn)的未來(lái),AMD也不會(huì)將光線(xiàn)追蹤全部一股腦扔給硬件來(lái)本地處理,否則效率會(huì)非常低下,而是將借助云計(jì)算,實(shí)現(xiàn)全場(chǎng)景的光線(xiàn)追蹤,保證畫(huà)面效果的同時(shí),不會(huì)給本地硬件太大的壓力。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19706

    瀏覽量

    232709
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5539

    瀏覽量

    135555
  • 顯卡
    +關(guān)注

    關(guān)注

    16

    文章

    2496

    瀏覽量

    68980
  • GPU架構(gòu)
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    8537

原文標(biāo)題:四年研發(fā),終成正果!AMD 全新GPU架構(gòu)解析:相比 Vega 64 面積更小,性能提升14%,功耗降低23%

文章出處:【微信號(hào):wc_ysj,微信公眾號(hào):旺材芯片】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    AMD最強(qiáng)AI芯片,性能強(qiáng)過(guò)英偉達(dá)H200,但市場(chǎng)仍不買(mǎi)賬,生態(tài)是最大短板?

    。 ? 其中,全新旗艦AI芯片的型號(hào)為AMD Instinct MI325X GPU,雖然仍然是采用CDNA 3架構(gòu),但是相較于AMD In
    的頭像 發(fā)表于 10-14 01:32 ?3881次閱讀
    <b class='flag-5'>AMD</b>最強(qiáng)AI芯片,<b class='flag-5'>性能</b>強(qiáng)過(guò)英偉達(dá)H200,但市場(chǎng)仍不買(mǎi)賬,生態(tài)是最大短板?

    芯原發(fā)布新一代Vitality架構(gòu)GPU IP系列

    芯原股份近日宣布,正式推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列。這一新一代GPU架構(gòu)以其卓越的計(jì)算
    的頭像 發(fā)表于 12-24 10:55 ?695次閱讀

    芯原推出新一代高性能Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計(jì)算能力,廣泛適用于云游戲、AI PC、獨(dú)立顯卡和集成顯卡等
    的頭像 發(fā)表于 12-19 15:55 ?357次閱讀

    芯原發(fā)布全新Vitality架構(gòu)GPU IP系列

    芯原股份(芯原,股票代碼:688521.SH)今日宣布推出全新Vitality架構(gòu)的圖形處理器(GPU)IP系列,具備高性能計(jì)算能力,廣泛適用于云游戲、AI PC、獨(dú)立顯卡和集成顯卡等
    的頭像 發(fā)表于 12-19 15:26 ?654次閱讀

    《CST Studio Suite 2024 GPU加速計(jì)算指南》

    問(wèn)題,但會(huì)降低GPU硬件性能,可通過(guò)NVIDIA控制面板或命令行工具nvidia - smi管理。 - TCC模式(Windows only):某些GPU計(jì)算需要啟用,可通過(guò)命令行
    發(fā)表于 12-16 14:25

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變

    在數(shù)據(jù)挖掘工作中,我經(jīng)常需要處理海量數(shù)據(jù)的深度學(xué)習(xí)任務(wù),這讓我對(duì)GPU架構(gòu)和張量運(yùn)算充滿(mǎn)好奇。閱讀《算力芯片》第7-9章,讓我對(duì)這些關(guān)鍵技術(shù)有了全新認(rèn)識(shí)。 GPU
    發(fā)表于 11-24 17:12

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU

    本篇閱讀學(xué)習(xí)第七、八章,了解GPU架構(gòu)演進(jìn)及CPGPU存儲(chǔ)體系與線(xiàn)程管理 █從圖形到計(jì)算的GPU架構(gòu)演進(jìn) GPU圖像計(jì)算發(fā)展 ●從三角形開(kāi)始
    發(fā)表于 11-03 12:55

    AMD與NVIDIA GPU優(yōu)缺點(diǎn)

    在圖形處理單元(GPU)市場(chǎng),AMD和NVIDIA是兩大主要的競(jìng)爭(zhēng)者,它們各自推出的產(chǎn)品在性能功耗、價(jià)格等方面都有著不同的特點(diǎn)和優(yōu)勢(shì)。 一、性能
    的頭像 發(fā)表于 10-27 11:15 ?1808次閱讀

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書(shū)概覽

    GPU、NPU,給我們剖析了算力芯片的微架構(gòu)。書(shū)中有對(duì)芯片方案商處理器的講解,理論聯(lián)系實(shí)際,使讀者能更好理解算力芯片。 全書(shū)共11章,由淺入深,較系統(tǒng)全面進(jìn)行講解。下面目錄對(duì)全書(shū)內(nèi)容有一個(gè)整體了解
    發(fā)表于 10-15 22:08

    AMD全新處理器擴(kuò)大數(shù)據(jù)中心CPU的領(lǐng)先地位

    在Computex 2024 開(kāi)幕主題演講上,AMD 詳細(xì)介紹了全新的 CPU、NPU 和 GPU 領(lǐng)先架構(gòu),為從數(shù)據(jù)中心到個(gè)人電腦的端到端 AI 基礎(chǔ)
    的頭像 發(fā)表于 09-19 11:01 ?748次閱讀

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    和像素統(tǒng)一的G80到現(xiàn)在重金難求的H100;AMD的Zen系列CPU和RDNA系列GPU兩線(xiàn)作戰(zhàn);中國(guó)的高性能計(jì)算芯片逐步獲得更多TOP500排名;華為Ascend 910 NPU芯片也成為AI時(shí)代
    發(fā)表于 09-02 10:09

    GPU云服務(wù)器架構(gòu)解析及應(yīng)用優(yōu)勢(shì)

    GPU云服務(wù)器作為一種高性能計(jì)算資源,近年來(lái)在人工智能、大數(shù)據(jù)分析、圖形渲染等領(lǐng)域得到了廣泛應(yīng)用。它結(jié)合了云計(jì)算的靈活性與GPU的強(qiáng)大計(jì)算能力,為企業(yè)和個(gè)人用戶(hù)提供了一種高效、便捷的計(jì)算解決方案。下面我們將從
    的頭像 發(fā)表于 08-14 09:43 ?681次閱讀

    AMD推出全新AMD銳龍和EPYC處理器,擴(kuò)大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

    、游戲、內(nèi)容創(chuàng)造和工作效率提供領(lǐng)先性能 ?在Computex 2024 開(kāi)幕主題演講上,AMD?(納斯達(dá)克股票代碼: AMD) 詳細(xì)介紹了全新的?CPU、NPU 和?
    的頭像 發(fā)表于 06-04 19:21 ?1166次閱讀
    <b class='flag-5'>AMD</b>推出<b class='flag-5'>全新</b><b class='flag-5'>AMD</b>銳龍和EPYC處理器,擴(kuò)大數(shù)據(jù)中心和PC領(lǐng)域領(lǐng)先地位

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級(jí)芯片

    冷卻技術(shù),提高計(jì)算密度,減少占地面積,并通過(guò)高帶寬、低延遲的GPU通信,有效減少數(shù)據(jù)中心的碳足跡和能源消耗。相較于傳統(tǒng)的NVIDIA H100風(fēng)冷基礎(chǔ)設(shè)施,GB200在相同功耗下實(shí)現(xiàn)25倍的性能
    發(fā)表于 05-13 17:16

    天璣9300旗艦芯:全大核CPU架構(gòu)性能與能效的提升

    “全大核”CPU 架構(gòu)設(shè)計(jì)打破常規(guī),摒棄小核,采用超大核(Arm Cortex-X)與大核(Arm Cortex-A)的組合,以更高時(shí)鐘頻率提升性能和能效,同時(shí)降低功耗,延長(zhǎng)電池壽命。
    的頭像 發(fā)表于 05-06 10:22 ?913次閱讀
    主站蜘蛛池模板: 91av视频在线 | 欧美在线观看一区二区三 | 夜间免费视频 | 美女被异性狂揉下部羞羞视频 | 如果我们是季节韩剧在线观看 | 在线观看视频h | 中文字幕在线播放第一页 | 97人人揉人人捏人人添 | 精品国产综合区久久久久99 | 欧美一卡二卡3卡4卡无卡六卡七卡科普 | 在线观看你懂的视频 | 成人精品人成网站 | 国产亚洲精品久久久久久午夜 | 免费看欧美一级特黄a大片 免费看欧美一级特黄a大片一 | 日日操夜夜爽 | 欧美黄页网 | 五月婷婷在线免费观看 | 最近高清免费观看视频大全 | 男人j进女人j的一进一出视频 | 美女扒开尿囗给男生桶爽 | 特一级黄| 一级黄色大全 | 综合aⅴ| www.xxx.国产 | yy8090韩国日本三理论免费 | 日韩成人免费一级毛片 | 在线视频免费播放 | 亚洲 欧美 精品 | 久久国产成人午夜aⅴ影院 久久国产福利 | 免费一级特黄特色大片 | 久久综合色播 | 亚洲伊人久久大香线蕉综合图片 | 欧美性色黄大片四虎影视 | 窝窝视频成人影院午夜在线 | 人人做人人爽久久久精品 | 67pao强力打造高清免费 | 五月天激情综合网 | 日本视频一区在线观看免费 | 黄色网址 在线播放 | 五月丁香| 欧美日韩国产在线一区 |