在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

NVIDIA RTX 30系列架構的詳細講解

電子設計 ? 來源:電子設計 ? 作者:電子設計 ? 2020-12-24 15:15 ? 次閱讀

在當前的顯卡市場上,占據80%的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡,同時也讓高端游戲卡的價格高企,發燒顯卡至少五位數起。

在RTX 30系列顯卡發布之后,玩家的不滿似乎釋然了,相比當前的圖靈顯卡,安培架構的RTX 3090/3080/3070顯卡一下子變得真香了,因為它們性能翻倍不說,國內價格反而下降了。

·GeForce RTX 3090:取代RTX Titan,相比于Titan RTX快了50%,性能是RTX 2080 Ti顯卡的2倍,配備24GB GDDR6X顯存,售價11999元,9月24日上市。

·GeForce RTX 3080:取代RTX 2080 Ti,相比于RTX 2080性能快2倍,搭配10GB GDDR6X顯存,海外699美元沒變,國內從上代6499降至5499元,9月17日上市。

·GeForce RTX 3070:價格不到RTX 2080 Ti的一半,但是平均性能更高,同時比RTX 2070快足足60%,配備8GB GDDR6顯存,售價3899元,10月份上市。

RTX 30系列顯卡售價及上市時間

RTX 30系列顯卡性能變化

RTX 30系列顯卡規格

從這個規格表中可以看出,與RTX 2080 Ti顯卡相比,RTX 3090的標志性FP32性能從13.4T提升到了35.7T,翻倍還多,光追及AI加速提升也同樣明顯。

與圖靈顯卡相比,安培GPU的變化之大讓人驚訝,在過去十多年的顯卡升級換代中,性能翻倍的提升很少見到了,NVIDA是怎么做到的?

今天我們就來從詳細解讀一下安培GPU的架構,探究它到底帶來了哪些技術升級以致于讓NVIDIA創始人黃仁勛稱之為有史以來性能提升最大的一次。

先從工藝說起:12nm干掉7nm之后 8nm如何再進一步

對于半導體芯片來說,很關鍵的一部分是制程工藝,先進的架構也要通過工藝來實現,這是影響芯片能效、性能甚至成本的一大因素。

對NVIDIA來說,他們的Volta伏特、Turing圖靈兩代架構都是臺積電12nm FFN工藝了,這是臺積電16nm工藝的改進版,如果再算上16nm的Pascal架構,實際上過去三代GPU都沒有重大工藝上的升級了。

在Ampere安培架構上,NVIDIA終于升級工藝了,只不過這次有兩個意外——首先沒有選擇臺積電,其次沒有上7nm,而是三星定制的8nm工藝,雖然跟7nm看起來只差了1nm,但實際上是兩代工藝。

考慮到NVIDIA之前對工藝的表態,沒用7nm工藝而是三星8nm工藝又在意料之中,最關鍵的問題在于NVIDIA能夠做到多好。

三星的8nm工藝是基于10nm工藝改良的,至少有LPP和LPU兩個版本,前者適合移動SoC,后者適合高性能芯片,NVIDIA的定制大概是基于后者。

與臺積電的7nm工藝晶體管密度大約1億/mm2相比,8nm工藝大概是6000萬晶體管/mm2,但這是單一的SRAM芯片的對比,實際上GPU芯片比較復雜,差距會縮小很多。

根據是NVIDIA公布的信息,臺積電7nm工藝制造的安培A100核心是540億晶體管,核心面積826mm2,而三星8nm工藝制造的GA102核心是280億晶體管,核心面積官方沒公布,據悉是628mm2,也是大核心了。

這么算下來,7nm A100核心的晶體管密度6560萬晶體管/mm2,而三星8nm的GA102核心也有4460萬晶體管/mm2——差距仍在,但似乎可以接受了。

三星8nm工藝的晶圓代工價格還是秘密,但是不論技術還是商業策略上,三星都會比臺積電便宜很多,預計代工價格能差30%或者更高,所以這也是RTX 30系列顯卡能夠不漲價甚至降價的關鍵。

那三星8nm工藝帶來了多大的性能及能效提升呢?首先大家可以看到RTX 30系列顯卡的頻率提升了,從RTX 20系列的1.5GHz+提升到了1.7GHz+,升級工藝還是有性能提升的。

不過RTX 20系列的加速頻率實際可以達到1.9GHz甚至接近2GHz,RTX 30系列預計也就這個水平。

但是能效還是有提升的,NVIDIA官方稱在60fps性能下,圖靈顯卡的功耗大約有240W,安培顯卡則是120W多點,算下來是1.9倍能效,提升了90%,同時溫度還低了3度,噪音減少2分貝。

總的來說,在工藝這方面大家對安培GPU有驚喜有失望,失望的是沒有上預期中的7nm工藝(不管臺積電還是三星),工藝依然升級到了8nm。

但是NVIDIA工藝雖然并不算激進,但性能、能效進步還是挺大的,安培顯卡各方面指標都是大幅勝過現在的圖靈卡,而且價格做到了不升反降,這也是不追求激進工藝的好處,反正之前12nm都能贏,現在上8nm更加穩妥了。

安培GPU架構詳解之:FP32單元翻倍 CUDA核心改了什么?

發布安培的時候,NVIDIA CEO黃仁勛表示這是GPU有史以來最大的性能飛躍,而2018年推出圖靈GPU時,老黃也是類似的說詞——GPU有史以來最大的變革,這兩個評價其實也沒錯。

圖靈GPU架構有很多第一次,首次支持RTX Core(光追加速單元),首次支持Tensor Core,同時還改進了CUDA內核,不過前兩個是重點。

在安培GPU上,RT Core、Tensor Core當然繼續加強,不過最主要的亮點是CUDA架構的改進,性能翻倍的根源就在這里,我們先來看看這方面的變化。

GA102核心架構示意圖

GA102核心總計7組GPC單元,每組有12組SM單元,總計84組,RTX 30系列顯卡視乎規格不同啟用的SM單元總數不同,RTX 3090是82組,RTX 3080是68組,RTX 3070是46組。

在之前的GA100大核心中,每組SM是64個INT32單元、64個FP32單元及32個FP64單元組成的,但在GA102核心中,FP64單元大幅減少,增加了RT Core,Tensor Core也略微減少。

GA102核心的SM單元

按照之前圖靈GPU的路線走,安培GPU的SM單元增加的并不多,但實際上FP32性能翻倍了還多,算上頻率,RTX 3080的理論性能差不多是RTX 2080的三倍了,這是怎么做到的?

答案就是CUDA核心的FP32翻倍,但翻倍的方式有點特殊,每個SM單元中有4個分區,每個分區除了第三代Tensor Core核心之外,還有一組是16個FP32單元及16個FP32、16個IN32組成的單元,后者可以同時執行FP32或者INT32運算。

16個FP32單元每周期可執行16個FP32運算,混合的那個單元可以執行32個FP32或者16個FP32+16個INT32。

如此一來,每個SM單元可以同時執行4x(16FP32+16FP32)=128個FP32運算,或者4x(16FP32+16INT32)=64個FP32+64個INT32運算。

只算FP32浮點的話,那么就是浮點翻倍了,因為圖靈以及GA100都是每周期64個FP32浮點而已,現在可以做128個FP32運算了。

提升FP32性能不論對游戲還是運算都大有裨益,但也需要配套的提升,GA102的L1容量提升了33%,L1帶寬從116GB/s翻倍到219GB/s,共享內存的性能也從每周期64B翻倍到128B。

審核編輯:符乾江


聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • IC設計
    +關注

    關注

    38

    文章

    1302

    瀏覽量

    104304
  • NVIDIA
    +關注

    關注

    14

    文章

    5078

    瀏覽量

    103767
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4783

    瀏覽量

    129382
收藏 人收藏

    評論

    相關推薦

    技嘉RTX 5090 D和 5080系列顯卡開售,性能猛獸降臨

    。 強大性能,卓越架構 ? 本次發售的RTX 50系列顯卡均來自NVIDIA Blackwell新架構,這一
    的頭像 發表于 02-05 14:32 ?90次閱讀
    技嘉<b class='flag-5'>RTX</b> 5090 D和 5080<b class='flag-5'>系列</b>顯卡開售,性能猛獸降臨

    技嘉科技發布GeForce RTX 5090 D 和RTX 5080系列顯卡

    旗艦散熱方案,釋放顯卡強勁性能 ?日前— 技嘉科技-主板、顯卡和硬件解決方案制造商,隆重推出搭載 NVIDIA? 革命性 Blackwell 架構的 GeForce RTX 5090 D 和
    的頭像 發表于 01-28 10:31 ?498次閱讀
    技嘉科技發布GeForce <b class='flag-5'>RTX</b> 5090 D 和<b class='flag-5'>RTX</b> 5080<b class='flag-5'>系列</b>顯卡

    技嘉CES 2025發布RTX 50系列顯卡,升級散熱縮小體積

    RTX? 5070等型號。這些顯卡均基于NVIDIA Blackwell架構及AI技術,為用戶帶來前所未有的游戲體驗。 技嘉新一代RTX 50系列
    的頭像 發表于 01-13 11:16 ?295次閱讀

    NVIDIA GeForce RTX 50系列:AI計算機圖形新紀元

    和筆記本電腦兩種版本,均搭載了NVIDIA革命性的Blackwell架構。 Blackwell架構的引入,使得GeForce RTX 50系列
    的頭像 發表于 01-13 10:49 ?138次閱讀

    $1999 的 RTX 5090 來了

    “ ?NVIDIA 的 GeForce RTX 5090 將于1月30日發售,起價 $1999。雖然可能買不到,但如果可以把4090的價格打下來,那也是非常不錯的...... ? ” Geforce
    的頭像 發表于 01-13 10:03 ?603次閱讀
    $1999 的 <b class='flag-5'>RTX</b> 5090 來了

    英偉達發布Blackwell架構RTX 50系列顯卡

    在萬眾矚目的CES 2025展會上,NVIDIA CEO黃仁勛震撼發布了基于全新Blackwell架構RTX 50系列顯卡,為全球圖形處理領域帶來了革命性的突破。 此次發布的
    的頭像 發表于 01-09 11:06 ?185次閱讀

    NVIDIA推出GeForce RTX 50系列臺式機和筆記本電腦GPU

    NVIDIA 宣布為游戲玩家、創作者和開發者推出最先進的消費級 GPU——GeForce RTX 50 系列臺式機和筆記本電腦 GPU。
    的頭像 發表于 01-08 11:05 ?315次閱讀

    NVIDIA推出面向RTX AI PC的AI基礎模型

    NVIDIA 今日發布能在 NVIDIA RTX AI PC 本地運行的基礎模型,為數字人、內容創作、生產力和開發提供強大助力。
    的頭像 發表于 01-08 11:01 ?249次閱讀

    技嘉于 CES 2025 首度亮相升級散熱設計與精實體積的 NVIDIA GeForce RTX 50 系列顯卡

    NVIDIA GeForce RTX? 50 系列顯示芯片設計的散熱系統,可大幅提升高負載需求的游戲表現。以 "Evolution of Ten" 為設計概念,技嘉新系列顯卡提升高達
    的頭像 發表于 01-07 17:57 ?236次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發表于 01-06 10:45 ?227次閱讀

    新款Nvidia Titan GPU正在開發中?或將擊敗未發布的RTX 5090

    ABSTRACT摘要最近有消息透露,NVIDIA正在開發一款名為TITANAI的新顯卡。該顯卡基于即將推出的BlackwellGPU。在Nvidia選擇不發布其RTX40系列
    的頭像 發表于 07-26 08:26 ?587次閱讀
    新款<b class='flag-5'>Nvidia</b> Titan GPU正在開發中?或將擊敗未發布的<b class='flag-5'>RTX</b> 5090

    Nvidia 再推出特供版顯卡 GeForce RTX 5090D

    ABSTRACT摘要NVIDIA正在準備另一款“D”版本RTX5090D,這將成為國內市場的旗艦GeForceRTX50系列顯卡。JAEALOT2024年7月4日NVIDIA正在準備另
    的頭像 發表于 07-19 08:26 ?724次閱讀
    <b class='flag-5'>Nvidia</b> 再推出特供版顯卡 GeForce <b class='flag-5'>RTX</b> 5090D

    RTX 5880 Ada Generation GPU與RTX? A6000 GPU對比

    NVIDIA RTX? 5880 Ada Generation GPU 是目前國內重量級 GPU,基于全新 NVIDIA Ada Lovelace 架構構建,采用 4nm 制成工藝,擁
    的頭像 發表于 04-19 10:20 ?2078次閱讀
    <b class='flag-5'>RTX</b> 5880 Ada Generation GPU與<b class='flag-5'>RTX</b>? A6000 GPU對比

    NVIDIA發布兩款新的專業顯卡RTX A1000、RTX A400

    NVIDIA今天發布了兩款新的專業顯卡RTX A1000、RTX A400,從編號就能看出來定位入門級,而且架構并非最新的Ada Lovelace,還是上一代的Ampere。
    的頭像 發表于 04-18 11:35 ?2563次閱讀
    <b class='flag-5'>NVIDIA</b>發布兩款新的專業顯卡<b class='flag-5'>RTX</b> A1000、<b class='flag-5'>RTX</b> A400

    NVIDIA RTX 5090痛失512位顯存!

    NVIDIA有望在今年底或明年初發布下一代RTX 50系列顯卡,大概率首發配備新一代GDDR7顯存,但是顯存位寬和之前的說法不太一樣。
    的頭像 發表于 03-11 16:02 ?958次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> 5090痛失512位顯存!
    主站蜘蛛池模板: 免费人成激情视频在线观看冫 | 亚洲天堂视频一区 | 网站啪啪 | 曰本裸色私人影院噜噜噜影院 | 女的扒开尿口让男人桶 | 中文字幕xxx| 色网站综合 | 欧美成人区| 色婷婷社区 | 欧美色图色就是色 | 日本一区二区免费在线观看 | 春宵福利网站 | 天天干在线影院 | 五月天婷婷免费视频观看 | 国产v69| 天堂资源在线播放 | 国产精品三级国语在线看 | 五月婷婷丁香综合 | 四虎.com | 九九re热| 天天干天日 | 国产欧美高清 | 日本黄色a级 | 久久艹影院 | 特黄一级毛片 | 福利99| 色天天综合网色鬼综合 | 禁漫画羞羞动漫入口 | 精品久久久久久中文字幕欧美 | 国产乱人视频免费播放 | 天天射天 | 亚洲一区二区三区中文字幕5566 | 69日本xxxxxxxxx98| 女人张开腿让男人桶免费最新 | youjizz国产 | 午夜视频在线观看www中文 | 年下系列高h文 | 色多多www网站 | 欧美一级高清片在线 | 一区二区三区四区在线 | 国产福利久久 |