在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

存內計算——助力實現28nm等效7nm功效

廖慧敏 ? 來源:jf_13681693 ? 作者:jf_13681693 ? 2024-05-17 15:03 ? 次閱讀

算力是數字經濟時代的核心生產力,并且近年來需求劇增。而我國當前的算力供給上仍面臨巨大的挑戰,一方面,國外的高端算力芯片被美國禁售,另一方面,國內的芯片產業仍處于發展階段[1]。如何獲取算力提升,成為當前時代芯片研究的重要命題。

一.算力突破

研究如何獲取算力提升,要從算力的來源上考慮。芯片算力可大致總結為以下計算公式:

因此,獲取算力提升的主要切入點是晶體管密度、芯片面積、單位晶體管的算力,這三個方面分別主要涉及制作工藝、光刻口徑、計算架構。

(1)晶體管密度:

晶體管密度的主要影響因素是制造工藝、基板材料,同樣的面積內,封裝的可用晶體管越多,就能提供越強的算力。

制造工藝方面,受限于美國的無理封鎖,當前國內量產芯片的最先進制造工藝為14nm,國際上量產芯片最先進的制造工藝為3nm。清華大學尹首一教授認為,國內芯片制造工藝將長期處于在14nm,國內芯片產業與研究不能指望通過制造工藝獲得性能提升。在國際領域,雖然芯片制造商仍能享受到制程工藝帶來的升級,但從蘋果A17Pro芯片的性能表現、高通仍然采用基于4nm的升級工藝制造今年旗艦芯片的市場行為來看,產業界最先進的工藝制程已經不及預期。

wKgZomZG_w2AFrk2AAak9a8makU966.png

基板材料方面,隨著制造工藝步入埃米級別,芯片制造工藝受到硅原子性質的影響越來越大,產業界和學界也在探索新的材料用于制造芯片,通過“彎道超車”的方式提升晶體管密度,比如英特爾廠商正在研發的玻璃基芯片[3]、北京大學彭練矛教授團隊正在研發的碳基芯片[4]。

(2)芯片面積

芯片面積和晶體管密度考慮的是類似的問題,在一顆芯片內提供更多的可用晶體管,就意味著能提供更多的算力。但是在當前,GPU的單芯片面積基本已經達到上限,想通過面積獲得進一步的算力提升,可以從拓展角度考慮,有兩個探索的方向:平面拓展和垂直拓展。

平面拓展就是在光刻時使用光照拼接技術,實現兩個曝光區域的物理連接,來把芯片做大,通過計算架構的優化設計,保證晶圓中晶體管的可用性,Cerebras公司Tesla公司已經實現了晶圓級芯片。垂直拓展就是把芯片或其中的部分器件三維堆疊起來,如AMD的3D緩存技術。

(3)單位晶體管提供的算力:

單位晶體管提供的算力和計算架構息息相關,計算架構的優化改進或使用新的計算架構,能夠對芯片算力產生更根本的影響。計算架構上面臨的主要問題有:基本器件的設計架構不同導致的晶體管數量不同,需要探索更優的基本器件結構設計;馮諾依曼架構的“存儲墻”導致的訪存瓶頸,限制了算力的發揮,需要降低帶寬對算力的限制;功耗限制導致的darkselect問題,即為了保證芯片功耗,不能同時點亮芯片上的所有晶體管,需要優化設計來避免。

面對以上的部分問題,產業界和學界已經給出了相應的解決方案。在計算架構的優化方面,有數據流、可重構、存算一體三條路徑。首先,數據流芯片嘗試不使用指令而是直接通過數據驅動計算,避免外部存儲訪問,來解決晶體管利用率低的問題。Google的TPU芯片已經證明了,這種方式雖然在單芯片性能上遜于GPU,但能在系統級算力上實現超越[1]。具體來講,單核TPU v4的性能是低于A100 GPU的,只有它的88%,但1024顆TPU v4的集群性能,超過了A100 GPU的集群性能,最高達到了1.96倍。4096顆TPUv4芯片示意圖如下圖3所示。

wKgZomZG_0SAUyAuAAibfY8mQu8058.png

圖 34096顆TPUv4芯片集成[6]

可重構芯片嘗試在芯片內布設可編程的計算資源,根據計算任務的數據流特點,動態構造出最適合的計算架構,國內團隊設計并在12nm工藝下制造的CGRA芯片,已經在標準測試集上實現了和7nm的GPU基本相當的性能。存算一體嘗試通過集成存儲和計算在一個芯片甚至一個容器內,來突破訪存限制,發揮芯片的最大算力。下面我們將重點介紹存算一體技術。

二.存算一體

存算一體是一種新型計算架構,直接利用存儲器本身進行數據處理,從根本上消除數據搬運,實現存儲與計算融合一體化,成為后摩爾時代集成電路領域的重點研究方向之一。

(1)存算一體技術優勢:

存算一體技術具有很大的優勢,存算融合的特點使其天然具備較大算力、低延遲、高帶寬等優勢。相比傳統架構,存算一體大算力芯片不僅僅是能效比有數量級的提升,更重要的是將大大緩解存儲墻問題,簡化AI服務器集群的互聯網絡及其管理和各類成本,包括高速互聯、DPU和能耗等。因此,存算一體技術是實現芯片算力突破的重要途徑,可助力實現28nm等效7nm功效。

(2)傳統工藝芯片算力提升實例:

目前已有一些企業和高校,通過存算一體技術,實現28nm制程芯片的能效算力提升。

憶鑄科技于2021年10月于上海成立,是一家基于ReRAM設計和落地數字存算一體芯片的企業。在公司的技術暢想中,他們嘗試將新型憶阻器、存算一體架構、Chiplet技術、3D封裝等技術結合,實現大算力、高能效比的芯片。據其官網信息,億鑄第一代算力芯片采用的工藝為28nm,其能效比可以實現目前主流算力板卡的10倍以上[7]。

2023年8月29日,華為的麒麟9000s芯片隨著Mate 60 Pro成功發布,該款芯片一經發出,就引發業界討論:“麒麟9000s的工藝制程究竟是多少?”在2023年中國集成電路設計業(ICCAD)年會上,清華大學魏少軍教授在演講中提出:“能夠用14nm,甚至28nm做成7nm的產品性能才是真正的高手”。據悉,華為并未公布麒麟9000s真正的工藝制程,知名科技解析機構TechInsights對麒麟9000s深入解析結果顯示,該芯片確實擁有7nm工藝制程的特性。

wKgaomZG_4qASTXfAAhO6-C-2sM264.png

圖 4 華為麒麟9000s芯片

知存科技的WTM2101量產芯片采用40nm制程,將神經網絡部署在芯片中,已經實現了滿足端側算力需求的語音識別等功能。即將量產的WTM8芯片,采用28nm制程,作為新一代存內AI計算視覺芯片,能夠實現圖像的AI超分、插幀、HDR識別和檢測這樣復雜的功能[8],現有的一些研究也已經證明存算一體可以實現16bit、32bit的浮點計算,具備進入高算力芯片的能力。

wKgZomZG_7-AVfuGAA7RTsVXOJM498.png

圖 5知存科技WTM-8系列芯片示意圖

三.未來展望

隨著工藝的進步,先進工藝制程已從28nm發展至3nm,蘋果新發布的A17Pro已采用了tsmc 3nm工藝。據悉,tsmc也將投資近萬億新臺幣建造1nm晶圓廠。在未來,有沒有一種全新的方案解決算力不足、工藝制程發展空間受限的局面?存算一體便是答案之一。

wKgaomZG__eATwmkAACAbHX2cbY443.png

綜上所述,存算一體技術因為其特殊優勢,可以大大提升芯片算力,從而使得成熟28nm制程芯片能夠實現等效于7nm制程芯片的性能。當然這其中還有很多難點需要突破,需要科研工作著的不斷努力,期待未來基于存算一體技術的芯片可以更好地突破芯片制程的限制。

參考資料

[1] 尹首一教授報告:以“架構”創新,突破算力卡脖子問題.

[2] 極客灣 space.bilibili.com/25876945.

[3] 第八屆未來芯片論壇中英特爾中國研究院的報告.

[4] 北京大學新聞網:專訪北大碳基芯片團隊:我們換道走了20年,覺得能走下去 (news.pku.edu.cn).

[5] AMD官網 amd.com.

[6] Jouppi N, Kurian G, Li S, et al. Tpu v4: An optically reconfigurable supercomputer for machine learning with hardware support for embeddings[C]//Proceedings of the 50th Annual International Symposium on Computer Architecture. 2023: 1-14.

[7] 憶鑄科技官網 (yizhu-tech.com).

[8] 知存科技官網(witintech.com).

[9] 從7nm到5nm,半導體制程 - 吳建明wujianming - 知乎(zhuanlan.zhihu.com/).

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    456

    文章

    51260

    瀏覽量

    427746
  • AI
    AI
    +關注

    關注

    87

    文章

    31670

    瀏覽量

    270472
  • 芯片制程
    +關注

    關注

    0

    文章

    51

    瀏覽量

    4742
  • 算力
    +關注

    關注

    1

    文章

    1023

    瀏覽量

    14970
  • 存內計算
    +關注

    關注

    0

    文章

    30

    瀏覽量

    1406
收藏 人收藏

    評論

    相關推薦

    Altera 28nm FPGA助力NEC提升LTE基站性能

    Altera的28nm FPGA所具有的靈活性和性能指標滿足了下一代基站各種LTE系統級特性的需求,而且沒有犧牲功效。近日Altera宣布NEC將使用其28nm FPGA,助力提高其L
    發表于 11-19 09:09 ?848次閱讀

    什么是Altera最新28nm FPGA技術?

    1月22日,Altera 在北京展示了號稱業界最全面的28nm 最新技術及強大解決方案。Altera公司的多位工程師為在京的媒體人士進行了講解。
    發表于 08-21 07:37

    如何利用28nm高端FPGA實現功耗和性能的平衡?

     從工藝選擇到設計直至投產,設計人員關注的重點是以盡可能低的功耗獲得最佳性能。Altera在功耗和性能上的不斷創新,那其28nm高端FPGA如何實現功耗和性能的平衡?具體有何優勢? 
    發表于 09-17 08:18

    10nm7nm等制程到底是指什么?宏旺半導體和你聊聊

    隨著半導體產業技術的不斷發展,芯片制程工藝已從90nm、65nm、45nm、32nm、22nm、14nm
    發表于 12-10 14:38

    請問C2000系列產品的制程是45nm還是28nm

    請問工程師,C2000系列產品的制程是45nm還是28nm?同一款新片可能采用不同的制程生產嗎?
    發表于 06-17 14:41

    Fusion Design Platform?已實現重大7nm工藝里程碑

    ? 在設計人員的推動下,加快部署7nm Fusion Design Platform,在具有挑戰性的設計方面,不僅設計實現質量提升了20%,設計收斂速度也提高了兩倍多。? Fusion Design
    發表于 10-22 09:40

    請大神解釋一下28nm下是沒有MIM電容了嗎?

    之前只用過tsmc 65nm的,在設置電感時候是有indcutor finder的工具的,28nm下沒有了嗎?只能自己掃描參數一個一個試?28nm下是沒有MIM電容了嗎?相關的模擬射頻器件(比如
    發表于 06-24 06:18

    求一份tsmc 7nm standard cell library

    求一份tsmc 7nm standard cell library求一份28nm或者40nm 的數字庫
    發表于 06-25 06:39

    7nm到5nm,半導體制程 精選資料分享

    7nm到5nm,半導體制程芯片的制造工藝常常用XXnm來表示,比如Intel最新的六代酷睿系列CPU就采用Intel自家的14nm++制造工藝。所謂的XXnm指的是集成電路的MOSFET晶體管柵極
    發表于 07-29 07:19

    28nm Stratix V FPGA突破帶寬瓶頸

    28nm Stratix V FPGA突破帶寬瓶頸 Altera公司的最新28nm Stratix V FPGA正是為滿足高帶寬應用設計要求而推出。 移動互聯網、高清視頻、軍事、醫療以及計算
    發表于 05-10 17:52 ?800次閱讀

    降低賽靈思28nm 7系列FPGA的功耗

    本白皮書介紹了有關賽靈思 28 nm 7 系列 FPGA 功耗的幾個方面,其中包括臺積電 28nm高介電層金屬閘 (HKMG) 高性能低功耗(28n
    發表于 03-07 14:43 ?41次下載
    降低賽靈思<b class='flag-5'>28nm</b> <b class='flag-5'>7</b>系列FPGA的功耗

    半導體制程發展:28nm向3nm的“大躍進”

    雖然高端市場會被 7nm、10nm以及14nm/16nm工藝占據,但40nm28nm等并不會退
    的頭像 發表于 10-15 11:18 ?5246次閱讀

    22nm28nm芯片性能差異

    據芯片行業來看,目前22nm28nm的芯片工藝技術已經相當成熟了,很多廠商也使用22nm28nm的芯片居多,主要原因就是價格便宜,那么這兩個芯片之間有什么性能差異呢?
    的頭像 發表于 06-29 09:47 ?1w次閱讀

    7nm芯片和5nm芯片哪個好

    7nm芯片和5nm芯片的區別在哪?7nm芯片和5nm芯片哪個好?在其他變量恒定的情況下,5nm芯片肯定要強于
    的頭像 發表于 07-05 09:26 ?2.4w次閱讀

    所謂的7nm芯片上沒有一個圖形是7nm

    最近網上因為光刻機的事情,網上又是一陣熱鬧。好多人又開始討論起28nm/7nm的事情了有意無意之間,我也看了不少網上關于國產自主7nm工藝的文章。不過這些文章里更多是抒情和遐想,卻很少有人針對技術
    的頭像 發表于 10-08 17:12 ?456次閱讀
    所謂的<b class='flag-5'>7nm</b>芯片上沒有一個圖形是<b class='flag-5'>7nm</b>的
    主站蜘蛛池模板: 国产一级做a爰大片免费久久 | 欧美一卡2卡三卡4卡5卡免费观看 | 色婷婷丁香 | 校园激情综合网 | 如果我们是季节韩剧在线观看 | 在线观看www日本免费网站 | 人人舔 | 国产骚b| 四虎影院网址大全 | 亚洲欧美色鬼久久综合 | 色西西| 欧美怡红院免费全部视频 | 成人欧美另类人妖 | 四虎影院国产精品 | 在线高清一级欧美精品 | 91大神亚洲影视在线 | 最新亚洲人成网站在线影院 | 三级网站免费 | 三级视频在线播放线观看 | 性做久久久久久久 | 奇米成人影视 | 国模精品视频 | 成人欧美精品一区二区不卡 | 久久综合九色综合97_ 久久久 | 一二三区在线观看 | 免费一级特黄特色大片在线 | 性欧美大胆高清视频 | 亚洲乱亚洲乱妇41p 亚洲乱亚洲乱妇41p国产成人 | 二区三区在线 | 狠狠操狠狠干 | aaaa视频| 免费观看黄视频 | 色吧色吧色吧网 | 天天干天天玩天天操 | a网在线 | 欧美亚洲综合另类成人 | 一级欧美视频 | 狠狠色婷婷 | 精品卡1卡2卡三卡免费网站视频 | 国产精品丝袜 | 免费在线看片网站 |