在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

超異構帶來的算力指數級提升,使得Chiplet的價值得到更加充分的發揮

ruikundianzi ? 來源:IP與SoC設計 ? 作者:IP與SoC設計 ? 2022-11-02 12:51 ? 次閱讀

編者按

Chiplet標準UCIe已經得到很多主流大廠的認可,席卷之勢愈發明顯。但就Chiplet的價值挖掘,目前可見的,都還停留在如何降成本和簡單地擴大設計規模方面。我們覺得,Chiplet的價值還沒有得到充分挖掘。 Chiplet帶來的價值,不應該是線性增長,而應該是指數增長:

一方面,量變會引起質變,Chiplet的流行,快速增加的單芯片設計規模,會給系統架構創新提供更大的發揮空間,使得計算的架構,從異構走向超異構。

另一方面,超異構帶來的算力指數級提升,使得Chiplet的價值得到更加充分的發揮,反過來會促進Chiplet的大范圍流行。

1 背景知識

1.1 單DIE性能和成本

6c87c174-5a64-11ed-a3b6-dac502259ad0.png

單DIE的性能和成本,是正相關的關系。通常的芯片DIE設計,一定是在保證系統所需性能的條件下,選擇最合適的工藝,達到最合適的面積(成本),達到在性能約束條件下的性能成本比最優。或者說:

在系統性能成本最優的狀態下,受邊際效應影響,想再想增加單DIE性能,所需要付出的成本代價非常高,會顯著影響性價比。

在系統性能成本最優的狀態下,想要再優化單DIE成本,可能會引起性能的大比例下降,反而不是性價比最優。

1.2 Chiplet協議UCIe

英特爾AMDARM高通三星、臺積電、日月光等大廠,以及Google Cloud、Meta、微軟于2022年3月2日宣布了一項新技術標準UCIe(Universal Chiplet Interconnect Express)。UCIe是一個開放的行業互連標準,可以實現小芯片之間的封裝級互連,具有高帶寬、低延遲、經濟節能的優點。 UCIe能夠滿足幾乎所有計算領域,包括云端、邊緣端、企業、5G、汽車、高性能計算和移動設備等,對算力、內存、存儲和互連不斷增長的需求。UCIe 具有封裝集成不同Die的能力,這些Die可以來自不同的晶圓廠、采用不同的設計和封裝方式。

6c9c0fbc-5a64-11ed-a3b6-dac502259ad0.png

UCIe白皮書中給出的Chiplets封裝集成的價值:

首先是面積的影響。為了滿足不斷增長的性能需求,芯片面積增加,有些設計甚至會超出掩模版面積的限制。即使不超過面積限制,改用多個小芯片也更有利于提升良率。另外,多個相同Die的集成封裝能夠適用于更大規模的場景。

另一個價值體現在降低成本。例如,處理器核心可以采用先進的工藝,用更高的成本換取極致的性能,而內存和I/O控制器則可以復用非先進工藝。隨著工藝節點的進步,成本增長非常迅速。若采用多Die集成模式,有些Die的功能不變,我們不必對其采用先進工藝,可在節省成本的同時快速搶占市場。Chiplet封裝集成模式還可以使用戶能夠自主選擇Die的數量和類型。例如,用戶可以根據需求挑選任意數量的計算、內存和I/O Die,并無需進行Die的定制設計,可降低產品的SKU成本。

允許廠商能夠以快速且經濟的方式提供定制解決方案。如圖1所示,不同的應用場景可能需要不同的計算加速能力,但可以使用同一種核心、內存和I/O。Chiplet方式允許廠商根據功能需求對不同的功能單元應用不同的工藝節點,并實現共同封裝。相比板級互連,封裝級互連具有線長更短、布線更緊密的優點。

1.3 超異構計算

系統變得越來越龐大,系統可以分解成很多個子系統,子系統的規模已經達到傳統單系統的規模。因此,都升級一下:系統變成了宏系統,子系統變成了系統。 系統足夠龐大,場景綜合,單類型架構無法包打天下:

CPU靈活性最好,但性能較差;

DSA性能很好,但靈活性差;

GPU介于兩者之間,可以說能較好的平衡性能和靈活性,也可以說,性能和靈活性都不夠極致。

規模龐大的復雜系統存在很多硬件加速的空間:

復雜系統最核心的一個特征是二八定律。用戶只關心自己的應用,而應用通常只占系統的20%,另外80%用戶不關心的也相對確定的部分,一般稱為基礎設施,這些是可以通過硬件加速來優化性能的。

系統是逐步發展和沉淀的。很多原本屬于應用層的工作任務,隨著時間推移,越來越成熟,逐漸地沉淀成了基礎設施。這些沉淀的工作任務可以通過硬件加速來優化性能。最典型的場景是AI推理,現在已經成為了基礎的服務,供不同的應用調用。

云計算、邊緣計算等形式的綜合計算模式下,單個用戶應用的規模可能不大,但因為云計算的超大規模和多租戶,很多相似的用戶應用其總和規模足夠龐大,因此,也可以通過GPU、FPGA或專用芯片的方式進行加速優化。

6cd8b4a8-5a64-11ed-a3b6-dac502259ad0.png

那么,要做的就是揚長避短,把不同類型的處理引擎協作起來,把各種引擎的優勢充分利用起來,形成超異構計算架構:

DSA負責相對確定的大計算量的工作;

GPU負責應用層有一些性能敏感的并且有一定彈性的工作;

CPU啥都能干,負責兜底。

于是整個系統架構就變成了超異構架構。

6cffbad0-5a64-11ed-a3b6-dac502259ad0.png

總結一下計算架構發展的四個階段:

第一階段,單CPU串行計算;

第二極端,多核CPU的并行計算;

第三階段,CPU+xPU的異構計算;

第四階段,CPU+GPU+DSA+etc.的超異構計算。

2 Chiplet技術方案

2.1 方案1:設計規模不變,優化單DIE面積和良率等

6d111488-5a64-11ed-a3b6-dac502259ad0.png

一般情況下,在同等工藝同等功耗技術下,我們可以簡單地認為,面積和成本成正比的。Chiplet實現用面積更小的DIE,實現同等規模設計,其優勢主要為:

單DIE面積變小,增加芯片良率。而通常,單DIE的面積是已經平衡好良率的情況下的,再減小面積優化良率,可能效果并不是很明顯。并且,多DIE封裝會帶來額外的良率風險。這樣,一里一外的問題,通過多DIE來優化良率的效果可能就不會很明顯。

可以讓一些DIE不采用先進工藝,通過較低一些的工藝降低成本。

在不改變性能的條件下,通過Chiplet封裝可以降低成本;也可以反過來說,在同樣成本條件下,通過Chiplet封裝可以提升性能。

2.2 方案2:單DIE設計規模不變,多DIE集成

6d243f9a-5a64-11ed-a3b6-dac502259ad0.png

當我們確定好單個DIE的性能和面積(功耗)的時候,這個時候相當于是把工藝的價值挖掘到了最優。需要Chiplet的價值,也同樣需要工藝的價值,都不能少。 我們要做的是在工藝價值的基礎上,再疊加Chiplet封裝的價值。而不是如方案1一樣,為了Chiplet而Chiplet,反而放棄工藝的價值。 因此,我們可以在原有DIE的基礎上,通過多DIE封裝來立竿見影地提升性能。

2.3 方案3:多DIE集成設計規模倍增,并且重構系統

6d331ace-5a64-11ed-a3b6-dac502259ad0.png

通常,CPU組成的芯片,性能不夠;而GPU、DSA組成的芯片無法單獨工作,需要外掛CPU,形成CPU+XPU的異構計算架構;而SOC本質上是CPU+xPU的多個異構系統的集成。 異構計算和SOC,本質上都是以CPU為中心的系統,XPU是一個個孤島,所有的事情都需要CPU的參與才能把這些處理引串起來。 超異構完全打破不同處理引擎之間的界限,CPU和其他XPU同樣的地位,XPU間可以非常充分的交互,達到系統充分的整合。超異構計算可以做到:

性能和靈活性兼顧。因為二八定律的緣故,絕大部分計算是在DSA級別的處理引擎中完成,所以性能效率很好。而用戶關心的應用依然是在CPU級別的處理引擎完成,又兼顧了靈活可編程性。

因為超異構計算架構可以駕馭更大的系統,因此,可以做到,在性能效率和DSA同量級的情況下,性能相比DSA再數量級的提升。

2.4 方案性能提升對比

6d43f308-5a64-11ed-a3b6-dac502259ad0.png

注意:本節內容是定性分析,還無法做到定量分析。 方案1,可以實現性能的百分比增長。方案1的道理很好理解,本來的目標是優化成本,在同等性能情況下,能夠百分比地優化成本。我們相應地折算一下,在同等成本下,方案1可以做到性能的百分比提升。 方案2,可以實現性能的線性增長。方案2也很好理解,通過增加更多數量的DIE來提升并行度,以此來提升性能。集成多少個DIE,性能就增加到多少倍。 方案3,可以實現性能的指數增長。方案3通過整個系統重構,挖掘系統的一些可加速的點,然后再實現整個系統的充分整合重構。以此來提升性能。可以達到數量級的性能增長。

3 總結

3.1 設計規模的量變,引起系統架構的質變

規模是一個很重要的因素。 云計算百萬臺的超大規模,其軟硬件架構和運營模式跟傳統的數百臺的私有機房是完全迥異的。深度神經網絡,通過更大量數據、更深層次網絡的量變,成就了AI的“智”變。 芯片也是同樣的道理,隨著規模的增長,很多設計方案考慮的問題會跟以前完全不一樣。在小規模的時候,我們強調定制,極度優化性能和功耗等;但等到超大規模IC設計,我們更多關注的是通用性、可編程性、易用性、生態等。 Chiplet機制,提供了立竿見影讓芯片設計規模數量級增加的能力。如果我們不在系統架構層次創新,充分利用芯片規模數量級增加的這個優勢,只是簡單的平行擴展,那真是暴殄天物,浪費Chiplet給系統架構師們的饋贈。 換個角度,現有的異構計算也好,SOC也好,無法駕馭Chiplet提供的超大規模芯片系統。需要本質的、體系性的系統架構創新,來更好地駕馭Chiplet的價值。

3.2 超異構,讓Chiplet價值得到更大的發揮

超異構集成更多的處理引擎,提供更高的并行性,實現更分布式的系統,可以更好地駕馭數量級增加的芯片設計規模。 此外,Chiplet更好地容納現有宏系統的承載,通過超異構,使得很多性能優化措施得到落實,從而使得性能指數級增長(而不是根據面積的增加,線性增長)。 可以說,超異構,成就了Chiplet更大的價值,使得Chiplet方案得到更大范圍的落地,促進Chiplet技術的成熟和市場繁榮。

3.3 Chiplet和超異構的關系:雙劍合璧,相互成就

6d625c26-5a64-11ed-a3b6-dac502259ad0.png

超異構計算和Chiplet技術是相互協同、相互成就的關系:

系統越大,設計規模越大,超異構的性能優勢就越明顯。

超異構計算,需要數量級提升的晶體管資源,而Chiplet可以在芯片層次提供如此規模的晶體管資源,實現超異構計算方案和價值落地。

超異構計算的價值得到充分體現,超異構不斷落地,會帶動Chiplet的價值發揮、更廣泛的落地以及市場繁榮。

隨著超異構的發展,對Chiplet的要求會不斷提高,需要Chiplet技術向更高的能力邁進。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 單芯片
    +關注

    關注

    3

    文章

    461

    瀏覽量

    35098
  • chiplet
    +關注

    關注

    6

    文章

    453

    瀏覽量

    12888
  • UCIe
    +關注

    關注

    0

    文章

    49

    瀏覽量

    1804

原文標題:超異構 x Chiplet:雙劍合璧,實現算力指數級提升

文章出處:【微信號:IP與SoC設計,微信公眾號:IP與SoC設計】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    “四合一”平臺,芯片國產化率九成,兼容8種國產AI芯片

    調度平臺可支持每天上億次的調用,能調度全國1/6的規模,網一體化效率提升20%。 ?
    的頭像 發表于 04-13 00:03 ?2492次閱讀

    潤和軟件發布StackRUNS異構分布式推理框架

    當下,AI模型規模持續膨脹、多模態應用場景日益復雜,企業正面臨異構資源碎片化帶來的嚴峻挑戰。為應對行業痛點,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發布自主研發的Sta
    的頭像 發表于 06-13 09:10 ?203次閱讀
    潤和軟件發布StackRUNS<b class='flag-5'>異構</b>分布式推理框架

    梯度科技助力客戶破解調度難題

    在數字經濟與人工智能深度融合的新階段,已成為支撐人工智能發展的核心生產。梯度科技基于云原生技術架構研發的調度平臺,以“
    的頭像 發表于 04-27 16:32 ?366次閱讀

    RAKsmart智能架構:異構計算+低時延網絡驅動企業AI訓練范式升級

    在AI大模型參數量突破萬億、多模態應用爆發的今天,企業AI訓練正面臨效率與成本的雙重挑戰。RAKsmart推出的智能架構,以異構計算
    的頭像 發表于 04-17 09:29 ?260次閱讀

    弘信電子旗下燧弘華創與聯想發布多元異構調度平臺

    近日,燧弘華創慶陽綠色智中心迎來里程碑時刻——由燧弘華創與聯想合作共建的多元異構調度平臺正式發布。
    的頭像 發表于 03-31 11:41 ?458次閱讀

    【一文看懂】什么是端側

    隨著物聯網(IoT)、人工智能和5G技術的快速發展,端側正逐漸成為智能設備性能提升和智能化應用實現的關鍵技術。什么是端側,它的應用
    的頭像 發表于 02-24 12:02 ?1127次閱讀
    【一文看懂】什么是端側<b class='flag-5'>算</b><b class='flag-5'>力</b>?

    融合 南京信易達發布全新“智能融合平臺”

    四大系統模塊,為集群提供全面的運營運維管理服務與用戶自助服務。 通過資源監控、作業調度、應用中心、數據中心等功能,一站式解決多元的管理復雜性、資源
    的頭像 發表于 01-08 10:56 ?555次閱讀
    <b class='flag-5'>超</b><b class='flag-5'>算</b>智<b class='flag-5'>算</b>融合 南京信易達發布全新“智能<b class='flag-5'>算</b><b class='flag-5'>力</b>融合平臺”

    芯片 高性能 CPU/GPU/NPU 微架構分析》第1-4章閱讀心得——之巔:從基準測試到CPU微架構的深度探索

    。這一方法突顯了現代的核心優勢——并行計算能力。舉一個具體實例來說,天河二號采用了異構架構,集成了英特爾至強處理器和中國自主研發的申威眾核加速器。這種CPU與協處理器的結合不僅提升
    發表于 10-19 01:21

    中國智能汽車騰飛,為什么異構是第一生產

    智能時代的“世紀之車”,異構是第一驅動力
    的頭像 發表于 09-14 10:32 ?4265次閱讀
    中國智能汽車騰飛,為什么<b class='flag-5'>異構</b><b class='flag-5'>算</b><b class='flag-5'>力</b>是第一生產<b class='flag-5'>力</b>?

    的分類與現代生活

    提升使得用戶能夠享受到更加流暢和豐富的數字體驗。 個人通常指的是個人使用的計算設備,如智
    的頭像 發表于 08-26 15:05 ?454次閱讀
    <b class='flag-5'>算</b><b class='flag-5'>力</b>的分類與現代生活

    安謀科技異構組合,破局生成式AI挑戰

    ,“此芯P1”不僅異構集成了Armv9 CPU核心與Arm Immortalis GPU,還搭載了安謀科技(中國)有限公司(以下簡稱“安謀科技”)“周易”NPU等自研業務產品。憑借高能效的異構
    的頭像 發表于 08-13 09:12 ?849次閱讀

    異構,打贏智時代「牧野之戰」

    商周大戰?周武王用「異構」拿下戰場!
    的頭像 發表于 07-24 14:13 ?2115次閱讀
    <b class='flag-5'>異構</b>智<b class='flag-5'>算</b>,打贏智<b class='flag-5'>算</b>時代「牧野之戰」

    神州鯤泰亮相北京數字安全大會,以智能構筑數據安全的堅實底座

    正成為賦能各行各業數字化轉型的基礎技術要素,神州鯤泰面對智時代多云、異構、綠色計算等現實需求,智集群間以及集群內復雜
    的頭像 發表于 07-18 16:06 ?634次閱讀
    神州鯤泰亮相北京數字安全大會,以智能<b class='flag-5'>算</b><b class='flag-5'>力</b>構筑數據安全的堅實底座

    異構混訓整合不同架構芯片資源,提高利用率

    的解決方案。通過混合使用多種異構芯片,可以充分利用不同芯片的優勢,提高利用率,降低成本,
    的頭像 發表于 07-18 00:11 ?4100次閱讀
    主站蜘蛛池模板: 国产色司机在线视频免费观看 | 欧美猛性| 三级免费黄录像 | 日日噜噜爽爽狠狠视频 | 精品免费福利视频 | 4虎.最新地址 | 理论毛片| 一色屋成人免费精品网 | 成人综合在线观看 | 爱爱视频天天看 | 91大神精品 | 91牛牛 | 久久久久久久久综合 | 亚洲h视频 | 日韩无| 人人爱天天操 | 调教r18车肉高h男男 | 日本写真高清视频免费网站网 | 亚洲一本视频 | 国产成人一区二区三中文 | 1024人成网色www | 一级做a爰片久久毛片美女图片 | 欧美videos 另类 | 午夜嘿嘿嘿 | 黄视频在线观看网站 | 欧美三级免费观看 | 激情在线网站 | 欧美性白人极品1819hd | 久久99精品久久久久久园产越南 | 大片毛片女女女女女女女 | 欧美色图一区二区 | 国产婷婷高清在线观看免费 | 日本三级香港三级人妇 m | 欧美成人猛男性色生活 | 看毛片网 | 国产激情视频一区二区三区 | 午夜视频在线观看国产 | 亚洲爽视频 | 免费看曰批女人爽的视频网址 | 国内一区二区 | 国产伦子一区二区三区 |