在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MCM正在潛移默化地改變芯片設計

21克888 ? 來源:電子發燒友網 ? 作者:凱揚 ? 2022-05-09 08:32 ? 次閱讀

多芯片模塊(MCM)技術的應用在半導體業界已經不是什么新鮮事了,但隨著Chiplet、2.5D/3D封裝技術日趨火熱,MCM正在滲透進更多的芯片設計中,無論是GPU、光模塊還是AI芯片,都在慢慢引入這類封裝技術。

MCM GPU成為趨勢

以去年AMD發布的首個MCM GPU Instinct MI250X為例,這款GPU集成了兩個GPU Chiplet和128GB的超大HBM2e內存,在算力和帶寬上都做到了極致,實現了383TFLOPS(FP16)和3.2TB/s的可怕成績,無疑是專注AI的各大超算中心夢寐以求的加速器了。同樣,英特爾也在其Ponte Vecchio GPU上采用了MCM。

Instinct MI250X GPU / AMD

雖然MCM已經由AMD和英特爾兩家GPU廠商開始推進了,但目前來看英偉達的動作比較小,雖然有相關的研究,但還未拿出商用的MCM產品。不過以上都是面向HPC/AI市場的GPU,消費級的GPU是否也會迎來MCM的GPU呢?據現在的傳聞,AMD極有可能在下一代RDNA3架構的高端GPU中用上MCM。

但消費級應用與HPC/AI應用又屬于截然不同的場景,后者使用多個GPU跑負載是很常見的情況。但消費場景中多GPU已經相當少見了,在兼容性上肯定會大打折扣,所以邁出這一步很可能會帶來一定的風險。

IP公司眼中的MCM

MCM不僅為GPU公司帶來了更多設計靈活性,也讓一眾IP公司找到了新的商業模式。比如IP公司Credo就提供混合信號DSP IP,用于客戶的ASIC設計,以Chiplet的形式集成到SoC上,打造更低功耗更高性能的MCM。隨著數據中心的網絡架構慢慢趨向于400G以上,芯片連接性的要求也在逐步升高。為此,Credo在去年底推出了全新的3.2Tbps BlueJay重定時器chiplet,通過64通道56Gbps PAM4 LR的DSP,提供了強大的系統級連接性。

BlueJay Chiplet / Credo

BlueJay雖然只是以臺積電28nm工藝打造,但保證了性能和功耗的要求,與其先進工藝方案Nutcracker相比也降低了成本。此外,由于BlueJay與主機端MCM中SoC核心的通信是通過超低功耗的BoW D2D接口實現的,其接口已經針對臺積電的CoWoS封裝技術做了優化。這種將SerDes功能從片上(on-die)轉向片外(off-chip)的做法,顯著增加了ASIC的可使用面積,設計者可以將這一部分多出來的面積用于實現更高的計算性能。

AI在MCM上的創新

同樣,AI也在MCM上找到了新的解決方案。我們已經看到了大的機器學習模型通過訓練大數據在多個領域展示了驚人的成果,比如計算機視覺、語音識別和自然語言處理等。為了減少機器學習加速器的成本,業界引入了不少設計創新,其中之一就是MCM。

Coral TPU / 谷歌

英偉達的Simba,谷歌的TPU,都用到了MCM的設計。谷歌的Coral TPU是一個用于邊緣端的機器學習推理加速器,在極小的占用面積下可以實現4 TOPS(INT8)的峰值性能,能效比可達2 TOPS/W。英偉達的Simba同樣是一個用于推理的芯片,但規模比谷歌的Coral更大,整個MCM由36個Chiplet組成,每個都能實現4 TOPS的峰值性能,將整個芯片算力提升至最高128 TOPS,能效比更是高達6.1 TOPS/W。

一來在設計上,設計小芯片的難度比一整塊芯片要低,二來小芯片由于面積較小,生產良率也更高。這都證明了這種方案既可以減少設計和生產成本,也能達到與單個大芯片近似的性能與能效。

但正如我們上文提到的MCM GPU兼容問題一樣,機器學習中MCM也并非毫無痛點。由于MCM中單個Chiplet的內存遠比單個大芯片要小,所以大型機器學習模型的訓練與推理都需要將矢量計算的數據流圖在Chiplet上進行劃分。多芯片進行劃分就是為了將運算分配給Chiplet,從而將某個性能指標最大化,比如說吞吐量。但與單芯片不一樣,MCM中小芯片的數量以及神經網絡的節點數量增加,都會讓搜索空間成指數級增長,從而降低效率,更不用說因為MCM的硬件特性,可用的劃分方案并不多。所以這種劃分的質量,直接影響到了MCM芯片設計的優化。

為了解決這個問題,谷歌的研究員們開發了一種深度強化學習的劃分方案,同時利用一個約束求解器來專門解決MCM封裝的機器學習模型劃分問題。他們的方案可以通過預訓練來普及到未知的輸入圖,通過對生產級BERT模型的硬件評估,他們得到了超過隨機搜索和模擬退火等現有方案5%以上的吞吐量。更重要的是,這種方案具備極佳的遷移學習性能,使用預訓練的模型可以有效提升樣本效率,將搜索時間從3個小時減少到了9分鐘。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 芯片
    +關注

    關注

    459

    文章

    51880

    瀏覽量

    433071
  • 芯片設計
    +關注

    關注

    15

    文章

    1055

    瀏覽量

    55374
  • MCM
    MCM
    +關注

    關注

    1

    文章

    68

    瀏覽量

    22501
收藏 人收藏

    評論

    相關推薦

    谷東AR+AI智能眼鏡如何改變生活

    這不是科幻電影,而是一副AR+AI眼鏡正在發生的“魔法”。今天,我們帶大家走進這款即將改變生活的未來科技——谷東AR+AI智能眼鏡。
    的頭像 發表于 04-14 12:50 ?291次閱讀

    AI在芯片上的應用:革新設計與功能

    AI在芯片上的應用正在深刻改變芯片設計、制造和應用的全過程。未來,隨著AI技術的不斷進步和應用場景的不斷拓展,AI芯片將成為推動科技發展的
    的頭像 發表于 02-17 16:09 ?353次閱讀

    EE-70:ADSP-2106x SPORT DTx引腳:不同SHARC之間是否存在潛在的MCM數據爭用

    電子發燒友網站提供《EE-70:ADSP-2106x SPORT DTx引腳:不同SHARC之間是否存在潛在的MCM數據爭用.pdf》資料免費下載
    發表于 01-03 15:11 ?0次下載
    EE-70:ADSP-2106x SPORT DTx引腳:不同SHARC之間是否存在潛在的<b class='flag-5'>MCM</b>數據爭用

    Chiplet或改變半導體設計和制造

    在快速發展的半導體領域,小芯片技術正在成為一種開創性的方法,解決傳統單片系統級芯片(SoC)設計面臨的許多挑戰。隨著摩爾定律的放緩,半導體行業正在尋求創新的解決方案,以提高性能和功能,
    的頭像 發表于 12-05 10:03 ?483次閱讀
    Chiplet或<b class='flag-5'>改變</b>半導體設計和制造

    Chiplet將徹底改變半導體設計和制造

    本文由半導體產業縱橫(ID:ICVIEWS)編譯自IDTechEx全球Chiplet市場正在經歷顯著增長,預計到2035年將達到4110億美元。 在快速發展的半導體領域,小芯片技術正在成為一種開創性
    的頭像 發表于 11-25 09:50 ?342次閱讀
    Chiplet將徹底<b class='flag-5'>改變</b>半導體設計和制造

    正在使用的芯片停產,而您又不想改變PCB布局時,該怎么辦?

    我們的一位客戶遇到了一個棘手的問題,正在使用的芯片停產,而客戶又不想改變PCB布局,找到瑞蘇盈科,要求我們為停產的鍵盤編碼器IC開發一種無須更換的替代品。面臨的挑戰如何用無須改動的替代品取代已停產
    的頭像 發表于 10-25 08:03 ?408次閱讀
    <b class='flag-5'>正在</b>使用的<b class='flag-5'>芯片</b>停產,而您又不想<b class='flag-5'>改變</b>PCB布局時,該怎么辦?

    ASML CEO傅恪禮:亞洲將繼續主導芯片行業

    ASML總裁兼CEO傅恪禮近日在接受外媒采訪時指出,盡管西方國家正在積極增加芯片生產,但亞洲在芯片行業中的主導地位不太可能發生改變。
    的頭像 發表于 10-10 15:13 ?694次閱讀

    芯片封裝是什么?芯片封裝中芯片環氧膠的應用有哪些?

    通過導線連接芯片與外部電路,實現信號傳輸,并幫助散熱。封裝層次:零級封裝:芯片互連,連接芯片焊區與封裝。一級封裝(SCM/MCM):單或多芯片
    的頭像 發表于 09-20 10:15 ?793次閱讀
    <b class='flag-5'>芯片</b>封裝是什么?<b class='flag-5'>芯片</b>封裝中<b class='flag-5'>芯片</b>環氧膠的應用有哪些?

    請問固定增益芯片是否意味著不能通過改變外圍參數來改變增益?

    固定增益芯片是否意味著我不能通過改變外圍參數來改變增益?
    發表于 09-11 07:13

    Tidal正在改變其音頻格式

    對于發燒友來說,大新聞是:Tidal正在改變其音頻格式。從7月24日開始,Tidal將放棄對Master Quality Authenticated(MQA)和360 Reality Audio格式
    的頭像 發表于 06-24 16:51 ?848次閱讀

    聯發科正在開發Arm架構Windows PC芯片

    據權威媒體援引三位知情人士的消息報道,聯發科正在緊鑼密鼓地開發一款基于Arm架構的個人電腦芯片。這款芯片將成為推動Windows操作系統在新型電腦設備上運行的重要力量。
    的頭像 發表于 06-13 09:16 ?879次閱讀

    N8900藍牙音樂芯片,打造寶寶舒適睡眠環境

    ,不僅有助于寶寶更快地進入夢鄉,還能在潛移默化中培養他們的音樂素養。一直以來,做母親的都知道利用搖籃使孩子盡快入睡。美國俄亥俄州大學的研究人員發現,搖晃還有益于嬰兒
    的頭像 發表于 05-13 17:12 ?463次閱讀
    N8900藍牙音樂<b class='flag-5'>芯片</b>,打造寶寶舒適睡眠環境

    N8900藍牙音樂芯片,打造寶寶舒適睡眠環境

    ,不僅有助于寶寶更快地進入夢鄉,還能在潛移默化中培養他們的音樂素養。 首先,讓我們聚焦N8900藍牙音樂芯片的功能特點。 這款芯片擁有32位CPU和DSP硬件解碼,能夠高效處理音頻信號,確保音樂播放的流暢性和音質的高保真。 同時
    的頭像 發表于 05-13 11:47 ?680次閱讀

    蘋果正在研發全新數據中心AI芯片

    蘋果正在秘密研發一款全新的數據中心AI芯片,這一項目在公司內部被稱為“ACDC”,并且已經經過了數年的精心籌備。據華爾街日報的知情人士透露,這款芯片的設計目標是為了優化蘋果數據中心服務器運行人工智能軟件的能力。
    的頭像 發表于 05-08 09:40 ?574次閱讀

    STM32 PMSM FOC 4.2中怎么改變調速電阻的在芯片上的管腳位置?

    STM32 PMSM FOC 4.2中怎么改變調速電阻的在芯片上的管腳位置,比如原來調速電阻接在pb0腳,我要將其改在pb2腳。
    發表于 05-06 07:57
    主站蜘蛛池模板: 天天综合色网 | 乱高h辣黄文np公交车 | 666精品国产精品亚洲 | 国模私拍视频在线观看 | 日本不卡1 | 夜夜操美女| 一区二区三区久久 | 在线黄色免费网站 | 丁香网五月| 国产午夜精品理论片久久影视 | 男人天堂伊人网 | 极品国产一区二区三区 | 亚洲欧美在线观看 | 午夜免费理论片在线看 | 国产福利资源 | 一级片免费在线观看 | 俺也来国产精品欧美在线观看 | 国产播放啪视频免费视频 | 69国产| 色福利网站 | 成人窝窝午夜看片 | 日本亚洲成人 | 美女露出尿囗 | 一本大道一卡二卡四卡 | 久久精品视频7 | 精品欧美小视频在线观看 | 人人艹人人干 | 有没有免费的视频在线观看 | 一本大道高清在线视频 视频 | www.亚洲一区 | 9久久99久久久精品齐齐综合色圆 | 男人操女人免费 | 手机毛片在线 | 天天干天天干天天干天天干天天干 | 成 黄 色 激 情视频网站 | 天天干天天操天天爽 | 国产精品久久久久久久9999 | 欧美三级中文字幕hd | 国产精品福利视频手机免费观看 | 免费看片你懂的 | 神马午夜第九 |