在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

3.5D Chiplet技術典型案例解讀

奇異摩爾 ? 來源:奇異摩爾 ? 2025-03-03 11:15 ? 次閱讀

大模型訓練集群的有效算力

DeepSeek的創新引領大模型基座模型向MoE專家模型進一步演進,未來大模型的參數將從千億級別向萬億參數邁進,開啟人工智能的新紀元。在這一過程中,端側推理模型的誕生離不開原研基座模型的精心訓練。隨著模型參數的不斷擴大以及AI模型的百舸爭流,訓練側所需的算力也將進一步激增。由此所依托的AI基礎設施的有效算力已成為下一代AI應用的堅實基石。

智算集群的有效算力由包括單個加速卡的基礎算力、集群規模、Scale Out與Scale Up所共同構筑的集群線性加速比以及集群有效運營的時間等多個維度因素構建。在不設資源限制的情況下,我們希望擁有最強大的單個計算卡系統來運行整個AI任務,因為,AI任務作為一個單一實體運行。因此,直接獲取最大能力的GPU/xPU是符合邏輯的選擇。

3D IC : 下一代AI芯片的加速引擎

后摩爾時代,算力的增長和芯片的性能提升之間面臨著內存墻、功耗墻、面積墻等幾大瓶頸, 采用基于先進封裝的3D Chiplet堆疊芯片帶來的重大升級將有效解決這些瓶頸。

4065d6e4-f4ef-11ef-9310-92fbcf53809c.png

3D-IC 的優勢可概括為以下幾點:

1可以降低成本,Chiplet的解耦特性讓先進制程節點更靈活,讓非所有功能(包括模擬和存儲器)都需要遷移到先進制程節點;

2更容易滿足高速互連和帶寬要求,幫助先進存儲器技術達到 100Gbps的速度;

33D-IC 支持更小的尺寸,可以節省電路板和終端產品的空間;

43D-IC 可以降低功耗,因為不再需要大型驅動器。3D 堆疊可以使用小型 I/O 驅動器,功耗更低。此外,減少電阻-電感-電容 (RLC)寄生參數也有助于進一步降低功耗;

5減少了跨封裝之間的互連,可以實現更快的性能和更好的功耗表現。

3.5D技術的引入將顯著提升AI集群的計算密度和功耗效率,使得數據中心能夠以更低的能耗處理更大的工作負載。這對于應對生成式AI模型的指數級增長需求至關重要。本期主要介紹幾個3.5D Chiplet典型案例,分享3D IC設計架構趨勢。

典型案例1

AMD MI300 系列開創3.5D IC先河

408140f0-f4ef-11ef-9310-92fbcf53809c.png

(來源:AMD)

AMD是首批采用3.5D IC設計及工藝的芯片公司,2024年發布的MI300 X GPU加速器,基于新一代CDNA計算架構。其采用臺積電5nm/6nm FinETH技術,總共1530億個晶體管

408df8d6-f4ef-11ef-9310-92fbcf53809c.png

(來源:AMD Whitepaper)

XCD計算模塊:共計8個XCD加速計算模塊,每一個XCD擁有38個CU計算單位,所以總共304個計算單元。

IOD互聯模塊:每兩個XCD為一組,在它們底部放置一個IOD模塊,負責輸入輸出與通信連接,總共4個IOD提供了第四代Infinity Fabric連接通道,總帶寬最高896GB/s,還有多達256MB Infinity Cache無限緩存。該模塊實際上屬于一種3D Base Die,通過TSV硅通孔技術與XCD計算Die模塊形成高密度互聯。

HBM 部分:IOD與XCD外圍一共有8個HBM3共192GB內存(每個HBM3內存大小為24GB)。IOD部分又一次采用的是6nm工藝,XCD部分則使用5nm工藝實現計算與IO芯粒解耦,這也是AMD公司常用的一種IO Die芯粒技術。

40a315d6-f4ef-11ef-9310-92fbcf53809c.png

(來源:知乎@sazc)

封裝工藝:上圖顯示的是MI300A APU的封裝工藝,兩者區別主要在計算Die部分,APU系列是異構芯粒技術同時包含GPU與CPU功能。但在封裝工藝上與MI300X雷同。

8個HBM與其他芯粒使用2.5D先進封裝工藝進行互聯,而IOD模塊(Base Die)與XCD (MI300A還包括CCD)之間直接通過3D TSV堆疊封裝工藝互聯。

因此,MI300系列無論是A系列還是X系列制造工藝同時覆蓋2.5D和3D先進工藝,總稱3.5D混合封裝。

40b2c648-f4ef-11ef-9310-92fbcf53809c.png

(來源:AMD)

Scale Up互聯簡介:AMD Instinct MI300X 加速器提供了采用 UBB 業界標準 OCP 平臺設計的普適性解決方案,支持將 8 個 GPU 整合為一個性能主導型節點,并且具有全互聯式點對點環形設計,單一平臺內的 HBM3 顯存總計可達到 1.5 TB提供足以應對各類 AI 或 HPC 工作負載部署的性能密集型解決方案。

典型案例2

CPO帶動Scale Out 互聯進軍百萬卡集群時代

規模生成式 AI 模型(如 DeepSeek,Grok3 系列等)的興起,對計算能力的需求呈現出了爆炸式增長。訓練這些復雜的模型往往需要龐大的計算資源,動輒依賴于 100,000 個甚至 100 萬個 XPU 的大規模集群。近期才發布的Grok 3模型,馬斯克預計下一代將搭建百萬卡AI數據中心,隨著大模型軍備賽在DeepSeek背景下展開地更加劇烈,新的互聯技術必須為未來百萬卡集群的互聯構筑可靠的基礎。

40d19726-f4ef-11ef-9310-92fbcf53809c.png

(圖:各國AI大模型軍備賽進行時)

Scale Out互聯甚至是更大規模的GPU HBD高帶寬域光進銅退的趨勢越發明顯,一種在2018年前后就被提及的光互聯技術CPO隨著AI對訓練的極高要求演進速度加快。

如果要在長程范圍集成更強大的算力/存力(Scale Out互聯),就需要借助更高帶寬的光互連技術。這也是為何目前光模塊在計算集群中廣泛使用的重要原因。集群要上升到百萬卡互聯規模,光互聯技術將發揮重要作用,傳統光模塊芯片和交換機芯片在PCB上的電信號傳輸以及GPU卡間互聯的信號損耗、功耗都遠大于單個Die to Die 互聯。目前,光模塊成為整個大型集群訓推時出現故障延遲的主要硬件之一。

40dd6236-f4ef-11ef-9310-92fbcf53809c.png

(來源:公眾號光通信女人)

CPO技術可以以解決射頻損耗的方式,將CPO光模塊與交換機主芯片ASIC專有集成電路芯片封裝在一起,降低電信號的互聯距離,從而降低射頻損耗。

40eb70a6-f4ef-11ef-9310-92fbcf53809c.png

(來源:公眾號光通信女人)

目前產業界都在研究晶圓級封裝工藝,2024、2025年基于晶圓級扇出式結構,在逐步克服工藝難點,接近商用。上圖我們可以看到基于晶圓級別的3D TSV工藝實現相比其他工藝實現了更高的互聯密度。

4103e8d4-f4ef-11ef-9310-92fbcf53809c.png

410bd486-f4ef-11ef-9310-92fbcf53809c.png

PIC(硅光芯片)通過與EIC(電芯片)進行3D堆疊,從而實現電連接更短、尺寸小、功耗低且高帶寬密度的性能。在此配置中,PIC 位于 EIC 頂部。然而,在 EIC 中創建 TSV 可能具有挑戰性,因為它通常需要在先進的晶圓節點上制造。為了克服這個問題,往往采用晶圓級扇出工藝,形成高銅柱以實現與頂部 PIC 的垂直互連。由此產生的光子 FOPOP 在光耦合方面表現出色,因為 PIC 的懸垂部分允許光邊緣耦合。

實際上,ASIC與CPO的共同封裝同樣屬于一種3.5D IC技術,從光芯片內部通過3D堆疊實現高互聯的密度,更佳的傳輸性能。在交換機芯片側,CPO OE Chiplet封裝在ASIC芯片周圍形成一個系統級的IC。以博通的典型CPO方案為例,整體封裝結構為CoWoS,計算Die(ASIC)通過Interposer/Package Substrate與CPO互連,互聯接口為高速IO(例如Serdes/D2D)。

411a2770-f4ef-11ef-9310-92fbcf53809c.png

(來源:Broadcom CPO )

目前,Nvidia也在研究基于硅光集成的CPO光學,并預計2025 Q3針對一款IB交換機啟動CPO方案的驗證。產業界更多廠家也在不斷研究并推出CPO光模塊樣機如Cisco、博通、Marvell都推出了基于CPO的交換機方案。

典型案例3

博通下一代3.5D IC大規模提升單卡算力

去年底Broadcom 推出了其 3.5D eXtreme Dimension 系統級封裝 (3.5D XDSiP) 平臺,該平臺適用于適用于 AI 和 HPC 工作負載的超高性能處理器。新平臺依賴于 TSMC 的 CoWoS 和其他先進封裝技術。它使芯片設計人員能夠構建 3D 堆棧邏輯、網絡和 I/O 小芯片以及 HBM 內存堆棧的系統級封裝 (SiP)。該平臺允許使用多達 12 個 HBM 模塊實現高達 6000mm2 的 3D 堆疊硅的 SiP。首批 3.5D XDSiP 產品將于 2026 年推出。

博通首次使用F2F(面對面)將一個邏輯Die堆疊到另外一個邏輯Die上;這種使用無凸塊混合銅鍵合直接連接頂部和底部硅芯片的上層金屬層的面對面 (F2F) 堆疊方法,是博通的 3D XDSiP 平臺的主要優勢。據 Broadcom 稱,F2F 方法可實現高達 7 倍的信號連接和更短的信號路由,將晶粒間接口的功耗降低 90%,最大限度地減少 3D 堆棧內的延遲,并為設計團隊提供額外的靈活性,成就更低功耗更低延遲的ASIC芯片性能。

41763cf4-f4ef-11ef-9310-92fbcf53809c.png

(來源:Broadcom)

此外,它巧妙地融合了 3D 硅片堆疊與 2.5D 封裝技術的精髓。該3.5D xPU計算Die與邏輯Die Face to Face進行鍵合,每個邏輯Die與多組HBM互聯,又與IOD通過D2D互聯。(更多閱讀:Chiplet&互聯專題:AI時代變革下 3D IC 芯粒技術的最新應用趨勢解讀)

41a09bf2-f4ef-11ef-9310-92fbcf53809c.png

(來源:Broadcom)

總的來說,3.5D 集成技術通過將 3D 與 2.5D封裝相結合,能夠在不單純依賴制程工藝提升的情況下,實現芯片性能的顯著提升、功耗的有效降低以及成本的合理控制,從而成為了下一代 XPU 發展的必然趨勢。預計博通將繼續加大市場推廣力度,針對不同客戶的需求,提供定制化的 3.5D XPU 解決方案。

3.5D IC技術是Chiplet小芯片發展旅程中的又一重要里程碑,通過獨特的技術架構和卓越的性能表現,為 AI 芯片的發展開辟了新的道路。在技術原理層面,其高密度互連、低功耗設計、多功能集成以及緊湊尺寸與穩定性等核心要素相互協同,構成了強大的技術競爭力。

奇異摩爾自2021年成立以來先從片內互聯產品系列研發出發,目前可以提供包括2.5D Central IO Die及3D Base Die等AI單個計算卡算力擴展芯粒方案,未來通過持續性的行業標準共建、產業鏈生態的互聯互通,相信在不久的將來,隨著國產Chiplet技術的突破,我們將與產業鏈伙伴為國產AI算力的釋放潛能鋪就一條寬廣的道路,共同書寫AI智能時代的輝煌篇章。

關于我們

AI網絡全棧式互聯架構產品及解決方案提供商

奇異摩爾,成立于2021年初,是一家行業領先的AI網絡全棧式互聯產品及解決方案提供商。公司依托于先進的高性能RDMA 和Chiplet技術,創新性地構建了統一互聯架構——Kiwi Fabric,專為超大規模AI計算平臺量身打造,以滿足其對高性能互聯的嚴苛需求。

我們的產品線豐富而全面,涵蓋了面向不同層次互聯需求的關鍵產品,如面向北向Scale out網絡的AI原生智能網卡、面向南向Scale up網絡的GPU片間互聯芯粒、以及面向芯片內算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等。這些產品共同構成了全鏈路互聯解決方案,為AI計算提供了堅實的支撐。

奇異摩爾的核心團隊匯聚了來自全球半導體行業巨頭如NXP、Intel、Broadcom等公司的精英,他們憑借豐富的AI互聯產品研發和管理經驗,致力于推動技術創新和業務發展。團隊擁有超過50個高性能網絡及Chiplet量產項目的經驗,為公司的產品和服務提供了強有力的技術保障。我們的使命是支持一個更具創造力的芯世界,愿景是讓計算變得簡單。奇異摩爾以創新為驅動力,技術探索新場景,生態構建新的半導體格局,為高性能AI計算奠定穩固的基石。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 人工智能
    +關注

    關注

    1804

    文章

    48811

    瀏覽量

    247229
  • IC技術
    +關注

    關注

    0

    文章

    9

    瀏覽量

    2362
  • AI芯片
    +關注

    關注

    17

    文章

    1972

    瀏覽量

    35738
  • 大模型
    +關注

    關注

    2

    文章

    3058

    瀏覽量

    3884

原文標題:芯粒案例解讀 | 3.5D IC技術構建下一代大模型訓練集群有效算力

文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Chiplet技術在消費電子領域的應用前景

    探討Chiplet技術如何為智能手機、平板電腦等消費電子產品帶來更優的性能和能效比。
    的頭像 發表于 04-09 15:48 ?274次閱讀
    <b class='flag-5'>Chiplet</b><b class='flag-5'>技術</b>在消費電子領域的應用前景

    先進封裝技術:3.5D封裝、AMD、AI訓練降本

    受限,而芯片級架構通過將SoC分解為多個小芯片(chiplets),利用先進封裝技術實現高性能和低成本。 芯片級架構通過將傳統單片系統芯片(SoC)分解為多個小芯片(chiplets),利用先進封裝技術實現高性能和低成本。 3.5D
    的頭像 發表于 02-14 16:42 ?683次閱讀
    先進封裝<b class='flag-5'>技術</b>:<b class='flag-5'>3.5D</b>封裝、AMD、AI訓練降本

    2.5D集成電路的Chiplet布局設計

    隨著摩爾定律接近物理極限,半導體產業正在向2.5D和3D集成電路等新型技術方向發展。在2.5D集成技術中,多個
    的頭像 發表于 02-12 16:00 ?1164次閱讀
    2.5<b class='flag-5'>D</b>集成電路的<b class='flag-5'>Chiplet</b>布局設計

    解鎖Chiplet潛力:封裝技術是關鍵

    如今,算力極限挑戰正推動著芯片設計的技術邊界。Chiplet的誕生不僅僅是技術的迭代,更是對未來芯片架構的革命性改變。然而,要真正解鎖Chiplet
    的頭像 發表于 01-05 10:18 ?901次閱讀
    解鎖<b class='flag-5'>Chiplet</b>潛力:封裝<b class='flag-5'>技術</b>是關鍵

    3.5D封裝來了(上)

    當前,半導體行業正在將 3.5D 作為先進封裝的下一個最佳選擇,這是一種混合方法,包括堆疊邏輯芯片并將它們分別粘合到其他組件共享的基板上。 這種封裝模型既滿足了大幅提升性能的需求,又避開了異構集成
    的頭像 發表于 12-31 11:41 ?567次閱讀
    <b class='flag-5'>3.5D</b>封裝來了(上)

    3.5D封裝來了(下)

    即使采用所有最新技術并采用 3.5D 封裝,控制熱量仍然是一項挑戰,但將熱效應與其他組件隔離的能力是當今可用的最佳選擇,并且可能在未來很長一段時間內都是如此。不過,還有其他問題需要解決。即使是
    的頭像 發表于 12-31 11:37 ?494次閱讀
    <b class='flag-5'>3.5D</b>封裝來了(下)

    一顆芯片面積頂4顆H200,博通推出3.5D XDSiP封裝平臺

    電子發燒友網報道(文/梁浩斌)博通最近推出了3.5D XDSiP的芯片封裝平臺技術,面向下一代高性能AI、HPC應用的定制XPU和ASIC。3.5D XDSiP的最大亮點,在于可以將超過6000
    的頭像 發表于 12-10 09:15 ?2650次閱讀
    一顆芯片面積頂4顆H200,博通推出<b class='flag-5'>3.5D</b> XDSiP封裝平臺

    高帶寬Chiplet互連的技術、挑戰與解決方案

    需求,業界采用了基于Chiplet的設計方法,將較大系統分解為更小、更易于管理的組件,這些組件可以分別制造并通過先進封裝技術進行集成[1]。 先進封裝技術 先進封裝技術可以大致分為2
    的頭像 發表于 12-06 09:14 ?879次閱讀
    高帶寬<b class='flag-5'>Chiplet</b>互連的<b class='flag-5'>技術</b>、挑戰與解決方案

    Chiplet技術有哪些優勢

    Chiplet技術,就像用樂高積木拼搭玩具一樣,將芯片的不同功能模塊,例如CPU、GPU、內存等,分別制造成獨立的小芯片。
    的頭像 發表于 11-27 15:53 ?1018次閱讀

    一文理解2.5D和3D封裝技術

    隨著半導體行業的快速發展,先進封裝技術成為了提升芯片性能和功能密度的關鍵。近年來,作為2.5D和3D封裝技術之間的一種結合方案,3.5D封裝
    的頭像 發表于 11-11 11:21 ?3356次閱讀
    一文理解2.5<b class='flag-5'>D</b>和3<b class='flag-5'>D</b>封裝<b class='flag-5'>技術</b>

    最新Chiplet互聯案例解析 UCIe 2.0最新標準解讀

    單個芯片性能提升的有效途徑?? ? 隨著半導體制程不斷逼近物理極限,越來越多的芯片廠商為了提升芯片性能和效率開始使用Chiplet技術,將多個滿足特定功能的芯粒單元通過Die-to-Die互聯技術
    的頭像 發表于 11-05 11:39 ?2082次閱讀
    最新<b class='flag-5'>Chiplet</b>互聯案例解析 UCIe 2.0最新標準<b class='flag-5'>解讀</b>

    什么是3.5D封裝?它有哪些優勢?

    半導體行業不斷發展,不斷推動芯片設計和制造的邊界。隨著逐漸接近傳統平面縮放的極限,先進封裝技術正成為持續提升性能的關鍵推動力。在這些技術中,3.5D封裝作為當前2.5D解決方案和完全3
    的頭像 發表于 10-28 09:47 ?1072次閱讀
    什么是<b class='flag-5'>3.5D</b>封裝?它有哪些優勢?

    IMEC組建汽車Chiplet聯盟

    來源:芝能智芯 微電子研究中心imec宣布了一項旨在推動汽車領域Chiplet技術發展的新計劃。 這項名為汽車Chiplet計劃(ACP)的倡議,吸引了包括Arm、ASE、寶馬、博世、Cadence
    的頭像 發表于 10-15 13:36 ?583次閱讀
    IMEC組建汽車<b class='flag-5'>Chiplet</b>聯盟

    Primemas選擇Achronix eFPGA技術用于Chiplet平臺

    高性能 FPGA 和嵌入式FPGA (eFPGA) IP 的領導者 Achronix Semiconductor Corporation 和使用Chiplet 技術開發創新 SoC Hub
    的頭像 發表于 09-18 16:16 ?874次閱讀

    國產半導體新希望:Chiplet技術助力“彎道超車”!

    在半導體行業,技術的每一次革新都意味著競爭格局的重新洗牌。隨著摩爾定律逐漸逼近物理極限,傳統芯片制造工藝面臨著前所未有的挑戰。在這一背景下,Chiplet(小芯片或芯粒)技術應運而生,為國產半導體
    的頭像 發表于 08-28 10:59 ?1192次閱讀
    國產半導體新希望:<b class='flag-5'>Chiplet</b><b class='flag-5'>技術</b>助力“彎道超車”!
    主站蜘蛛池模板: 国产小福利 | 人人澡人人搞 | 757福利影院合集3000 | 凸输偷窥xxxx自由视频 | 视频在线观看高清免费大全 | 欧美亚洲韩国国产综合五月天 | 91九色蝌蚪在线 | 亚洲五月婷婷 | 日本在线不卡免费 | 日本加勒比在线视频 | 久久的色偷偷 | 黄色片日本网站 | 免费黄色一级 | 精品午夜久久影视 | 最新激情网址 | 国产嫩草影院精品免费网址 | 久久久久久亚洲精品 | 日本特黄特黄刺激大片免费 | 一级黄色片欧美 | 久久本道综合色狠狠五月 | 午夜美女久久久久爽久久 | 朋友夫妇和交换性bd高清 | 久久久久久免费观看 | 国产成人亚洲影视在线 | 欧美日日日 | 四虎www成人影院免费观看 | 碰免费人人人视频 | 午夜手机看片 | 天天综合色天天综合网 | 高清激情小视频在线观看 | 97青草| 欧美成人一区亚洲一区 | aⅴ天堂| 最近国语剧情视频在线观看 | 欧美激情五月 | 边做边爱在线观看视频免费 | 国模小丫大尺度啪啪人体 | 亚洲视频高清 | 手机看片免费永久在线观看 | 四虎影视精品 | 亚洲一区二区三区网站 |