2025年又是充滿無限可能的一年。開年之際,DeepSeek事件以燎原之勢席卷全球,再次印證了AI時代"一切皆有可能"的黃金法則。人工智能行業(yè)對計算的需求變革幾乎每天都在上演。從半導(dǎo)體的終端需求出發(fā),芯片供給端正在經(jīng)歷一場根本性的架構(gòu)變革。在這場變革中,3D Chiplet異構(gòu)集成技術(shù)逐步嶄露頭角,走向更廣闊的舞臺。
我們知道受制于最大光刻面積的限制,單芯片的面積無法無限制擴展。為此,需采用多次曝光拼接技術(shù),這大幅增加了工藝難度,導(dǎo)致芯片良率顯著下降。面對晶體管數(shù)量持續(xù)增長與芯片橫向面積擴展受限的矛盾,Chiplet芯粒技術(shù)應(yīng)運而生。
(來源:IDTechEx )
3D IC技術(shù)展現(xiàn)出了“超越摩爾定律”的巨大潛力,被視為后摩爾時代突破SoC集成度、性能等瓶頸的關(guān)鍵所在。通過3D IC 芯粒架構(gòu),多個同質(zhì)和異質(zhì)的小芯片/裸片得以在垂直尺度上整合于同一設(shè)計之中,這不僅提升了芯片的功能密度和單位性能,還增強了設(shè)計靈活性,同時降低了開發(fā)成本。典型的3D IC制造技術(shù)包括臺積電的 3D Fabric(SoIC)、 英特爾的Foveros、三星的X-Cube、日月光的VIPack 3D IC 等;從芯片最終商用角度來說,AMD MI300 GPU及Ryzen系列處理器;Intel 的Meteor Lake、Lunar Lake都是3D IC多芯粒堆疊的代表性案例。
(圖:3DIC Architecture)
AI時代驅(qū)動下的3D IC 應(yīng)用趨勢
AI網(wǎng)絡(luò)加速CPO Chiplet部署進程
在AI高速發(fā)展的背景下,硅光集成憑借高速率+低功耗的優(yōu)勢,有望成為數(shù)據(jù)中心互連的重要方案之一。作為一種新型光電子集成技術(shù),CPO通過將光引擎與交換芯片近距離互連,縮短光信號輸入和運算單元間的電學互連長度。其優(yōu)勢包括:高帶寬密度、低功耗、高集成度、低延時、小尺寸,并可通過半導(dǎo)體制造技術(shù)實現(xiàn)規(guī)模化生產(chǎn)。
報告大摩近期的報告預(yù)測,隨著英偉達Rubin服務(wù)器機架系統(tǒng)在2026年開始量產(chǎn),CPO市場規(guī)模將在2023-2030年間以172%的年復(fù)合增長率擴張,預(yù)計2030年達到93億美元;在樂觀情景下,年復(fù)合增長率可達210%,市場規(guī)模將突破230億美元。
去年IEEE ECTC 2024上,Cisco公布了其基于3D封裝的3.2Tbs 光學引擎的技術(shù)細節(jié),該技術(shù)集成了光子集成電路 (PIC) 和電氣 IC (EIC),使用晶圓級再分布層 (RDL) 實現(xiàn)緊湊的設(shè)計和低寄生電氣連接。
(來源:光學追光者公眾號)
上圖為4個800G EIC和1個3.2T PIC的封裝頂視圖,達到3.2Tb總帶寬,EIC互聯(lián)使用RDL層,PIC bump倒貼在FPOP上,使用邊緣耦合FAU光學封裝,EIC通過RDL連接到PIC bump上,EIC周圍和中間高的銅柱將頂部RDL和底部RDL連接到一起。
AI網(wǎng)絡(luò)Scale-out主要通過高速互聯(lián)容納更多節(jié)點,進而提升集群整體算力規(guī)模。當前機間通信主要以 400G-800G 為主,未來有望通過更高速率如 1.6T 組網(wǎng)互聯(lián),以提高互聯(lián)帶寬,支持更多節(jié)點高速互聯(lián);采用 CPO (Co-Packaged Optics) /NPO (Near Packaged Optics)、多異構(gòu)芯片 C2C (Chip-to-Chip)封裝等方式降低延時,進而提升數(shù)據(jù)傳輸效率。
(來源:Broadcom)
博通引領(lǐng)多芯片設(shè)計轉(zhuǎn)向 3.5D 封裝技術(shù)
2024年年底,Broadcom 推出了其 3.5D eXtreme Dimension 系統(tǒng)級封裝 (3.5D XDSiP) 平臺,該平臺適用于 AI 和 HPC 工作負載的超高性能處理器。新平臺依賴于 TSMC 的 CoWoS 和其他先進封裝技術(shù)。它使芯片設(shè)計人員能夠構(gòu)建 3D 堆棧邏輯、網(wǎng)絡(luò)和 I/O芯粒片以及 HBM 內(nèi)存堆棧的系統(tǒng)級封裝 (SiP)技術(shù)。
(來源:Broadcom)
博通計劃將系統(tǒng)核心中的加速器核心或其他處理單元(如上圖紅色部分所示)劃分為任意數(shù)量的硅片。這些邏輯芯片可以包含通用 CPU 核心或高性能 AI 加速器,從 GPU 到張量處理單元 (TPU),或其他定制模塊。其余邏輯被重新安置在一個單獨的芯片上,在圖中以黃色顯示,其中包含從 I/O(包括基于PHY 的芯片間互連、高速 SerDes 和 HBM 內(nèi)存接口)到充當處理器緩存的 SRAM 的所有內(nèi)容。 這種設(shè)計方式同樣讓計算邏輯Die與I/O芯粒等其他模塊實現(xiàn)解耦,從而使用各自適用的相關(guān)工藝節(jié)點來實現(xiàn)更高性能和更佳的制造性價比。
“
簡單的來說,紅色部分稱作為計算Die ,而下面黃色的部分稱作3D Base Die,該芯粒可以包含各種I/O所需接口。這種設(shè)計方式讓計算Die與I/O芯粒等其他模塊實現(xiàn)解耦,從而使用各自適用的相關(guān)工藝節(jié)點來實現(xiàn)更高性能和更佳的制造性價比。運用3D Base Die作為3D IC 芯片的I/O基礎(chǔ)芯粒的架構(gòu)設(shè)計已經(jīng)成為AI時代異構(gòu)芯片發(fā)展可預(yù)見的創(chuàng)新趨勢。
博通使用混合鍵合將上面較小的計算Die模塊堆疊在較大的Base芯片上,以實現(xiàn)連接和存儲。通常,芯片之間使用硅通孔 (TSV) 相互通信,這些硅通孔充當 3D 堆棧內(nèi)的電梯井,在它們之間傳輸電力、信號和數(shù)據(jù)。而整個芯片的外圍,環(huán)繞著六個 HBM 模塊,采用了臺積電先進的工藝節(jié)點和 CoWoS 技術(shù)進行 2.5D 封裝。
(來源:Broadcom)
然而,隨著生成式AI模型的計算需求指數(shù)級增長,2.5D方案的帶寬和功耗限制變得愈發(fā)明顯。3.5D技術(shù)的出現(xiàn),通過在封裝內(nèi)堆疊更多的芯片模塊,實現(xiàn)了性能、功耗和成本的最佳平衡。3.5D 集成技術(shù)通過將 3D 硅堆疊與 2.5D 封裝相結(jié)合,能夠在不單純依賴制程工藝提升的情況下,實現(xiàn)芯片性能的顯著提升、功耗的有效降低以及成本的合理控制,從而成為了下一代 XPU 發(fā)展的必然趨勢。
國內(nèi)存算一體3D IC 案例實現(xiàn)工藝節(jié)點效能突破
隨著AI高性能計算、自動駕駛等進入行業(yè)爆發(fā)期,巨大的算力催生了新的計算架構(gòu)。由于芯片內(nèi)數(shù)據(jù)提取與傳輸?shù)男枨笕找嬖鲩L,“存儲墻”成為了數(shù)據(jù)計算應(yīng)用的一大障礙。深度學習加速的最大挑戰(zhàn)就是數(shù)據(jù)在計算單元和存儲單元之間頻繁的移動。
存算一體芯片技術(shù)的創(chuàng)新在很大程度上解決了芯片內(nèi)不必要的數(shù)據(jù)搬移的延遲與功耗消耗,提升百倍千倍的AI計算效率,尤其是國內(nèi)三維存算一體芯片的誕生將打破僅限于Intel與AMD等國際芯片企業(yè)在3DIC領(lǐng)域的壟斷地位。
2024年,奇異摩爾與復(fù)旦大學共同打造的三維存算一體芯片通過3D三維集成堆疊芯粒的形式實現(xiàn)晶體管密度等效2倍的提升,另一方面又實現(xiàn)了存儲與計算的緊耦合從而實現(xiàn)了高能效、降低存儲墻的性能。這款芯片利用3D封裝工藝加成存算一體技術(shù)僅使用28nm工藝就可以達到8/7nm工藝性能。在規(guī)避地緣政治管控的同時,實現(xiàn)先進工藝節(jié)點,成就高性能芯片。奇異摩爾自創(chuàng)立以來從片內(nèi)互聯(lián)著手,不斷深耕Chiplet賽道,是國內(nèi)首批布局3D Base Die互聯(lián)芯粒的科創(chuàng)企業(yè)。憑借在有源基板3D Base Die的設(shè)計能力以及先進封裝方面的資源整合成功聯(lián)合學術(shù)界實現(xiàn)三維存算一體芯片技術(shù)突破。(更多閱讀:芯片界奧林匹克放榜 !奇異摩爾與復(fù)旦大學三維集成芯片成果入選ISSCC 2025)
(來源:奇異摩爾)
奇異摩爾的3D Base die(可理解為基于3D封裝的I/O Die)可以把原本集成在SoC中的Power、SRAM、I/O等非數(shù)字功能模塊拆分并拼搭進去,從而構(gòu)成一個高度集成并節(jié)能的多核異構(gòu)計算架構(gòu),同時實現(xiàn)上層的邏輯芯片面積最大化和芯片單位面積的最小化。在互聯(lián)方面,3D Base Die支持水平方向和垂直方向的異構(gòu)芯片互連。垂直方向,通過TSV、microbump等3D互連技術(shù)與頂層邏輯芯粒、substrate垂直通信,從而以最小限度實現(xiàn)die與die之間的互連、片外連接,顯著提高芯粒集成密度,從而大規(guī)模提升芯片的算力。3D Base Die具有可復(fù)用功能,它與計算和存儲等芯粒解耦,進一步滿足存算一體芯片下一代技術(shù)的演進需求。
3D IC應(yīng)用普及化的挑戰(zhàn)
目前3D IC先進制造工藝技術(shù)仍舊掌握在少數(shù)企業(yè)手中,先進的節(jié)點工藝因為地緣政治的原因獲取上存在挑戰(zhàn)。從芯片制造本身來說,3D-IC的熱管理與機械應(yīng)力、互聯(lián)、測試及相關(guān)材料的選擇等一系列復(fù)雜問題還存在設(shè)計與與制造方面的挑戰(zhàn)。此外,3D IC本身架構(gòu)設(shè)計、EDA工具、封裝設(shè)計等板塊都具備復(fù)雜性和生態(tài)互通需求。設(shè)計人員需要要把這些必須具備的功能全部打通串聯(lián),形成協(xié)同作戰(zhàn),所以這是一個相對龐大的系統(tǒng)工程。
(來源:Cadence)
另一方面, 芯粒之間的互聯(lián)互通一直是3D IC 通用化落地的一個關(guān)鍵。國際標準方面,UCIe2.0 標準在去年下半年正式發(fā)布,標準的升級讓Chiplet生態(tài)又往前邁了一大步。UCIe 2.0解決了跨多個芯粒的 SiP 生命周期的可測試性、可管理性和調(diào)試 (DFx) 的設(shè)計挑戰(zhàn)。此次更新的一個關(guān)鍵功能是支持 3D 封裝,使芯粒能夠顯著提高帶寬密度和功率效率。UCIe 2.0 通過標準化接口和管理架構(gòu),促進了開放 Chiplet 生態(tài)系統(tǒng)的發(fā)展。
UCIe 2.0 在國內(nèi)的生態(tài)通用化程度還需要不斷提高,盡管UCIe已經(jīng)慢慢被國內(nèi)芯片市場所接受,應(yīng)用層面開始逐步出現(xiàn)落地案例。但仍然在芯粒協(xié)議、電源和熱管理等方向需要進行標準化和優(yōu)化。3D IC 的大規(guī)模落地需要產(chǎn)業(yè)鏈上下游協(xié)同來實現(xiàn)生態(tài)的共榮,從封測制造、跨領(lǐng)域技術(shù)融合、標準共建與統(tǒng)一化等多維度方向來構(gòu)建協(xié)調(diào)矩陣。
奇異摩爾作為Chiplet互聯(lián)的先行者將充分利用自身在3D IC設(shè)計與封裝量產(chǎn)的經(jīng)驗資源與行業(yè)共赴這個價值萬億的產(chǎn)業(yè)新藍海。當設(shè)計軟件、材料科學、制造工藝、測試驗證等18個關(guān)鍵環(huán)節(jié)形成共振,當3000家上下游企業(yè)構(gòu)建起創(chuàng)新聯(lián)合體,3D IC技術(shù)才能真正釋放其顛覆性潛能。這不是零和博弈的戰(zhàn)場,而是需要全行業(yè)以"硅基生命體"的共生理念,共同繪制半導(dǎo)體產(chǎn)業(yè)的下一個黃金時代。
關(guān)于我們AI網(wǎng)絡(luò)全棧式互聯(lián)架構(gòu)產(chǎn)品及解決方案提供商
奇異摩爾,成立于2021年初,是一家行業(yè)領(lǐng)先的AI網(wǎng)絡(luò)全棧式互聯(lián)產(chǎn)品及解決方案提供商。公司依托于先進的高性能RDMA 和Chiplet技術(shù),創(chuàng)新性地構(gòu)建了統(tǒng)一互聯(lián)架構(gòu)——Kiwi Fabric,專為超大規(guī)模AI計算平臺量
身打造,以滿足其對高性能互聯(lián)的嚴苛需求。
我們的產(chǎn)品線豐富而全面,涵蓋了面向不同層次互聯(lián)需求的關(guān)鍵產(chǎn)品,如面向北向Scale out網(wǎng)絡(luò)的AI原生智能網(wǎng)卡、面向南向Scale up網(wǎng)絡(luò)的GPU片間互聯(lián)芯粒、以及面向芯片內(nèi)算力擴展的2.5D/3D IO Die和UCIe Die2Die IP等。這些產(chǎn)品共同構(gòu)成了全鏈路互聯(lián)解決方案,為AI計算提供了堅實的支撐。
奇異摩爾的核心團隊匯聚了來自全球半導(dǎo)體行業(yè)巨頭如NXP、Intel、Broadcom等公司的精英,他們憑借豐富的AI互聯(lián)產(chǎn)品研發(fā)和管理經(jīng)驗,致力于推動技術(shù)創(chuàng)新和業(yè)務(wù)發(fā)展。團隊擁有超過50個高性能網(wǎng)絡(luò)及Chiplet量產(chǎn)項目的經(jīng)驗,為公司的產(chǎn)品和服務(wù)提供了強有力的技術(shù)保障。我們的使命是支持一個更具創(chuàng)造力的芯世界,愿景是讓計算變得簡單。奇異摩爾以創(chuàng)新為驅(qū)動力,技術(shù)探索新場景,生態(tài)構(gòu)建新的半導(dǎo)體格局,為高性能AI計算奠定穩(wěn)固的基石。
-
芯片
+關(guān)注
關(guān)注
457文章
51299瀏覽量
427892 -
AI
+關(guān)注
關(guān)注
87文章
31753瀏覽量
270537 -
人工智能
+關(guān)注
關(guān)注
1796文章
47818瀏覽量
240601 -
chiplet
+關(guān)注
關(guān)注
6文章
436瀏覽量
12635
原文標題:Chiplet&互聯(lián)專題:AI時代變革下 3D IC 芯粒技術(shù)的最新應(yīng)用趨勢解讀
文章出處:【微信號:奇異摩爾,微信公眾號:奇異摩爾】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
騰訊混元3D AI創(chuàng)作引擎正式發(fā)布
騰訊混元3D AI創(chuàng)作引擎正式上線
中興通訊攜手中國移動推出AI裸眼3D創(chuàng)新產(chǎn)品
中興通訊全場景AI終端應(yīng)用與裸眼3D新品亮相
紫光展銳助力全球首款AI裸眼3D手機發(fā)布
Meta推出革命性3D Gen AI模型:1分鐘內(nèi)生成高質(zhì)量3D內(nèi)容
中興通訊與中國移動發(fā)布全球首創(chuàng)AI裸眼3D新品,引領(lǐng)3D科技新浪潮
西門子推出Calibre 3DThermal軟件,持續(xù)布局3D IC熱分析
Cognex發(fā)布了In-Sight? L38 3D視覺系統(tǒng),為3D檢測設(shè)立新標準
新質(zhì)生產(chǎn)力探索| AICG浪潮下的3D打印與3D掃描技術(shù)
NVIDIA生成式AI研究實現(xiàn)在1秒內(nèi)生成3D形狀
![NVIDIA生成式<b class='flag-5'>AI</b>研究實現(xiàn)在1秒內(nèi)生成<b class='flag-5'>3D</b>形狀](https://file1.elecfans.com/web2/M00/C5/E5/wKgZomYDhKCAWidnAAAMtdqDKw4774.jpg)
Stability AI推出全新Stable Video 3D模型
Stability AI推出Stable Video 3D模型,可制作多視角3D視頻
3D HMI應(yīng)用場景和發(fā)展趨勢
![<b class='flag-5'>3D</b> HMI應(yīng)用場景和發(fā)展<b class='flag-5'>趨勢</b>](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
評論