自從2.5D/3D封裝、Chiplet、異構(gòu)集成等技術(shù)出現(xiàn)以來,CPU、GPU和內(nèi)存之間的界限就已經(jīng)變得逐漸模糊。單個SoC究竟集成了哪些邏輯單元和存儲單元,全憑借廠商自己的設(shè)計路線。這樣的設(shè)計其實為單芯片的能效比帶來了一輪新的攀升,但也極大地增加了開發(fā)難度。即便如此,還是有不少廠商在不遺余力地朝這個方向發(fā)展,最典型的莫過于AMD。
AMD的存儲堆疊之路
要說玩堆疊存儲,AMD確實是走得最靠前的一位,例如AMD如今在消費級和數(shù)據(jù)中心級別CPU上逐漸使用的3D V-Cache技術(shù),就是直接將SRAM緩存堆疊至CPU上。將在今年正式落地的第四代EPYC服務(wù)器處理器,就采用了13個5nm/6nm Chiplet混用的方案,最高將L3緩存堆疊至了可怕的384MB。
在消費端,AMD的Ryzen 7 5800X3D同樣也以驚人的姿態(tài)出世,以超大緩存帶來了極大的游戲性能提升。即將正式發(fā)售的Ryzen 9 7950X3D也打出了128MB三級緩存的夸張參數(shù),這些產(chǎn)品的出現(xiàn)可謂打破了過去CPU廠商拼時鐘頻率、拼核心數(shù)的僵局,讓消費者真切地感受到了額外的體驗提升。
MI300 APU / AMD
GPU也不例外,雖然AMD如今的消費級GPU基本已經(jīng)放棄了HBM堆疊方案,但是在AMD的數(shù)據(jù)中心GPU,例如Instinct MI250X,卻依然靠著堆疊做到了128GB的HBM2e顯存,做到了3276.8GB/s的峰值內(nèi)存帶寬。而下一代MI300,AMD則選擇了轉(zhuǎn)向APU方案,將CPU、GPU和HBM全部整合在一起,以新的架構(gòu)沖擊Exascale級的AI世代。
其實這也是AMD收購Xilinx最大的收獲之一,早在十多年前Xilinx的3DIC技術(shù)也已經(jīng)為多Die堆疊打下了基礎(chǔ)。在收購Xilinx之際,AMD也提到這次交易會擴張AMD在die堆疊、封裝、Chiplet和互聯(lián)技術(shù)上的開發(fā)能力。在完成Xilinx的收購后,也可以看出AMD在架構(gòu)上的創(chuàng)新有了很大的飛躍。
在近期的ISSCC 2023上,AMD CEO蘇姿豐透露了他們的下一步野心,那就是直接將DRAM堆疊至CPU上。這里的堆疊并非硅中介層互聯(lián)、存儲單元垂直堆疊在一起的2.5D封裝方案,也就是如今常見的HBM統(tǒng)一內(nèi)存方案,AMD提出的是直接將計算單元與存儲單元垂直堆疊在一起的3D混合鍵封裝方案。
CPU與DRAM垂直堆疊
主流服務(wù)器性能的提升速度,已經(jīng)快要趕上過去的摩爾定律了。根據(jù)AMD統(tǒng)計的CPU供應(yīng)商數(shù)據(jù),每過2.4年主流服務(wù)器性能就會翻一倍。可限制其繼續(xù)發(fā)展的不再只是放緩的摩爾定律,還有內(nèi)存上帶來的限制。內(nèi)存墻這樣的性能瓶頸,不僅在限制CPU的性能發(fā)揮,同樣限制了GPU的性能發(fā)揮。
考慮到明面上解決這個問題的主力軍是存儲廠商,所以提出的大部分創(chuàng)新方案,例如存內(nèi)計算等等,也都是創(chuàng)造算力更高的存儲器產(chǎn)品。蘇姿豐博士也指出,從她這個處理器從業(yè)者的角度來說,這一路線有些反常理,但從系統(tǒng)層面來說,她也可以理解該需求存在的意義。而AMD這次提出的方案,則是從計算芯片出發(fā),將存儲器堆疊整合進去。
CPU與DRAM垂直堆疊 / AMD
從AMD給出的能量效率分析來看,DIMM這樣的片外內(nèi)存訪問能量效率在12pj/bit左右,2.5D的HBM方案在3.5pj/bit左右,而3D垂直堆疊的鍵合方案卻可以做到0.2pj/bit,從而利用更低的功耗來做到大帶寬。況且由于計算單元和存儲單元的集成度更高了,傳輸?shù)难舆t必然也會有顯著的降低。
這套方案的出現(xiàn)意味著至少堆疊的內(nèi)存容量足夠大,服務(wù)器CPU甚至可以省去DIMM內(nèi)存插槽,進一步減小空間占用。但這套方案具體能做堆疊多少內(nèi)存,AMD并沒有給出具體的數(shù)字,如果可堆疊的內(nèi)存數(shù)量與如今的L3緩存一樣僅有數(shù)百兆的話,那帶來的性能提升很可能不值一提。
另外就是散熱問題,從AMD給出的示意圖來看,他們選擇了內(nèi)存單元在上,計算單元在下的方案,這種3D架構(gòu)很可能會對散熱產(chǎn)生一定負面作用,但性能損失會相對較少一些。比如MI300方案中,AMD就換成了CPU和GPU單元在上,緩存和互聯(lián)在下的方案。
捆綁銷售嫌疑?
在消費級領(lǐng)域,其實CPU與內(nèi)存捆綁銷售已經(jīng)不是什么新鮮事了,就拿蘋果的M系列芯片為例。自打蘋果轉(zhuǎn)向Arm陣營,推出M系列芯片后,Mac生態(tài)的定制空間就基本只存在于購買前了,雖然華強北的大神們依然能夠找到一些方式來擴展固態(tài)硬盤閃存,但內(nèi)存基本就與SoC徹底綁定了,用戶只能忍受高昂的容量定價,才不會在高負載工作時出現(xiàn)內(nèi)存不夠用的窘境。
可在服務(wù)器市場,已經(jīng)有了相當成熟的DIMM內(nèi)存生態(tài),甚至未來還有CXL內(nèi)存虎視眈眈,AMD這套“捆綁銷售”的方案究竟能否收獲良好的市場反響我們無從得知,很明顯這對內(nèi)存模組廠商是存在一定威脅的。但話又說回來,AMD這套方案并沒有徹底斷絕擴展內(nèi)存的可能性,在需要超大容量的內(nèi)存池時,依然可以選擇傳統(tǒng)的擴展方案,而不是死磕堆疊內(nèi)存的方案。
AMD的方案更像是給到了一個片上高速方案,從當下的工藝來看,應(yīng)該還難以實現(xiàn)大容量的堆疊。所以在CPU上垂直堆疊DRAM,更像是AMD的另一套負載加速方案。畢竟根據(jù)蘇姿豐博士的說法,AMD也很清楚現(xiàn)有的3D V-Cache SRAM堆疊方案只能提高特定負載的性能,DRAM堆疊方案的性能加速覆蓋面無疑要更廣一些。
寫在最后
其實ChatGPT這樣的應(yīng)用出現(xiàn),不僅帶動了一波GPU訂單量的狂飆,也讓HBM、DDR5這些大帶寬的內(nèi)存有了用武之地,讓人們終于看到了打破內(nèi)存墻的應(yīng)用價值,而不只是將其視為一個徒增成本的性能瓶頸。
而AMD雖然提出了將內(nèi)存堆疊至CPU上的技術(shù)路線,也并沒有放棄對其他方案的考量,比如他們也在和三星展開HBM2上的存算一體研究。如果AMD選擇將CPU堆疊內(nèi)存與存算一體結(jié)合在一起的話,或許會給其數(shù)據(jù)中心產(chǎn)品帶來更大的優(yōu)勢。
審核編輯 :李倩
-
amd
+關(guān)注
關(guān)注
25文章
5537瀏覽量
135502 -
DRAM
+關(guān)注
關(guān)注
40文章
2337瀏覽量
184885 -
cpu
+關(guān)注
關(guān)注
68文章
10999瀏覽量
214933
原文標題:AMD要在CPU上堆疊DRAM內(nèi)存,新一代捆綁銷售誕生?
文章出處:【微信號:elecfans,微信公眾號:電子發(fā)燒友網(wǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
新思科技推出基于AMD芯片的新一代原型驗證系統(tǒng)

嘉合勁威研發(fā)新一代AI專用內(nèi)存MRDIMM
佰維存儲發(fā)布新一代LPDDR5X內(nèi)存與DDR5內(nèi)存模組
英偉達AI加速器新藍圖:集成硅光子I/O,3D垂直堆疊 DRAM 內(nèi)存

評論