但AMD和英偉達(dá)沒有。
英特爾將 CPU、GPU 和內(nèi)存芯片拼接在一個稱為 XPU 的單一封裝上的宏偉計劃已經(jīng)暫緩。英特爾超級計算集團(tuán)副總裁杰夫·麥克維 (Jeff McVeigh) 透露,該公司的 Falcon Shores 平臺不僅會遲到,而且不會是一個 XPU。
英特爾最初計劃其 Falcon Shores 芯片同時具有 GPU 和 CPU 內(nèi)核,從而創(chuàng)建該公司的第一個用于高性能計算的“XPU”。幾個月前英特爾宣布這款產(chǎn)品將轉(zhuǎn)向純 GPU 設(shè)計并將芯片推遲到 2025 年,這讓行業(yè)感到震驚——因為另外兩家處理器巨頭AMD的 Instinct MI300和英偉達(dá)的Grace Hopper都具有混合CPU+GPU設(shè)計。
麥克維說:“之前將 CPU 和 GPU 集成到 XPU 中的努力還為時過早,”他認(rèn)為,自從 Falcon Shores 詳細(xì)介紹以來,市場在這一年發(fā)生了巨大變化,以至于繼續(xù)進(jìn)行下去不再有意義。麥克維將這種選擇比作登山。“當(dāng)在登山的時候,如果天氣變壞,你感覺不對,你不會僅僅因為它在那里就去頂峰。你會推遲到當(dāng)你準(zhǔn)備好了,當(dāng)生態(tài)系統(tǒng)準(zhǔn)備好了,當(dāng)氣候準(zhǔn)備好了。”
根據(jù)麥克維的說法,當(dāng)今的 AI 和 HPC 工作負(fù)載過于動態(tài),無法進(jìn)行集成。“當(dāng)工作負(fù)載固定時,當(dāng)你非常清楚它們不會發(fā)生巨大變化時,集成就很棒,”他補(bǔ)充道。雖然 Falcon Shores 不會成為 XPU,但這并不意味著英特爾不會在適當(dāng)?shù)臅r候重啟該項目。
英特爾發(fā)布了新的 HPC 和 AI 路線圖,其中沒有顯示 Gaudi3 處理器的繼任者——相反,Gaudi 和 GPU 與 Falcon Shores GPU 合并,因為它繼承了英特爾首屈一指的 HPC 和 AI 芯片。英特爾表示,“計劃整合 Habana 和 AXG 產(chǎn)品 [GPU] 路線圖”,但整合的細(xì)節(jié)很少。
采用標(biāo)準(zhǔn)以太網(wǎng)交換,很像英特爾專注于 AI 的 Gaudi 架構(gòu),數(shù)量不詳?shù)?HBM3 內(nèi)存,以及“I/O 旨在擴(kuò)展”,這可能意味著 Falcon Shores 將配備不同的內(nèi)存容量選項。英特爾確實(shí)表示 Falcon 將配備高達(dá) 288GB 的 HBM3 和 9.8TB/s 的總內(nèi)存吞吐量。正如預(yù)期的那樣,它將支持較小的數(shù)據(jù)類型,如 FP8 和 BF16。
對于英特爾來說,英特爾放慢 GPU 發(fā)布節(jié)奏意味著它將不得不利用舊產(chǎn)品與英偉達(dá)和AMD的混合架構(gòu)產(chǎn)品競爭。
AMD MI300
1 月,AMD展示了其迄今為止對加速處理單元 (APU) 的最佳外觀,這是AMD 對 CPU-GPU 架構(gòu)的專業(yè)術(shù)語。
根據(jù) AMD 在 1 月份分享的封裝照片,該芯片將配備 24 個 Zen 4 內(nèi)核——與 11 月份在 AMD 的 Epyc 4 Genoa 平臺中使用的相同——分布在兩個由六個 GPU 芯片和八個高帶寬內(nèi)存組成的小芯片上模塊總共有 128GB。
在性能方面,AMD 聲稱該芯片提供的“AI 性能”是 Frontier 超級計算機(jī)中使用的 MI250X 的 8 倍,同時每瓦性能也提高了 5 倍。根據(jù)The Next Platform 的說法,考慮到對具有稀疏性的 8 位浮點(diǎn) (FP8) 數(shù)學(xué)的支持,這將使該芯片的性能與四個 MI250X GPU 相當(dāng),并且可能使該芯片功耗處于 900W 左右如果屬實(shí),那么 MI300A 將成為一款很“熱”的芯片,幾乎肯定需要液體冷卻才能馴服。對于 HPC 系統(tǒng)來說,這應(yīng)該不是問題,其中大部分已經(jīng)使用直接液體冷卻,但可能會迫使遺留數(shù)據(jù)中心升級其設(shè)施,否則就有可能被拋在后面。
英偉達(dá)GraceHopper
從技術(shù)上講,AMD 并不是唯一一家為數(shù)據(jù)中心追求 CPU-GPU 組合架構(gòu)的公司。AMD 將與英偉達(dá)的 Grace Hopper 芯片展開競爭。
MI300 和 Grace Hopper 是截然不同的路線。英偉達(dá)解決這個特殊問題的方法是使用其專有的 900GBps NVLink-C2C 互連將其 72 核 Arm 兼容的 Grace CPU 與 GH100 芯片配對。雖然這消除了 PCIe 作為兩個組件之間的瓶頸,但它們是不同的,每個都有自己的內(nèi)存。GH100 芯片有自己的 HBM3 內(nèi)存,而 Grace GPU 耦合到 512GB 的 LPDDR5,適用于 500GBps 的內(nèi)存帶寬。
另一方面,MI300A 看起來是一個誠實(shí)的 APU,能夠?qū)ぶ废嗤?HBM3 內(nèi)存,而無需通過互連來回復(fù)制它。
哪種方法會帶來更好的性能,哪些工作負(fù)載尚未得到解決,但唯一確定的事英特爾不會在這場戰(zhàn)斗中占據(jù)一席之地。
英特爾表示,它將利用 CXL 接口,使其客戶能夠利用可組合的架構(gòu),該架構(gòu)可以在其定制設(shè)計中將各種 CPU/GPU 比率結(jié)合在一起。然而,CXL 接口僅在元素之間提供 64 GB/s 的吞吐量,而像 Nvidia 的 Grace Hopper 這樣的定制 CPU+GPU 設(shè)計可以在 CPU 和 GPU 之間提供高達(dá) 1 TB/s 的內(nèi)存吞吐量。對于許多類型的工作負(fù)載——尤其是需要大量內(nèi)存帶寬的 AI 工作負(fù)載,這比 CXL 實(shí)現(xiàn)具有性能和效率優(yōu)勢。更不用說元素之間固有的低延遲連接和其他優(yōu)勢,如更高的性能密度。
審核編輯:劉清
-
處理器
+關(guān)注
關(guān)注
68文章
19440瀏覽量
231319 -
HPC
+關(guān)注
關(guān)注
0文章
326瀏覽量
23872 -
PCIe接口
+關(guān)注
關(guān)注
0文章
121瀏覽量
9797 -
LPDDR5
+關(guān)注
關(guān)注
2文章
89瀏覽量
12120
原文標(biāo)題:英特爾放棄同時封裝 CPU、GPU、內(nèi)存計劃
文章出處:【微信號:ICViews,微信公眾號:半導(dǎo)體產(chǎn)業(yè)縱橫】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
英特爾推出全新英特爾銳炫B系列顯卡
![<b class='flag-5'>英特爾</b>推出全新<b class='flag-5'>英特爾</b>銳炫B系列顯卡](https://file1.elecfans.com/web3/M00/01/6A/wKgZPGdTsIeAQ_UwAAALhP4DZF0423.jpg)
評論