從去年11月公布的最新TOP500超算系統(tǒng)排名上,我們可以看出AMD已經(jīng)開始蠶食原本屬于英特爾的份額,而且速度不容小覷。而英偉達(dá)則因?yàn)樵?a href="http://m.xsypw.cn/tags/gpu/" target="_blank">GPU上的頭號(hào)交椅地位,成了堅(jiān)持所有堅(jiān)持CPU+GPU架構(gòu)超算的首選。
非但如此,英偉達(dá)開始在ARM生態(tài)上有所動(dòng)作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級(jí)計(jì)算機(jī)系統(tǒng)阿爾卑斯所用。然而近來(lái)的一系列動(dòng)向表明,超算市場(chǎng)并不會(huì)就此維持定局。
英特爾:GPU和異構(gòu)開始猛追
英特爾耕耘了這么多年HPC和超算市場(chǎng),自然不會(huì)白白認(rèn)輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會(huì)上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個(gè)Xeon插槽的設(shè)計(jì),由此推出全新的XPU,代號(hào)名為FalconShores。
FalconShores將融合通用x86處理器核心和高度并行計(jì)算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說(shuō)法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個(gè)插槽的計(jì)算密度提升5倍,與現(xiàn)有的設(shè)計(jì)相比,可將性能功耗比提升5倍以上。
非但如此,英偉達(dá)開始在ARM生態(tài)上有所動(dòng)作,推出了Grace這樣的高性能CPU,并被瑞士超算中心的超級(jí)計(jì)算機(jī)系統(tǒng)阿爾卑斯所用。然而近來(lái)的一系列動(dòng)向表明,超算市場(chǎng)并不會(huì)就此維持定局。
英特爾:GPU和異構(gòu)開始猛追
英特爾耕耘了這么多年HPC和超算市場(chǎng),自然不會(huì)白白認(rèn)輸,尤其是自己的圖形部門正在崛起的情況下。于是,就在上周的投資者大會(huì)上,英特爾公布了全新的HPC-AI超算策略,以CPU+GPU融合在同一個(gè)Xeon插槽的設(shè)計(jì),由此推出全新的XPU,代號(hào)名為FalconShores。
FalconShores將融合通用x86處理器核心和高度并行計(jì)算的Xe-HPC GPU核心,并結(jié)合英特爾自研的高帶寬共享內(nèi)存。根據(jù)英特爾的說(shuō)法,這種CPU+GPU+通用內(nèi)存的架構(gòu)可以將單個(gè)插槽的計(jì)算密度提升5倍,與現(xiàn)有的設(shè)計(jì)相比,可將性能功耗比提升5倍以上。

FalconShoresXPU / 英特爾
這對(duì)于英特爾目前的戰(zhàn)略來(lái)說(shuō),基本上可以說(shuō)是必選的一條技術(shù)路線。考慮到英特爾在先進(jìn)封裝技術(shù)上并未止步,工藝節(jié)點(diǎn)也開始跟上主流代工廠的節(jié)奏,異構(gòu)計(jì)算的設(shè)計(jì)已經(jīng)在英特爾近期推出的諸多產(chǎn)品中得到了驗(yàn)證,通用內(nèi)存也已經(jīng)在業(yè)界成了改善延遲提高帶寬的常用手段之一。況且英特爾已經(jīng)在其Sapphire Rapids Xeon服務(wù)器處理器上用到了HBM2e這類高帶寬內(nèi)存,F(xiàn)alconShores中自研的高帶寬內(nèi)存會(huì)有何等性能確實(shí)令人好奇。
FalconShores的另一大優(yōu)勢(shì)在與靈活的核心配比,根據(jù)工作負(fù)載來(lái)調(diào)整x86核心與Xe核心。英特爾在會(huì)上不斷給出十萬(wàn)億億級(jí)的概念,這樣的性能在FalconShores的性能下似乎是可行的,不過(guò)這一XPU正式進(jìn)入超算市場(chǎng)的時(shí)間不會(huì)太快,而是要等到2024年,借助那時(shí)的埃米級(jí)工藝和Foveros封裝技術(shù)才能實(shí)現(xiàn)。
英偉達(dá):不放棄ARM,也不放棄互聯(lián)
前陣子英偉達(dá)收購(gòu)ARM失敗的消息傳來(lái),不少人認(rèn)為英偉達(dá)會(huì)就此放棄這塊蛋糕,然而英偉達(dá)CEO黃仁勛卻表示他們并不會(huì)就此放棄ARM生態(tài),未來(lái)將繼續(xù)推出Grace這樣基于ARM架構(gòu)的CPU。之所以能有如此的底氣,在于英偉達(dá)那20年的ARM架構(gòu)授權(quán)。
目前擁有ARM架構(gòu)授權(quán)的企業(yè)屈指可數(shù),更不用說(shuō)64位的授權(quán),并將其用于HPC市場(chǎng)了。英偉達(dá)如今這種ARM CPU+GPU的路線,看似是在搶英特爾和AMD的生意,但面向的市場(chǎng)其實(shí)又有所不同。

GraceCPU /英偉達(dá)
Grace雖然性能不差,但與這些x86 CPU在通用計(jì)算上相比還是略遜一籌,況且也不是所有研究機(jī)構(gòu)或超算中心都會(huì)像日本一樣,構(gòu)建富岳或紫藤花這種規(guī)模的ARM超算。英偉達(dá)追求的并不是在通用計(jì)算上超過(guò)其他兩家數(shù)十年的積累,而是專注于AI算力。訓(xùn)練自然語(yǔ)言處理模型、利用GPU加速深度學(xué)習(xí),這才是英偉達(dá)的優(yōu)勢(shì)所在。
這時(shí)問題來(lái)了,為何超算不選擇其它通用CPU或其它的GPU產(chǎn)品呢?這樣既能兼顧通用計(jì)算性能,也能用的GPU的加速性能。這是因?yàn)橛ミ_(dá)準(zhǔn)備了專用于自家CPU和GPU的互聯(lián)技術(shù)NVLink。過(guò)去僅有GPU產(chǎn)品的英偉達(dá)僅僅將NVLink技術(shù)用于GPU之間的互聯(lián),如今在Grace出現(xiàn)后,NVLink4.0可以為GraceCPU和英偉達(dá)GPU牽線搭橋。
更不用說(shuō)英偉達(dá)已經(jīng)在2020年收購(gòu)了Mellanox,要知道在最新的TOP500超算中,除了使用常規(guī)的25/100G以太網(wǎng)互聯(lián)外,基本都用到了Mellanox的互聯(lián)技術(shù)。英偉達(dá)與Mellanox的結(jié)合,直接覆蓋了三分之二的頂級(jí)超算系統(tǒng)。未來(lái)的NVLink有了Mellanox的幫忙更是難以匹敵,所以并不是英偉達(dá)擔(dān)心競(jìng)品的出現(xiàn),而是其性能表現(xiàn)之強(qiáng),讓你不得不選擇他們旗下的產(chǎn)品。
小結(jié)
英特爾在超算上的發(fā)力歸根結(jié)底還是靠XeHPC這樣的GPU核心,但作為GPU新秀的英特爾短時(shí)間還是無(wú)法撼動(dòng)英偉達(dá)在超算上的地位。而英偉達(dá)的ARM計(jì)劃未來(lái)如何演進(jìn)也令人十分期待,畢竟這一產(chǎn)品線不像其消費(fèi)級(jí)GPU,還未有任何路線圖公布。但喜人的一點(diǎn)是,超算從百億億級(jí)過(guò)渡到十萬(wàn)億億級(jí)的過(guò)程中,勢(shì)必會(huì)有更多的創(chuàng)新方案出現(xiàn)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
cpu
+關(guān)注
關(guān)注
68文章
11013瀏覽量
215296 -
gpu
+關(guān)注
關(guān)注
28文章
4886瀏覽量
130430 -
超算
+關(guān)注
關(guān)注
1文章
117瀏覽量
9281
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
車牌識(shí)別新花樣:樹莓派打造智能車牌監(jiān)控系統(tǒng)!
樹莓派是創(chuàng)客們打造家庭安防系統(tǒng)的熱門之選,這得益于其具備運(yùn)用人工智能(AI)的能力。AI系統(tǒng)能識(shí)別潛在威脅,在此情境下,還能識(shí)別過(guò)往車輛的牌照信息。創(chuàng)客YashIndane就開發(fā)了一款這樣的車牌識(shí)別

云 GPU 加速計(jì)算:突破傳統(tǒng)算力瓶頸的利刃
,猶如一把利刃,成功突破了傳統(tǒng)算力的瓶頸。 傳統(tǒng)的 CPU 計(jì)算在面對(duì)大規(guī)模并行計(jì)算任務(wù)時(shí),往往顯得力不從心。CPU 核心數(shù)量有限,且設(shè)計(jì)側(cè)重于復(fù)雜的邏輯控制和串行處理,無(wú)法高效處理海量的并行數(shù)據(jù)。而
GPU算力租用平臺(tái)有什么好處
當(dāng)今,GPU算力租用平臺(tái)為科研機(jī)構(gòu)、企業(yè)乃至個(gè)人開發(fā)者提供了靈活高效的算力解決方案。下面,AI部落小編帶您深入探討GPU算力租用平臺(tái)所帶來(lái)的
算智算中心的算力如何衡量?
(ComputationalPower)是指智算中心通過(guò)其內(nèi)部的計(jì)算設(shè)備(如CPU、GPU、AI芯片等)對(duì)數(shù)據(jù)進(jìn)行處理和計(jì)算的能力。它體現(xiàn)了智算中心在單位時(shí)間內(nèi)能夠完成的計(jì)算任務(wù)量,

蔚來(lái)ET9行業(yè)首創(chuàng)飛航環(huán)影影像系統(tǒng)
智能汽車的攝像頭越來(lái)越多,每個(gè)攝像頭各司其職,還能玩出什么新花樣嗎?蔚來(lái)ET9告訴你,想象空間還很大。
FPGA+GPU+CPU國(guó)產(chǎn)化人工智能平臺(tái)
平臺(tái)采用國(guó)產(chǎn)化FPGA+GPU+CPU構(gòu)建嵌入式多核異構(gòu)智算終端,可形成FPGA+GPU、FPGA+CPU、CPU+FPGA等組合模式,形成

涂鴉將高科技取暖玩出新花樣!超級(jí)省電更節(jié)能,個(gè)性化取暖更極致
又到了一年一度的冬季極寒時(shí)節(jié),不同于東北普遍供暖、暖氣片子能玩出上百種花樣的愜意,南方濕冷的空氣讓南方人再次陷入了靠一身正氣取暖的哀嚎時(shí)刻。雖然南方還沒實(shí)現(xiàn)供暖,但近幾年靠著國(guó)家紅利政策的支持

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU
著色器(Pixel shader)是圖形流水線中算力相當(dāng)強(qiáng)大的功能單元,因?yàn)樗梢詾槊總€(gè)片段執(zhí)行復(fù)雜的計(jì)算,從而為最終渲染的圖像添加細(xì)節(jié)和視覺效果。
DirectX API推動(dòng) GPU 演進(jìn)
發(fā)表于 11-03 12:55
【一文看懂】大白話解釋“GPU與GPU算力”
隨著大模型的興起,“GPU算力”這個(gè)詞正頻繁出現(xiàn)在人工智能、游戲、圖形設(shè)計(jì)等工作場(chǎng)景中,什么是GPU,它與CPU的區(qū)別是什么?以及到底什么是GPU

GPU算力租用平臺(tái)是什么
GPU算力租用平臺(tái)是一種基于云計(jì)算的服務(wù)模式,它允許用戶通過(guò)互聯(lián)網(wǎng)按需租用高性能GPU資源,而無(wú)需自行購(gòu)買、部署和維護(hù)這些硬件。
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽
本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯
感謝平臺(tái)提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。
本書主要講算力芯片CPU
發(fā)表于 10-15 22:08
名單公布!【書籍評(píng)測(cè)活動(dòng)NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
這個(gè)想法被否決了,因?yàn)橥度胼^大、難以落地,且客戶對(duì)算力的認(rèn)同遠(yuǎn)不及今天這種高度。
這幾年間其實(shí)我們聯(lián)系甚少,但是作者一直沒有脫離對(duì)芯片的應(yīng)用和關(guān)注。特別是目睹GPU從消費(fèi)電子轉(zhuǎn)向算力芯片,目睹
發(fā)表于 09-02 10:09
商用清潔賽道,普渡清潔機(jī)器人如何玩出新花樣?
商用清潔賽道,普渡清潔機(jī)器人如何玩出新花樣? 前言 每次技術(shù)革命,都將對(duì)傳統(tǒng)模式帶來(lái)顛覆性改變。 目前,我國(guó)產(chǎn)業(yè)結(jié)構(gòu)正進(jìn)入快速升級(jí)階段,智能制造春潮涌動(dòng),各行各業(yè)正在經(jīng)歷一輪智能化轉(zhuǎn)型升級(jí)的變革
算力服務(wù)器為什么選擇GPU
隨著人工智能技術(shù)的快速普及,算力需求日益增長(zhǎng)。智算中心的服務(wù)器作為支撐大規(guī)模數(shù)據(jù)處理和計(jì)算的核心設(shè)備,其性能優(yōu)化顯得尤為關(guān)鍵。而GPU服務(wù)器也進(jìn)入了大眾的視野,成為高性能計(jì)算的首選。那么,為什么

CPU渲染和GPU渲染優(yōu)劣分析
使用計(jì)算機(jī)進(jìn)行渲染時(shí),有兩種流行的系統(tǒng):基于中央處理單元(CPU)或基于圖形處理單元(GPU)。CPU渲染利用計(jì)算機(jī)的CPU來(lái)執(zhí)行場(chǎng)景并將其渲染到接近完美。這也是執(zhí)行渲染的更傳統(tǒng)方式。

評(píng)論