1、算力由性能、規(guī)模和利用率三部分組成
算力 = (單芯片)性能 x 規(guī)模(即數(shù)量) x 利用率。
算力是由性能、規(guī)模、利用率三部分共同組成的,相輔相成,缺一不可:
有的算力芯片,可能可以做到性能狂飆,但較少考慮芯片的通用性易用性,然后芯片銷量不高落地規(guī)模小,那就無法做到宏觀算力的真正提升。
有的算力提升方案,重在規(guī)模投入,攤大餅有一定作用,但不是解決未來算力需求數(shù)量級提升的根本。
有的解決方案,通過各種資源池化和跨不同的邊界算力共享,來提升算力利用率,但改變不了目前算力芯片性能瓶頸的本質(zhì)。
性能、規(guī)模、利用率,宏觀微觀,牽一發(fā)而動全身。管中窺豹終有偏,既要考慮多種因素協(xié)同設(shè)計,更要宏觀的統(tǒng)籌算力問題。
2、最核心的,通過超異構(gòu)實現(xiàn)芯片性能的數(shù)量級提升
一方面,超異構(gòu)可以通過集成更多的加速引擎來實現(xiàn)相比CPU、GPU的性能的數(shù)量級提升,但更多的計算是在DSA架構(gòu)引擎完成的,從單位晶體管資源的性能效率視角看,是和DSA在一個量級的。
工藝進步、3D封裝、Chiplet封裝等各種創(chuàng)新,支持?jǐn)?shù)量級提升的設(shè)計規(guī)模。但要想充分利用這些價值,就需要創(chuàng)新的系統(tǒng)架構(gòu)。超異構(gòu)計算,通過分布式系統(tǒng)設(shè)計,可以駕馭數(shù)量級提升的更大的設(shè)計規(guī)模。因此,可以做到相比傳統(tǒng)DSA再繼續(xù)10倍甚至100倍的性能提升。
3、在超異構(gòu)的約束下,實現(xiàn)規(guī)模化落地
3.1 芯片要更好地支持規(guī)模化
從微服務(wù)的視角,云計算是由不同的服務(wù)組成的分層服務(wù)體系:每一層就是一個服務(wù)族,然后不同層次的服務(wù)族組成整個云計算服務(wù)體系,這就是我們所熟悉的云計算三層服務(wù)IaaS、PaaS和SaaS。
更詳細的軟件堆棧如上圖所示,從非云系統(tǒng)所有的“服務(wù)”堆棧都需要用戶自己擁有并維護,經(jīng)過IaaS、CaaS、PaaS、FaaS,再到最后的SaaS,一切都由供應(yīng)商運營維護。從左到右的過程,就是“服務(wù)”堆棧的下層layer不斷地由云運營商接管的過程。
這是一個鮮明的“二八定律”案例:80%的任務(wù)由云運營商負責(zé),20%的任務(wù)由用戶負責(zé);站在用戶的角度,20%自己負責(zé)的任務(wù)價值占到80%,而運營商負責(zé)的部分只占到到20%的價值。
因此,基于二八定律,我們可以把整個系統(tǒng)分為三部分:
基礎(chǔ)設(shè)施層。基礎(chǔ)設(shè)施層的任務(wù)都相對確定,適合DSA和ASIC處理引擎處理。
應(yīng)用層可加速部分任務(wù)。基礎(chǔ)設(shè)施層是CSP使用,而應(yīng)用層則是給到用戶應(yīng)用。用戶的應(yīng)用多種多樣,因此應(yīng)用層的加速也需要一定程度的彈性。這樣,GPU和FPGA就相對比較合適。
應(yīng)用層的不可加速部分。主要是一些通用的處理,如控制以及一些細粒度的計算。協(xié)處理器是CPU的一部分。因此,CPU適合各類通用任務(wù)處理,CPU負責(zé)兜底。
如上圖所示,整個系統(tǒng)的處理有點像塔防游戲:DSA負責(zé)干粗活累活,大量的計算任務(wù)在DSA中完成;GPU是性能和靈活性折中一些,負責(zé)一些彈性加速的計算任務(wù);CPU啥都能干,但性能較差,因此負責(zé)兜底,也就是其他處理引擎都干不了的,都放在CPU。
這樣,CPU+GPU+DSA+etc.的超異構(gòu)計算架構(gòu)就可以實現(xiàn)“包治百病”的、相對通用的計算架構(gòu)和平臺,就可以實現(xiàn)在云、網(wǎng)、邊、端等大算力場景以及用戶的絕大部分覆蓋。
更多場景和更多用戶的覆蓋,這樣才能真正實現(xiàn)芯片的規(guī)模化落地。芯片的大規(guī)模落地之后,又進一步攤薄一次性研發(fā)成本,進一步降低成本,形成良性循環(huán)。
3.2 宏觀算力建設(shè)實現(xiàn)芯片規(guī)模化
要想持續(xù)不斷地增加算力,不可避免的就是建設(shè)更多的數(shù)據(jù)中心。2022年2月,國家發(fā)改委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局聯(lián)合印發(fā)通知,同意在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等8地啟動建設(shè)國家算力樞紐節(jié)點,并規(guī)劃了10個國家數(shù)據(jù)中心集群。至此,全國一體化大數(shù)據(jù)中心體系完成總體布局設(shè)計,“東數(shù)西算”工程正式全面啟動。
“東數(shù)西算”通過構(gòu)建數(shù)據(jù)中心、云計算、大數(shù)據(jù)一體化的新型算力網(wǎng)絡(luò)體系,將東部算力需求有序引導(dǎo)到西部,優(yōu)化數(shù)據(jù)中心建設(shè)布局,促進東西部協(xié)同聯(lián)動。“東數(shù)西算”工程有三個總體思路:一是推動全國數(shù)據(jù)中心適度集聚、集約發(fā)展。通過在全國布局8個算力樞紐,引導(dǎo)大型、超大型數(shù)據(jù)中心向樞紐內(nèi)集聚,形成數(shù)據(jù)中心集群。二是促進數(shù)據(jù)中心由東向西梯次布局、統(tǒng)籌發(fā)展。三是實現(xiàn)“東數(shù)西算”循序漸進、快速迭代。
除了大型云數(shù)據(jù)中心建設(shè)之外,也需要更多的邊緣數(shù)據(jù)中心和服務(wù)器、更多的超高算力的智慧終端,以及更智慧的網(wǎng)絡(luò)核心設(shè)備,來共同提升宏觀總算力。
4、在超異構(gòu)的約束下,提升算力利用率
4.1 提升算力利用率的手段
云計算出現(xiàn)之前,部署一套互聯(lián)網(wǎng)系統(tǒng),一般有兩種方式:小規(guī)模的時候,自己購買物理的服務(wù)器,然后租用運營商的機房;超過一定規(guī)模的時候,就需要自己建機房,租用運營商的網(wǎng)絡(luò),自己運維數(shù)據(jù)中心的軟件和硬件。這個時候的算力資源是一個個孤島,整個業(yè)務(wù)的模式也非常之重,成本很高而且彈性不足。如果算力資源配置比較多,就意味著資源浪費和利用率低;如果算力資源配置比較少,就意味著無法支撐業(yè)務(wù)的發(fā)展,丟失關(guān)鍵的商業(yè)機會。
云計算通過互聯(lián)網(wǎng)按需提供IT資源,并且采用按使用量付費的方式。用戶可以根據(jù)需要從云服務(wù)商那里獲得技術(shù)服務(wù),例如計算能力、存儲和數(shù)據(jù)庫,而無需購買、擁有和維護物理數(shù)據(jù)中心及服務(wù)器。云服務(wù)使用多少支付多少,可以幫助用戶降低運維成本,用戶可以根據(jù)業(yè)務(wù)需求的變化快速調(diào)整服務(wù)的使用。
其他如基于分布式云的邊緣計算、跨不同云廠家的MSP、算力網(wǎng)絡(luò)以及云網(wǎng)邊端融合等,都是盡可能的把算力資源整合成一個巨大的資源池,然后可以靈活的根據(jù)各種完全動態(tài)變化的需求來提供合適的算力。
我們分析一下,要想提升算力利用率,肯定不能是算力的孤島:
第一個階段,所有的設(shè)備是孤島,各自要實現(xiàn)各自的所有功能。軟件應(yīng)用也是單機版,算力利用率很低,應(yīng)用的規(guī)模受單個硬件規(guī)格的限制;
第二階段,有了互聯(lián)網(wǎng),不同的設(shè)備可以進行協(xié)作。可以通過C/S架構(gòu)實現(xiàn)跨設(shè)備的軟件應(yīng)用協(xié)作。這樣,應(yīng)用的規(guī)模就突破了單個設(shè)備的約束。
第三階段,所有的算力資源形成一個整體。可以自動的、任意的切分算力資源。軟件也升級成了MicroService架構(gòu)。這樣可以根據(jù)設(shè)備的規(guī)格大小,運行合適大小合適數(shù)量的微服務(wù)。只有資源形成巨大的資源池,然后通過各種運營管理,才能真正提高算力的利用率。
4.2 芯片視角看算力利用率
資源池化是提升算力利用率的根本途徑,但資源要想池化,對硬件有很高的要求:
不同設(shè)備架構(gòu)/接口一致。比如CPU等引擎架構(gòu)一致(比如都是x86架構(gòu)平臺),那么軟件可以運行在任何一個設(shè)備上,硬件也可以支持各種不同的軟件運行。比如NVMe SSD,可以被不同的用戶訪問,也可以同時或分時地支持多種用戶的工作。
支持虛擬化。一方面是資源粒度的問題,另一方面是資源自由和動態(tài)分配的問題,都可以通過虛擬化技術(shù)解決。虛擬化還可以實現(xiàn)不同架構(gòu)/接口的抽象,屏蔽硬件差異。
通常,算力的平臺都是CPU,而且目前x86架構(gòu)CPU占據(jù)了絕大部分市場份額,并且x86 CPU對虛擬化的支持也非常的好。CPU對資源池化的支持,或者說對算力更高利用率的支持,是相當(dāng)?shù)挠押谩?/p>
但是,隨著性能需求越來越高,不得不通過超異構(gòu)計算來數(shù)量級提升算力的時候,問題出現(xiàn)了。在超異構(gòu)的架構(gòu)下,如何實現(xiàn)更高的靈活性,如何實現(xiàn)更高的擴展性,如何實現(xiàn)各類資源的輕松便捷地池化和共享,則是一個全新的挑戰(zhàn):
處理引擎要支持虛擬化和高可擴展性;
軟件可以跨不同廠家的、不同架構(gòu)處理引擎;
軟件可以跨跨CPU、GPU、DSA等不同類型處理引擎;
軟件可以跨云網(wǎng)邊端。
5、展望,云網(wǎng)邊端大融合
在虛擬化的加持下,軟件可以實現(xiàn)完全高可用:軟件可以脫離硬件實體,隨意的尋找合適的平臺運行,自適應(yīng)的在云、網(wǎng)、邊、端運行。
隨著CPU的性能瓶頸,I/O虛擬化技術(shù)完全硬件化的情況下,硬件接口直接暴露給軟件,這就需要云數(shù)據(jù)中心內(nèi)部,以及跨云邊端的硬件平臺一致性。
要想實現(xiàn)跨云網(wǎng)邊端、跨不同廠家的芯片平臺、跨不同類型不同架構(gòu)的處理引擎,就需要芯片、系統(tǒng)、框架和庫、以及上層應(yīng)用的多方協(xié)同,就需要開源開放的超異構(gòu)計算生態(tài)。
萬物互聯(lián),當(dāng)所有的設(shè)備算力資源匯集成一個大的共享資源池,算力資源將取之不盡用之不竭。
原文標(biāo)題:再來聊聊大家都經(jīng)常聊的算力話題
文章出處:【微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
-
處理器
+關(guān)注
關(guān)注
68文章
19714瀏覽量
232713 -
芯片
+關(guān)注
關(guān)注
459文章
51893瀏覽量
433253 -
cpu
+關(guān)注
關(guān)注
68文章
11003瀏覽量
215037 -
算力
+關(guān)注
關(guān)注
1文章
1099瀏覽量
15335
原文標(biāo)題:再來聊聊大家都經(jīng)常聊的算力話題
文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
“四算合一”算力平臺,芯片國產(chǎn)化率超九成,兼容8種國產(chǎn)AI芯片
華為SPN技術(shù)助力算力網(wǎng)絡(luò)和數(shù)聯(lián)網(wǎng)發(fā)展
大算力芯片的生態(tài)突圍與算力革命
智能算力最具潛力的行業(yè)領(lǐng)域

DeepSeek推動AI算力需求:800G光模塊的關(guān)鍵作用

江波龍自研主控芯片實現(xiàn)規(guī)模化導(dǎo)入
OCTC發(fā)布"算力工廠"!力促智算中心高效規(guī)劃建設(shè)投運

IaaS+on+DPU(IoD)+下一代高性能算力底座技術(shù)白皮書
東土科技自主研發(fā)的人工智能交通服務(wù)器實現(xiàn)規(guī)模化應(yīng)用
曙光攜手“算力互聯(lián)公共服務(wù)平臺”提高全國算力匹配效率
IBM陳旭東:攜手IBM加速 AI 規(guī)模化應(yīng)用,解鎖企業(yè)新質(zhì)生產(chǎn)力

助力全國一體化算力網(wǎng)建設(shè),神州鯤泰以算力構(gòu)建新質(zhì)生產(chǎn)力

北京:規(guī)劃建設(shè)支撐萬億級參數(shù)大模型訓(xùn)練需求的超大規(guī)模智算集群

評論