電子發(fā)燒友網(wǎng)報(bào)道(文/李寧遠(yuǎn))OpenAI旗下的智能聊天機(jī)器人程序ChatGPT自去年年末發(fā)布后,在全球范圍內(nèi)掀起了人工智能熱潮,熱度持續(xù)至今。ChatGPT超出人們預(yù)期的智能化表現(xiàn)也帶火了相關(guān)人工智能產(chǎn)業(yè)鏈。
ChatGPT的GPT,本質(zhì)是生成型預(yù)訓(xùn)練變換模型,這種AI模型經(jīng)過(guò)海量的數(shù)據(jù)訓(xùn)練,才有了高質(zhì)量的內(nèi)容輸出。ChatGPT的出現(xiàn),離不開(kāi)背后龐大的基礎(chǔ)算力做支持。高度依賴AI計(jì)算能力的ChatGPT也推高了算力需求。
爆火的ChatGPT,高算力需求推動(dòng)DPU發(fā)展
隨著眾多國(guó)內(nèi)外廠商入局智能聊天機(jī)器人行業(yè)的競(jìng)爭(zhēng),可以預(yù)見(jiàn)市場(chǎng)上類似于ChatGPT的機(jī)器人程序會(huì)如雨后春筍一般冒出來(lái),而全球?qū)τ谒懔Φ男枨笠矊㈦S著此類技術(shù)應(yīng)用的鋪開(kāi)出現(xiàn)快速的增長(zhǎng)。
數(shù)據(jù)處理芯片DPU,被認(rèn)為是繼 CPU 和 GPU 之后的 “第三顆主力芯片”。DPU是最近幾年發(fā)展起來(lái)的專用處理器大類,是繼CPU、GPU之后數(shù)據(jù)中心場(chǎng)景中重要的算力芯片,能夠?yàn)楦邘挕⒌脱舆t、數(shù)據(jù)密集的計(jì)算場(chǎng)景提供計(jì)算引擎,是未來(lái)處理超算流量和安全網(wǎng)絡(luò)存儲(chǔ)的核心硬件。
DPU市場(chǎng)現(xiàn)在處于百家爭(zhēng)鳴的早期發(fā)展階段,各廠商給出的定義有略有不同,這里選擇市場(chǎng)上比較主流的英偉達(dá)給出的定義,“DPU是集數(shù)據(jù)中心基礎(chǔ)架構(gòu)于芯片的通用處理器,結(jié)合了標(biāo)準(zhǔn)的、高性能及軟件可編程的多核CPU,與其它的SoC組件密切配合。同時(shí)結(jié)合了高性能網(wǎng)絡(luò)接口,能以線速或網(wǎng)絡(luò)中的可用速度解析、處理數(shù)據(jù),并高效地將數(shù)據(jù)傳輸?shù)紾PU和CPU”。
相比于CPU和GPU典型的馮諾依曼架構(gòu),基于數(shù)據(jù)流驅(qū)動(dòng)技術(shù)的DPU采用的是非馮諾依曼架構(gòu),不需要結(jié)束一階段的計(jì)算任務(wù)后將數(shù)據(jù)輸送到外部的DDR計(jì)數(shù)器存儲(chǔ),而是可以利用軟件可動(dòng)態(tài)重構(gòu)處理器CGRA技術(shù),合理分配和使用算力的同時(shí),節(jié)約數(shù)據(jù)存儲(chǔ)和傳輸帶寬。當(dāng)CPU算力達(dá)到瓶頸,DPU能夠幫助CPU卸載低效應(yīng)用的算力,當(dāng)GPU專注數(shù)據(jù)加速計(jì)算,DPU可以幫助進(jìn)行數(shù)據(jù)解析和處理提高數(shù)據(jù)接發(fā)效率。
在ChatGPT高算力需求的推動(dòng)下,DPU開(kāi)始進(jìn)入發(fā)展快車(chē)道。
DPU市場(chǎng)將迎來(lái)爆發(fā)式增長(zhǎng),國(guó)產(chǎn)DPU蓄勢(shì)待發(fā)
根據(jù)據(jù)賽迪顧問(wèn)《中國(guó)DPU行業(yè)發(fā)展白皮書(shū)》對(duì)全球以及中國(guó)DPU市場(chǎng)的統(tǒng)計(jì),預(yù)計(jì)到2025年全球DPU產(chǎn)業(yè)市場(chǎng)規(guī)模將超過(guò)245.3億美元,復(fù)合增速達(dá)51.73%。而中國(guó)市場(chǎng)預(yù)計(jì)到2025年DPU產(chǎn)業(yè)規(guī)模將超過(guò)565.9億元,復(fù)合增速達(dá)170.6%。
白皮書(shū)中特別提到,中國(guó)DPU市場(chǎng)在2022-2023年將會(huì)有爆發(fā)式的增長(zhǎng),而全球市場(chǎng)的爆發(fā)式增長(zhǎng)階段將會(huì)出現(xiàn)在2023-2024年。
DPU在行業(yè)內(nèi)其實(shí)早已有了雛形,早在2013年,Amazon就研發(fā)過(guò)一款名為Nitro的輕量化Hypervisor配合定制化硬件,能將虛擬機(jī)的計(jì)算和 I/O子系統(tǒng)分離開(kāi)來(lái)。直到2020年英偉達(dá)將基于Mellanox的Smart NIC命名為DPU并將其定位為繼CPU和GPU之后數(shù)據(jù)中心的“第三顆主力芯片”,才算真正走到大家眼前被重視起來(lái)并掀起行業(yè)熱潮。
根據(jù)賽迪顧問(wèn)《中國(guó)DPU行業(yè)發(fā)展白皮書(shū)》中的數(shù)據(jù),2020年國(guó)內(nèi)的DPU市場(chǎng)僅有3.9億元。而到了2021年,國(guó)內(nèi)市場(chǎng)規(guī)模迅速發(fā)展到75.3億元,可見(jiàn)這一賽道的火熱。
從目前入局的廠商來(lái)看,英偉達(dá)、Intel、AMD、Marvell、Broadcom、Amazon、Microsoft等國(guó)際廠商在近年來(lái)都有DPU或相似架構(gòu)產(chǎn)品發(fā)布,入局早具備一定的先發(fā)優(yōu)勢(shì),在底層能力上無(wú)疑要領(lǐng)先國(guó)內(nèi)廠商。
國(guó)內(nèi)華為,阿里等老牌廠商也在近幾年針對(duì)服務(wù)器需求自研DPU,主要功能偏向于數(shù)據(jù),存儲(chǔ)與安全方面。同時(shí)國(guó)內(nèi)還有一批初創(chuàng)企業(yè)加入了DPU賽道,如云豹智能、星云智聯(lián)、芯啟源、云脈芯聯(lián)、中科馭數(shù)、大禹智芯等。
主要DPU廠商動(dòng)態(tài)
英偉達(dá):先進(jìn)BlueField系列占據(jù)行業(yè)高點(diǎn)
在全球DPU市場(chǎng),英偉達(dá)占據(jù)了超半數(shù)市場(chǎng)份額。目前英偉達(dá)的BlueField系列DPU已經(jīng)發(fā)展至第三代,BlueField-3 是首款以線速處理軟件定義網(wǎng)絡(luò)、存儲(chǔ)和網(wǎng)絡(luò)安全的 DPU,速度可達(dá)400 Gb/s。BlueField-3可以搭載最多16個(gè)Armv8.2+ A78 Hercules核心,包含220億個(gè)晶體管,擁有16GB板載DDR5顯存,能夠在I/O路徑中提供強(qiáng)大的計(jì)算能力和多種可編程加速引擎。相比BlueField-2系列8 顆ARM A72 CPU 內(nèi)核,處理性能提升了近10倍。
而B(niǎo)lueField-4根據(jù)英偉達(dá)官方消息,有望在2024年推出。除此之外,英偉達(dá)還將DPU與 Ampere架構(gòu)的強(qiáng)大功能結(jié)合成融合加速器,進(jìn)一步為AI驅(qū)動(dòng)的工作負(fù)載帶來(lái)出色的性能和強(qiáng)大的安全性。
英特爾:預(yù)計(jì)2024年推出400G IPU,2025年推出800G IPU
英特爾的IPU被業(yè)界視為英特爾版本的DPU,同樣可以加速網(wǎng)絡(luò)基礎(chǔ)設(shè)施,釋放CPU內(nèi)核,實(shí)現(xiàn)應(yīng)用程序性能的提升。E2000是目前英特爾處理性能最高的IPU,是英特爾利用從多代FPGA SmartNIC 中積累的經(jīng)驗(yàn)和谷歌共同設(shè)計(jì)的,擁有多達(dá)16個(gè)Arm Neoverse N1核心,具備高度可編程性的數(shù)據(jù)包處理引擎。
從去年Intel Vision 2022大會(huì)上公布的最新的IPU路線圖來(lái)看,2024年400 Gbps IPU有望面世,800G IPU則定在2025年。
芯啟源:布局下一代7nm以下DPU產(chǎn)品
芯啟源是目前國(guó)內(nèi)唯一一家能夠提供基于SoC架構(gòu)的國(guó)產(chǎn)化25G智能網(wǎng)卡的供應(yīng)商,已經(jīng)推出了量產(chǎn)的DPU芯片4000及3800系列產(chǎn)品,并且已實(shí)現(xiàn)商業(yè)化落地。芯啟源的下一個(gè)布局是7000系列DPU,根據(jù)相關(guān)信息,下一代DPU芯片將采用7nm以下工藝,能達(dá)到400G的吞吐量,具有600Mpps,RDMA/RoCEv2,國(guó)密SM3/SM4等的功能及性能。
星云智聯(lián):實(shí)力強(qiáng)勁的國(guó)內(nèi)初創(chuàng)DPU芯片公司
星云智聯(lián)是一家專注于數(shù)據(jù)中心通信互聯(lián)架構(gòu)、DPU芯片和解決方案研發(fā)的國(guó)內(nèi)初創(chuàng)公司,其自主研發(fā)的NebulaX D1055AS是一款50G DPU芯片。NebulaX D1055AS在高速數(shù)據(jù)轉(zhuǎn)發(fā)上,以純硬件方式實(shí)現(xiàn)對(duì)數(shù)據(jù)流處理,以獲得高吞吐量和低延時(shí)性能,在國(guó)內(nèi)DPU賽道上有著強(qiáng)勁的實(shí)力。
云豹智能:DPU SoC有望今年量產(chǎn)
云豹智能主張軟件定義芯片,此前發(fā)布過(guò)基于FPGA版本的DPU云霄,在可編程性上非常靈活。目前云豹智能的第一款DPU SoC正在設(shè)計(jì)研發(fā)階段,根據(jù)相關(guān)消息,該DPU SoC有望在今年量產(chǎn)。
中科馭數(shù):基于自研KPU架構(gòu)布局DPU
中科馭數(shù)的KPU架構(gòu)是基于中科馭數(shù)首創(chuàng)的軟件定義加速器技術(shù)路線而研發(fā)的領(lǐng)域?qū)S眉夹g(shù)芯片架構(gòu),并基于該架構(gòu)打造了首個(gè)擁有網(wǎng)絡(luò)數(shù)據(jù)庫(kù)一體化加速功能的DPU芯片,能提供高效能的算力支撐。在目前的產(chǎn)品進(jìn)度上,根據(jù)相關(guān)報(bào)道,第三代12nm 400G DPU芯片的研發(fā)迭代已近尾聲。
寫(xiě)在最后
DPU的誕生就是為了應(yīng)對(duì)數(shù)據(jù)量以及計(jì)算復(fù)雜性的指數(shù)級(jí)增長(zhǎng),在ChatGPT將算力需求再推上一個(gè)新臺(tái)階后,DPU有力支撐起了算力效率的提升,在原本火熱的市場(chǎng)里又一次加快了發(fā)展速度。
-
DPU
+關(guān)注
關(guān)注
0文章
393瀏覽量
24916 -
算力
+關(guān)注
關(guān)注
2文章
1193瀏覽量
15641 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1589瀏覽量
9079
發(fā)布評(píng)論請(qǐng)先 登錄
上汽大眾新款凌渡L GTS蓄勢(shì)待發(fā)
第三屆NVIDIA DPU黑客松開(kāi)啟報(bào)名
中科馭數(shù)攜DPU全棧產(chǎn)品亮相福州數(shù)博會(huì),賦能智算時(shí)代算力基建

DPU232—高度集成USB到UART橋接控制器 國(guó)產(chǎn)替代方案
1750億美元資金蓄勢(shì)待發(fā),OpenAI加速AI基礎(chǔ)設(shè)施建設(shè)
在NVIDIA BlueField-3 DPU上運(yùn)行WEKA客戶端的實(shí)際優(yōu)勢(shì)


《金融街午餐會(huì)》年終特別節(jié)目——新質(zhì)生產(chǎn)力大路演,“數(shù)據(jù)搬運(yùn)高手”DPU如何打破AI時(shí)代算力瓶頸?
中科馭數(shù)憑借在DPU芯片領(lǐng)域的積累被認(rèn)定為北京市知識(shí)產(chǎn)權(quán)優(yōu)勢(shì)單位

2025年全球半導(dǎo)體八大趨勢(shì),萬(wàn)年芯蓄勢(shì)待發(fā)

評(píng)論