電子發(fā)燒友網(wǎng)報道(文/周凱揚)從最近英偉達公布的財報中就可以看出,AI應(yīng)用的火熱使其賺得盆滿缽滿,原本就在AI軟硬件生態(tài)稱王的英偉達,現(xiàn)今更是如日中天。而這樣的處境也讓不少AI芯片初創(chuàng)公司不好過,他們的產(chǎn)品有的還沒落地,有的則難以與A100、H100這樣的產(chǎn)品匹敵。這幾年沉寂下去的AI芯片初創(chuàng)公司著實不少,但還是有的廠商敢于繼續(xù)往這個市場里鉆。
水平擴展性的限制
隨著AI/ML的模型越來越大,甚至是以5年內(nèi)翻4萬倍的速度提升,要想在硬件上跟上軟件進度已經(jīng)越來越難了。可即便如此,從16nm到4nm,從低精度到脈動陣列,都給了我們巨大的優(yōu)勢去追隨這些大模型。
但運行這些大模型終究不是靠單個芯片的力量,而是整個規(guī)模集群需要面臨的問題,所以這就牽扯到了水平擴展性。工藝制程的提高帶來了5倍的性能提升,芯片架構(gòu)帶來了14倍的性能提升,而水平擴展則要實現(xiàn)600倍的性能提升,才能滿足未來的AI/ML計算要求。這也就是目前AI計算存在的問題,大模型往往需要更大的內(nèi)存、更高的算力和更大的帶寬,隨著設(shè)備數(shù)量越多,這三大硬件要求的分配復(fù)雜程度就變得越來越高。
比如在GPU上就已經(jīng)嘗試了不少并行擴展方案,比如數(shù)據(jù)并行、流水線模型并行或張量模型并行等,但以上方案往往都會受到內(nèi)存、帶寬和參數(shù)量的限制,并沒有單一通用的解決方案,大模型往往需要同時結(jié)合這三種方案,所以擴展效率不高。AI芯片公司Cerebras則想出了一個在大規(guī)模集群下提高水平擴展性的解決方案。
Cerebras的WSE
要說在AI芯片的初創(chuàng)公司里,走著獨立無二路線的公司,Cerebras絕對能排得上名號。2019年,他們推出了WSE,一個晶圓大小的AI處理器,到了2021年,他們又推出了第二代的WSE-2,采用更先進的工藝將單個處理器的核心數(shù)推進至85萬核。而這次Hot Chips上,他們則展示了用于對抗英偉達的解決方案。

WSE-2與GPU大小對比 / Cerebras
Cerebras選擇了將內(nèi)存和計算解耦的方案,利用內(nèi)存擴展技術(shù)MemoryX,將模型權(quán)重存儲在外部,然后將權(quán)重傳輸給WSE-2組成的CS-2系統(tǒng),CS-2再將梯度傳給外部存儲。Cerebras還打造了一個互聯(lián)方案SwarmX,用于連接多個CS-2系統(tǒng),從而提高擴展性。
以Cerebras搭建的Andromeda超算為例,該超算由16個CS-2系統(tǒng)組成,擁有1350萬個AI優(yōu)化核心,稀疏算力高達1ExaFLOPs,稠密算力高達120PetaFLOPs。在這樣強大的算力下,訓(xùn)練大模型只要幾周的時間。而且在Cerebras不同規(guī)模的集群上,不同參數(shù)的大模型可以共享同樣的代碼,以同樣的方式訓(xùn)練,省去了不少開發(fā)時間。
除了Andromeda以外,Cerebras也已經(jīng)開始了下一個AI超算的部署,由64個CS-2系統(tǒng)組成的Condor Galaxy 1,該超算的算力將擴展至4ExaFLOPs的稀疏算力。而Condor Galaxy 1名字后的1,也意味著這僅僅是單個超算中心所用的系統(tǒng)而已,未來他們計劃在2024年底之前擴展為9個超算中心,分布在美國各地,構(gòu)建最大的分布式超算網(wǎng)絡(luò),總算力高達36ExaFLOPs,是英偉達Israel-1超算的9倍,是谷歌最大TPUv4集群的4倍。
寫在最后
單從擴展性和性能的角度來看,Cerebras確實已經(jīng)做到了一個新的高度。但對于購置這些GPU或AI芯片的云服務(wù)或互聯(lián)網(wǎng)公司來說,GPU或許是一個更加通用的資源,在AI技術(shù)日新月異的當(dāng)下,GPU總能憑借自己的軟硬件生態(tài)快速找到自己的一席之地,并在高性能的王座上穩(wěn)坐一段時間。這也就是AI爆款應(yīng)用的市場導(dǎo)向決定的了,性能固然重要,但搶占先機才是最關(guān)鍵的一環(huán)。
水平擴展性的限制
隨著AI/ML的模型越來越大,甚至是以5年內(nèi)翻4萬倍的速度提升,要想在硬件上跟上軟件進度已經(jīng)越來越難了。可即便如此,從16nm到4nm,從低精度到脈動陣列,都給了我們巨大的優(yōu)勢去追隨這些大模型。
但運行這些大模型終究不是靠單個芯片的力量,而是整個規(guī)模集群需要面臨的問題,所以這就牽扯到了水平擴展性。工藝制程的提高帶來了5倍的性能提升,芯片架構(gòu)帶來了14倍的性能提升,而水平擴展則要實現(xiàn)600倍的性能提升,才能滿足未來的AI/ML計算要求。這也就是目前AI計算存在的問題,大模型往往需要更大的內(nèi)存、更高的算力和更大的帶寬,隨著設(shè)備數(shù)量越多,這三大硬件要求的分配復(fù)雜程度就變得越來越高。
比如在GPU上就已經(jīng)嘗試了不少并行擴展方案,比如數(shù)據(jù)并行、流水線模型并行或張量模型并行等,但以上方案往往都會受到內(nèi)存、帶寬和參數(shù)量的限制,并沒有單一通用的解決方案,大模型往往需要同時結(jié)合這三種方案,所以擴展效率不高。AI芯片公司Cerebras則想出了一個在大規(guī)模集群下提高水平擴展性的解決方案。
Cerebras的WSE
要說在AI芯片的初創(chuàng)公司里,走著獨立無二路線的公司,Cerebras絕對能排得上名號。2019年,他們推出了WSE,一個晶圓大小的AI處理器,到了2021年,他們又推出了第二代的WSE-2,采用更先進的工藝將單個處理器的核心數(shù)推進至85萬核。而這次Hot Chips上,他們則展示了用于對抗英偉達的解決方案。

WSE-2與GPU大小對比 / Cerebras
Cerebras選擇了將內(nèi)存和計算解耦的方案,利用內(nèi)存擴展技術(shù)MemoryX,將模型權(quán)重存儲在外部,然后將權(quán)重傳輸給WSE-2組成的CS-2系統(tǒng),CS-2再將梯度傳給外部存儲。Cerebras還打造了一個互聯(lián)方案SwarmX,用于連接多個CS-2系統(tǒng),從而提高擴展性。
以Cerebras搭建的Andromeda超算為例,該超算由16個CS-2系統(tǒng)組成,擁有1350萬個AI優(yōu)化核心,稀疏算力高達1ExaFLOPs,稠密算力高達120PetaFLOPs。在這樣強大的算力下,訓(xùn)練大模型只要幾周的時間。而且在Cerebras不同規(guī)模的集群上,不同參數(shù)的大模型可以共享同樣的代碼,以同樣的方式訓(xùn)練,省去了不少開發(fā)時間。
除了Andromeda以外,Cerebras也已經(jīng)開始了下一個AI超算的部署,由64個CS-2系統(tǒng)組成的Condor Galaxy 1,該超算的算力將擴展至4ExaFLOPs的稀疏算力。而Condor Galaxy 1名字后的1,也意味著這僅僅是單個超算中心所用的系統(tǒng)而已,未來他們計劃在2024年底之前擴展為9個超算中心,分布在美國各地,構(gòu)建最大的分布式超算網(wǎng)絡(luò),總算力高達36ExaFLOPs,是英偉達Israel-1超算的9倍,是谷歌最大TPUv4集群的4倍。
寫在最后
單從擴展性和性能的角度來看,Cerebras確實已經(jīng)做到了一個新的高度。但對于購置這些GPU或AI芯片的云服務(wù)或互聯(lián)網(wǎng)公司來說,GPU或許是一個更加通用的資源,在AI技術(shù)日新月異的當(dāng)下,GPU總能憑借自己的軟硬件生態(tài)快速找到自己的一席之地,并在高性能的王座上穩(wěn)坐一段時間。這也就是AI爆款應(yīng)用的市場導(dǎo)向決定的了,性能固然重要,但搶占先機才是最關(guān)鍵的一環(huán)。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
AI
+關(guān)注
關(guān)注
88文章
34588瀏覽量
276184 -
英偉達
+關(guān)注
關(guān)注
22文章
3927瀏覽量
93273
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
英偉達、高通布局AI投資版圖,這些明星企業(yè)被收入囊中!
的模型并不會減少芯片的需求,相反,未來的計算需求只會增加,尤其是對計算基礎(chǔ)設(shè)施的需求。 英偉達也在利用其雄厚的資金大幅增加了對各種初創(chuàng)公司的
英偉達收購AI初創(chuàng)公司Run:ai
全球領(lǐng)先的芯片制造商英偉達近日正式完成了對以色列人工智能初創(chuàng)公司Run:ai的收購。這一收購案在
微軟大手筆采購英偉達AI芯片
據(jù)全球知名市場調(diào)研機構(gòu)Omdia的最新估計,微軟在2024年的英偉達Hopper架構(gòu)芯片采購計劃上展現(xiàn)出了驚人的手筆。這一舉動旨在幫助微軟在構(gòu)建下一代人工智能(AI)系統(tǒng)的激烈競爭中搶
英偉達加速認(rèn)證三星新型AI存儲芯片
近日,英偉達首席執(zhí)行官黃仁勛近日在接受采訪時透露,英偉達正在全力加速對三星最新推出的AI存儲芯片
OpenAI領(lǐng)投Rain AI,挑戰(zhàn)英偉達AI芯片市場地位
巨頭英偉達展開有力競爭。 為了加強其領(lǐng)導(dǎo)團隊,Rain AI于2024年6月成功聘請前蘋果公司芯片執(zhí)行官Jean-Didier Allegr
英偉達超越蘋果成為市值最高 英偉達取代英特爾加入道指
蘋果公司的市值,重新成為全球市值最高的公司。 在AI領(lǐng)域,英偉達正瘋狂奔跑,我們看到有外媒報道英偉
英偉達投資日本AI研發(fā)初創(chuàng)公司
Ventures及Lux Capital等業(yè)界巨頭,而英偉達亦作為重要參與者加入這一行列。此番攜手不僅彰顯了Sakana AI在AI研發(fā)領(lǐng)域的深厚潛力,也預(yù)示著雙方將開啟一段嶄新的合
英偉達投資日本AI公司Sakana AI
英偉達現(xiàn)身日本人工智能研發(fā)初創(chuàng)公司Sakana AI的A輪融資名單中;據(jù)悉;Sakana AI的
韓國AI芯片巨頭合并,劍指英偉達龍頭地位
的合資公司創(chuàng)造超過1萬億韓元的業(yè)務(wù)價值,標(biāo)志著韓國在AI芯片領(lǐng)域的雄心壯志,旨在挑戰(zhàn)全球領(lǐng)導(dǎo)者英偉達(NVIDIA)的霸主地位。
AI芯片巨頭英偉達漲超4% 英偉達市值暴增7500億
誰是美股最靚的仔?在人工智能浪潮之下AI芯片巨頭英偉達肯定有一席之地,特別是現(xiàn)在全球資本市場動蕩之際,業(yè)界分析師多認(rèn)為英偉
英偉達回應(yīng)AI芯片推遲發(fā)布傳聞
近日,英偉達就外界廣泛關(guān)注的AI芯片Blackwell推遲發(fā)布傳聞作出正式回應(yīng)。8月4日,英偉達

歐盟警告英偉達AI芯片供應(yīng)壟斷趨勢
歐盟競爭事務(wù)專員瑪格麗特·維斯塔格近日在新加坡之行中發(fā)出警告,指出英偉達公司在人工智能(AI)芯片供應(yīng)方面存在壟斷趨勢,這一表態(tài)立即引起了業(yè)
英偉達AI芯片需求激增,封測廠訂單量或翻倍
在全球半導(dǎo)體行業(yè)持續(xù)演進的背景下,英偉達(NVIDIA)的AI芯片需求正迎來前所未有的增長。據(jù)悉,英偉達
英偉達收購軟件初創(chuàng)公司Shoreline
近日,全球知名的圖形處理器制造商英偉達(NVIDIA)宣布了一項重要的收購計劃,將以約1億美元的價格收購軟件初創(chuàng)公司Shoreline。這次收購不僅體現(xiàn)了
評論