電子發(fā)燒友網(wǎng)報道(文/吳子鵬)日前,彭博社發(fā)文稱,為減少對英偉達芯片的依賴,亞馬遜已經(jīng)秘密啟動了“登月”(moonshot)的計劃,目前正在其位于得克薩斯州奧斯汀的工程實驗室加緊研發(fā)一款新的AI芯片:Trainium2,目標是在亞馬遜自己的數(shù)據(jù)中心里部署10萬顆Trainium2,以提高數(shù)據(jù)處理效率并降低AI芯片采購成本。
近幾年,亞馬遜一直都在致力于自研芯片以降低數(shù)據(jù)中心成本,根據(jù)云成本管理和優(yōu)化平臺Vantage此前的一項調(diào)查數(shù)據(jù),在Amazon EC2 M7系列通用實例的成本支出方面,采用Amazon Graviton的M7g系列已經(jīng)超過三分之一(34.5%)。
亞馬遜自研芯片第一次亮相始于2016年,在當年的re:Invent大會上,亞馬遜云傳奇工程師James Hamilton展示了該公司第一顆自研芯片,這便是第一代Graviton芯片。和英特爾、AMD的芯片不同,第一代Graviton芯片便是基于Arm架構(gòu)的Neoverse內(nèi)核打造,可以支持2x25G以太網(wǎng)的數(shù)據(jù)包處理。隨后,亞馬遜在2019年推出了Graviton2、2021年推出了Graviton3、2023年推出了Graviton4。
作為最新版本的Graviton芯片,Graviton4采用了最先進的Arm架構(gòu) Neoverse V2 核心,具有更高的計算核心數(shù)量和更快的內(nèi)存帶寬。7月15日,亞馬遜發(fā)布了基于自研芯片Graviton4的Amazon EC2 R8g實例。根據(jù)phoronix測試的結(jié)果,和上一代芯片Graviton3相比,Graviton4性能提升達30%以上,內(nèi)核數(shù)增加50%,內(nèi)存帶寬增加75%。
同時,根據(jù)測試結(jié)果,Graviton4處理器的性能略優(yōu)于英特爾至強處理器約5%,但AMD的EPYC處理器在整體性能上仍領(lǐng)先約25%。有評測報告認為,Graviton4搭載的Neoverse-V2內(nèi)核與英特爾Sapphire Rapids內(nèi)核在性能上旗鼓相當,在某些工作負載下甚至優(yōu)于AMD第四代EPYC。
Graviton4處理器發(fā)布于2023年11月28日,與其同時發(fā)布的還有升級款處理器Trainium2。AWS首席執(zhí)行官Adam Selipsky在re:Invent主題演講中透露,亞馬遜已經(jīng)購買了數(shù)百萬個英偉達的A100和H100產(chǎn)品,在此方面投入了巨大的成本。而業(yè)界人士預測,Trainium2是一顆有望正面和英偉達H100芯片競爭的AI芯片。
Trainium2是多年磨一劍的產(chǎn)品,據(jù)悉在亞馬遜2015年收購Annapurna Labs之后,這個項目就在秘密研發(fā)。根據(jù)亞馬遜方面的數(shù)據(jù),Trainium2相較于上一代產(chǎn)品,訓練速度提升多達4倍,能效提升多達2倍,內(nèi)存容量則達此前3倍,能在EC2 UltraClusters中擴展至多達10萬個芯片,可以在極短的時間內(nèi)訓練基礎(chǔ)模型和大語言模型。目前,該芯片已經(jīng)在接受包括Anthropic、Databricks、Stockmark三家AI創(chuàng)企以及德國電信、日本理光在內(nèi)的多個客戶的測試。
同時,亞馬遜方面表示,Trainium2芯片已在數(shù)據(jù)中心部署,預計將在俄亥俄州等多個核心數(shù)據(jù)中心推廣,目標是形成多達100000個芯片的集群。而這正是亞馬遜秘密計劃——“登月”計劃的一部分。按照規(guī)劃,Trainium2芯片先期主要承擔亞馬遜內(nèi)部的AI訓練項目,并在初創(chuàng)企業(yè)客戶方面得到測試,隨著項目成熟將陸續(xù)有大客戶導入到基于Trainium2芯片的算力平臺上,一旦大客戶有項目使用,亞馬遜Trainium2芯片的任務(wù)便被視為取得成功。
不過,業(yè)內(nèi)人士認為,亞馬遜Trainium2芯片也面臨諸多方面的挑戰(zhàn),其中最顯著的兩大挑戰(zhàn)是自研芯片本身和軟件生態(tài)。在自研芯片方面,由于英偉達在通用計算GPU領(lǐng)域已經(jīng)積累了深厚的研發(fā)經(jīng)驗,單芯片的優(yōu)化已經(jīng)接近了極限,要想實現(xiàn)超越,尤其是在核心指標PPA方面實現(xiàn)超越,可能需要更加前沿的工藝平臺進行芯片實現(xiàn),或者在芯片設(shè)計過程中導入工程設(shè)計的“know how”,但無論怎樣的技術(shù)路徑,背后面臨的挑戰(zhàn)都是巨大的,且可能會由于先期用量低而導致高昂的成本,再加上本就客觀存在的研發(fā)成本,這對公司內(nèi)部推進自研芯片的決心會有挑戰(zhàn)。
在軟件方面的挑戰(zhàn)就更大了,目前全球主要的GPGPU基本是依存于英偉達的CUDA生態(tài)生存,如果不兼容基本很難部署落地,這就導致英偉達在軟硬件結(jié)合方面具有巨大的先發(fā)優(yōu)勢。重新部署軟件生態(tài)當然也是有效的途徑,一旦成功會獲得巨大的商業(yè)回報。但分析人士認為,目前亞馬遜提供的Neural SDK軟件工具尚處于初期階段,無法與英偉達的解決方案相匹敵。
近幾年,亞馬遜一直都在致力于自研芯片以降低數(shù)據(jù)中心成本,根據(jù)云成本管理和優(yōu)化平臺Vantage此前的一項調(diào)查數(shù)據(jù),在Amazon EC2 M7系列通用實例的成本支出方面,采用Amazon Graviton的M7g系列已經(jīng)超過三分之一(34.5%)。
亞馬遜自研芯片第一次亮相始于2016年,在當年的re:Invent大會上,亞馬遜云傳奇工程師James Hamilton展示了該公司第一顆自研芯片,這便是第一代Graviton芯片。和英特爾、AMD的芯片不同,第一代Graviton芯片便是基于Arm架構(gòu)的Neoverse內(nèi)核打造,可以支持2x25G以太網(wǎng)的數(shù)據(jù)包處理。隨后,亞馬遜在2019年推出了Graviton2、2021年推出了Graviton3、2023年推出了Graviton4。
作為最新版本的Graviton芯片,Graviton4采用了最先進的Arm架構(gòu) Neoverse V2 核心,具有更高的計算核心數(shù)量和更快的內(nèi)存帶寬。7月15日,亞馬遜發(fā)布了基于自研芯片Graviton4的Amazon EC2 R8g實例。根據(jù)phoronix測試的結(jié)果,和上一代芯片Graviton3相比,Graviton4性能提升達30%以上,內(nèi)核數(shù)增加50%,內(nèi)存帶寬增加75%。
同時,根據(jù)測試結(jié)果,Graviton4處理器的性能略優(yōu)于英特爾至強處理器約5%,但AMD的EPYC處理器在整體性能上仍領(lǐng)先約25%。有評測報告認為,Graviton4搭載的Neoverse-V2內(nèi)核與英特爾Sapphire Rapids內(nèi)核在性能上旗鼓相當,在某些工作負載下甚至優(yōu)于AMD第四代EPYC。
Graviton4處理器發(fā)布于2023年11月28日,與其同時發(fā)布的還有升級款處理器Trainium2。AWS首席執(zhí)行官Adam Selipsky在re:Invent主題演講中透露,亞馬遜已經(jīng)購買了數(shù)百萬個英偉達的A100和H100產(chǎn)品,在此方面投入了巨大的成本。而業(yè)界人士預測,Trainium2是一顆有望正面和英偉達H100芯片競爭的AI芯片。
Trainium2是多年磨一劍的產(chǎn)品,據(jù)悉在亞馬遜2015年收購Annapurna Labs之后,這個項目就在秘密研發(fā)。根據(jù)亞馬遜方面的數(shù)據(jù),Trainium2相較于上一代產(chǎn)品,訓練速度提升多達4倍,能效提升多達2倍,內(nèi)存容量則達此前3倍,能在EC2 UltraClusters中擴展至多達10萬個芯片,可以在極短的時間內(nèi)訓練基礎(chǔ)模型和大語言模型。目前,該芯片已經(jīng)在接受包括Anthropic、Databricks、Stockmark三家AI創(chuàng)企以及德國電信、日本理光在內(nèi)的多個客戶的測試。
同時,亞馬遜方面表示,Trainium2芯片已在數(shù)據(jù)中心部署,預計將在俄亥俄州等多個核心數(shù)據(jù)中心推廣,目標是形成多達100000個芯片的集群。而這正是亞馬遜秘密計劃——“登月”計劃的一部分。按照規(guī)劃,Trainium2芯片先期主要承擔亞馬遜內(nèi)部的AI訓練項目,并在初創(chuàng)企業(yè)客戶方面得到測試,隨著項目成熟將陸續(xù)有大客戶導入到基于Trainium2芯片的算力平臺上,一旦大客戶有項目使用,亞馬遜Trainium2芯片的任務(wù)便被視為取得成功。
不過,業(yè)內(nèi)人士認為,亞馬遜Trainium2芯片也面臨諸多方面的挑戰(zhàn),其中最顯著的兩大挑戰(zhàn)是自研芯片本身和軟件生態(tài)。在自研芯片方面,由于英偉達在通用計算GPU領(lǐng)域已經(jīng)積累了深厚的研發(fā)經(jīng)驗,單芯片的優(yōu)化已經(jīng)接近了極限,要想實現(xiàn)超越,尤其是在核心指標PPA方面實現(xiàn)超越,可能需要更加前沿的工藝平臺進行芯片實現(xiàn),或者在芯片設(shè)計過程中導入工程設(shè)計的“know how”,但無論怎樣的技術(shù)路徑,背后面臨的挑戰(zhàn)都是巨大的,且可能會由于先期用量低而導致高昂的成本,再加上本就客觀存在的研發(fā)成本,這對公司內(nèi)部推進自研芯片的決心會有挑戰(zhàn)。
在軟件方面的挑戰(zhàn)就更大了,目前全球主要的GPGPU基本是依存于英偉達的CUDA生態(tài)生存,如果不兼容基本很難部署落地,這就導致英偉達在軟硬件結(jié)合方面具有巨大的先發(fā)優(yōu)勢。重新部署軟件生態(tài)當然也是有效的途徑,一旦成功會獲得巨大的商業(yè)回報。但分析人士認為,目前亞馬遜提供的Neural SDK軟件工具尚處于初期階段,無法與英偉達的解決方案相匹敵。
結(jié)語
就像人類登月一樣,亞馬遜Trainium2芯片的野心是巨大的,一旦成功帶來的商業(yè)回報也是非常可觀的。但登月本就兇險萬分,Trainium2芯片離成功替代英偉達H100還有很長很長的路要走。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
亞馬遜
+關(guān)注
關(guān)注
8文章
2692瀏覽量
84492 -
AI芯片
+關(guān)注
關(guān)注
17文章
1973瀏覽量
35739 -
登月
+關(guān)注
關(guān)注
0文章
5瀏覽量
1975
發(fā)布評論請先 登錄
相關(guān)推薦
熱點推薦
又一顆國產(chǎn)GPU芯片成功點亮!6nm制程,自研TrueGPU架構(gòu)
電子發(fā)燒友網(wǎng)綜合報道 近日消息,礪算科技宣布其首顆自研架構(gòu)全自主知識產(chǎn)權(quán)GPU芯片在封裝回片后已成功點亮,結(jié)果符合預期。 ? 礪算科技成立于2021年,是一家致力于研發(fā)高性能GPU的公
發(fā)表于 05-29 00:48
?1738次閱讀
今日看點丨小鵬自研芯片或5月上車;安森美將在重組期間裁員2400人
車型,該車將是搭載自研芯片的首款車型,內(nèi)部代號或為“F57”。 ? 去年8月27日,小鵬汽車召開發(fā)布會,正式發(fā)布了其自研
發(fā)表于 02-26 10:55
?237次閱讀
傳DeepSeek自研芯片,廠商們要把AI成本打下來
電子發(fā)燒友網(wǎng)報道(文/黃晶晶)日前業(yè)界消息稱,DeepSeek正廣泛招募芯片設(shè)計人才,加速自研芯片布局,其芯片應(yīng)用于端側(cè)或云側(cè)尚不明朗。不少

OpenAI自研AI芯片即將面世
OpenAI正加速推進其自主研發(fā)AI芯片的計劃,旨在減少對外部芯片供應(yīng)商,尤其是英偉達的依賴。據(jù)消息人士透露,這家ChatGPT的開發(fā)者預計將在不久的將來完成其首款內(nèi)部人工智能
OpenAI自研AI芯片即將進入試生產(chǎn)階段
據(jù)最新報道,OpenAI正加速推進其減少對英偉達芯片依賴的戰(zhàn)略計劃,并即將迎來重大突破——其首款自研人工智能芯片已完成設(shè)計工作,即將進入試生
蘋果計劃2025年起采用自研藍牙Wi-Fi芯片
近日,據(jù)最新報道,蘋果公司為了減少對博通(Broadcom)的依賴,并進一步提升其設(shè)備的性能和能效,已經(jīng)制定了一項重要的芯片自研計劃。據(jù)悉,從2025年開始,蘋果將正式啟用
亞馬遜轉(zhuǎn)向Trainium芯片,全力投入AI模型訓練
近日,亞馬遜宣布了一項重大決策,決定停止Inferentia AI芯片的開發(fā),轉(zhuǎn)而將全部精力投入到Trainium芯片的研發(fā)上,以此作為與英偉達競爭的新策略。

比亞迪最快于11月實現(xiàn)自研算法量產(chǎn),推進智駕芯片自研進程
10月21日市場傳出消息,比亞迪正計劃整合其新技術(shù)院下的自研智能駕駛團隊,目標是在今年11月實現(xiàn)自
三星或?qū)BM產(chǎn)能目標下調(diào)至每月17萬顆
據(jù)業(yè)內(nèi)人士透露,三星電子已對其2025年底的高帶寬內(nèi)存(HBM)最大產(chǎn)能目標進行了調(diào)整,下調(diào)幅度超過10%,從原先計劃的每月20萬顆減至17
今日看點丨小鵬自研芯片流片!算力是同行三倍;加拿大將對中國電動汽車征收100%關(guān)稅
算力接近3顆主流智駕芯片的水平”。 ? 此外,消息稱,8月27日,小鵬10周年及M03上市活動中,小鵬汽車將正式發(fā)布自研
發(fā)表于 08-27 11:22
?1365次閱讀

亞馬遜云科技啟動"智能家居與智能產(chǎn)品創(chuàng)新加速計劃"
上海2024年7月31日?/美通社/ -- 在"亞馬遜云科技汽車暨制造與消費電子行業(yè)峰會"上,亞馬遜云科技宣布正式啟動"智能家居與智能產(chǎn)品創(chuàng)新加速計劃",該

亞馬遜云科技啟動“智能家居與智能產(chǎn)品創(chuàng)新加速計劃”
上海 ——2024 年 7 月 31 日 在“亞馬遜云科技汽車暨制造與消費電子行業(yè)峰會”上,亞馬遜云科技宣布正式啟動“智能家居與智能產(chǎn)品創(chuàng)新加速計劃”,該
發(fā)表于 07-31 16:56
?2566次閱讀

亞馬遜AWS自研AI芯片崛起,挑戰(zhàn)英偉達
近期,據(jù)路透社獨家報道披露,在德克薩斯州奧斯汀市一處緊密防守的芯片實驗室中,六位來自亞馬遜AWS的工程師正在對一種尚未公開透露名稱及詳細參數(shù)的新型服務(wù)器展開深入測試。這一關(guān)鍵事件引人注目,因為我們
OpenAI自研芯片計劃調(diào)整,傳交臺積電生產(chǎn)
近日,全球領(lǐng)先的生成式AI應(yīng)用大廠OpenAI在自研芯片領(lǐng)域迎來了重大戰(zhàn)略調(diào)整。為降低對外部AI芯片
評論