電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,據(jù)知情人士透露,OpenAI近期已開始租用谷歌的張量處理單元(TPU),為旗下ChatGPT等熱門產(chǎn)品提供算力支持。這一舉措不僅標(biāo)志著OpenAI首次實(shí)質(zhì)性地使用非英偉達(dá)芯片,更顯示出其正在逐步擺脫對(duì)英偉達(dá)芯片的深度依賴,在算力布局上邁出了重要戰(zhàn)略調(diào)整的一步。
OpenAI依賴英偉達(dá)GPU的算力支持
在人工智能飛速發(fā)展的當(dāng)下,OpenAI作為行業(yè)領(lǐng)軍者,對(duì)算力的需求呈現(xiàn)出爆發(fā)式增長(zhǎng)。以O(shè)penAI推出的模型為例,當(dāng)推出參數(shù)規(guī)模達(dá)1750億的GPT - 3模型時(shí),其訓(xùn)練消耗的算力相當(dāng)于30萬顆CPU全年不間斷運(yùn)行。這種指數(shù)級(jí)的算力需求增長(zhǎng),在2024年達(dá)到新高度,谷歌Gemini、百度文心一言4.0等多模態(tài)大模型的訓(xùn)練算力需求較上一代提升5 - 8倍,單個(gè)模型訓(xùn)練成本突破千萬美元大關(guān)。
在此之前,英偉達(dá)的GPU一直是OpenAI開展模型訓(xùn)練以及推理計(jì)算工作的核心依賴。英偉達(dá)GPU憑借其強(qiáng)大的性能,在AI板塊占據(jù)著主導(dǎo)地位,成為眾多科技企業(yè)進(jìn)行AI研發(fā)的首選。OpenAI作為英偉達(dá)GPU的重要大客戶,長(zhǎng)期通過與微軟和甲骨文的合作獲取英偉達(dá)芯片,用于模型訓(xùn)練與部署。
英偉達(dá)數(shù)據(jù)中心級(jí)GPU雖性能卓越,但在高負(fù)荷運(yùn)行場(chǎng)景下也面臨諸多問題。其實(shí)際使用壽命通常為1到3年,高強(qiáng)度工作負(fù)載會(huì)使芯片老化加速,超高功耗壓力也直接縮短了芯片壽命,且故障率隨使用時(shí)間增加而上升。隨著AI技術(shù)的持續(xù)發(fā)展和模型復(fù)雜度的不斷提升,OpenAI對(duì)算力的需求愈發(fā)迫切,同時(shí)也在尋求更具性價(jià)比和可持續(xù)性的算力解決方案。
谷歌AI芯片展現(xiàn)出媲美英偉達(dá)B200芯片的實(shí)力
此次OpenAI租用谷歌TPU,無疑是在算力布局上的一次重大嘗試。谷歌在年度云大會(huì)上正式發(fā)布的第七代TPU——Ironwood,堪稱AI芯片領(lǐng)域的“性能怪獸”。這款專為推理設(shè)計(jì)的AI加速器,是谷歌迄今為止性能最強(qiáng)、可擴(kuò)展性最高的定制AI芯片。與2018年發(fā)布的初代TPU相比,Ironwood的推理性能提升了驚人的3600倍,效率提升了29倍,這一性能飛躍使其足以與英偉達(dá)的B200芯片相媲美,甚至在某些方面略勝一籌。
Ironwood在多個(gè)關(guān)鍵指標(biāo)上表現(xiàn)卓越。功耗效率方面,相比第六代TPU Trillium,實(shí)現(xiàn)了2倍的提升,比初代Cloud TPU高出近30倍,谷歌的液冷解決方案和優(yōu)化的芯片設(shè)計(jì),使其在持續(xù)、繁重的AI工作負(fù)載下,能維持高達(dá)標(biāo)準(zhǔn)風(fēng)冷兩倍的性能。
高帶寬內(nèi)存(HBM)容量上,Ironwood芯片搭載了高達(dá)192GB的顯存,是Trillium的6倍,能夠處理更大的模型和數(shù)據(jù)集,減少頻繁數(shù)據(jù)傳輸?shù)男枨螅M(jìn)而提高性能。HBM帶寬提升到了7.2Tbps,是Trillium的4.5倍,極高的帶寬確保了快速的數(shù)據(jù)訪問,對(duì)現(xiàn)代AI中常見的內(nèi)存密集型工作負(fù)載至關(guān)重要。
芯片間互連(ICI)帶寬增強(qiáng),雙向帶寬已增加到1.2Tbps,是Trillium的1.5倍,這種芯片之間更快的通信,有助于大規(guī)模高效的分布式訓(xùn)練和推理。
對(duì)于谷歌Cloud客戶,Ironwood可根據(jù)AI工作負(fù)載需求提供兩種規(guī)格——256芯片或9216芯片。每個(gè)單獨(dú)的芯片峰值算力達(dá)4614TFLOPs,當(dāng)擴(kuò)展到每個(gè)pod 9216個(gè)芯片時(shí),總計(jì)達(dá)到42.5Exaflop,其算力是世界上最大的超級(jí)計(jì)算機(jī)El Capitan的24倍以上。
總結(jié)
OpenAI租用谷歌AI芯片這一舉措,無論是對(duì)OpenAI自身,還是對(duì)整個(gè)AI芯片市場(chǎng),都具有深遠(yuǎn)意義。對(duì)OpenAI而言,這有助于其擺脫對(duì)單一芯片供應(yīng)商和數(shù)據(jù)中心的高度依賴,在算力布局上獲得更大的靈活性和自主性,降低算力成本,為業(yè)務(wù)的持續(xù)擴(kuò)展提供有力支撐。對(duì)于AI芯片市場(chǎng),谷歌TPU憑借其強(qiáng)大的性能和成本優(yōu)勢(shì),有望打破英偉達(dá)GPU一家獨(dú)大的局面,促進(jìn)市場(chǎng)的多元化競(jìng)爭(zhēng),推動(dòng)AI芯片技術(shù)的不斷創(chuàng)新和發(fā)展。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3935瀏覽量
93421 -
OpenAI
+關(guān)注
關(guān)注
9文章
1205瀏覽量
8782
發(fā)布評(píng)論請(qǐng)先 登錄
OpenAI與博通洽談合作!定制化ASIC芯片走向臺(tái)前,英偉達(dá)GPU迎來“勁敵”?

OpenAI自研AI芯片即將面世
英偉達(dá)Blackwell芯片機(jī)架出現(xiàn)故障 訂單下滑
微軟大手筆采購英偉達(dá)AI芯片

加速拋棄英偉達(dá),微軟又發(fā)布一顆芯片 #微軟 #英偉達(dá) #半導(dǎo)體 #芯片 #電路知識(shí)
英偉達(dá)與谷歌聯(lián)手加速量子計(jì)算設(shè)備設(shè)計(jì)
英偉達(dá)與谷歌攜手加速量子計(jì)算設(shè)備設(shè)計(jì)
英偉達(dá)新一代AI芯片過熱問題引關(guān)注
英偉達(dá)市值飆升,逼近蘋果
蘋果、英偉達(dá)或攜手參投OpenAI新一輪融資
AI芯片巨頭英偉達(dá)漲超4% 英偉達(dá)市值暴增7500億
蘋果AI模型訓(xùn)練新動(dòng)向:攜手谷歌,未選英偉達(dá)

評(píng)論