最近,隨著人工智能的大肆宣傳,我們注意到大多數(shù)人都默認(rèn)所有人工智能工作負(fù)載將始終在 GPU 上運行。對于這一思路,我們認(rèn)為,隨著更廣泛的芯片發(fā)揮作用,現(xiàn)實情況可能會有所不同。
需要明確的是,GPU 非常適合人工智能工作,并且不會對 Nvidia 的股價構(gòu)成威脅。我們所說的人工智能實際上是應(yīng)用統(tǒng)計學(xué),更具體地說是非常先進(jìn)的統(tǒng)計回歸模型。
這些問題的核心是矩陣代數(shù),涉及相當(dāng)簡單的數(shù)學(xué)問題,例如一個數(shù)字乘以另一個數(shù)字,但需要大規(guī)模完成。GPU 的設(shè)計采用較小的內(nèi)核(更簡單的數(shù)學(xué)),且數(shù)量較多(大規(guī)模)。因此,使用這些處理器代替具有較少數(shù)量較大內(nèi)核的 CPU 是有意義的。
現(xiàn)在,這種情況變得有點模糊了。其一,GPU 變得更加昂貴。他們更擅長人工智能數(shù)學(xué),但在某些時候轉(zhuǎn)向 CPU 開始在經(jīng)濟(jì)上變得有意義。
人工智能半導(dǎo)體市場實際上分為三個部分:訓(xùn)練、云推理和邊緣推理。目前的訓(xùn)練基本上與 Nvidia 相當(dāng),但這只是市場的一小部分。云推理將是一個更大的市場——隨著越來越多的人使用這些人工智能模型,對推理的需求將會增長,目前大部分工作將在云中完成。對于許多公司來說,擴(kuò)大產(chǎn)能的成本似乎非常昂貴。半導(dǎo)體分析師迪倫·帕特爾(Dylan Patel)像往常一樣,對這個數(shù)學(xué)進(jìn)行了最好的闡述,但足以說明推理費用可能會成為未來一年左右消費者采用人工智能的主要障礙。
“考慮到 GPU 的成本和相對稀缺性,我們認(rèn)為許多公司將開始探索 GPU 的替代品來運行推理工作負(fù)載,特別是對于將這些 AI 結(jié)果與其他功能(如搜索或社交媒體)相結(jié)合的公司,這些工作負(fù)載在很大程度上仍然運行得最好無論如何,在CPU上。”Dylan Patel說。
展望未來,我們懷疑人工智能的經(jīng)濟(jì)學(xué)將需要更多的推理工作來進(jìn)行邊緣計算,這意味著消費者需要付費購買設(shè)備。這意味著手機(jī)和 PC 將需要人工智能功能,這可能意味著它們在 CPU 和移動 SoC 上運行。
AMD 最近推出了內(nèi)置于其客戶端 CPU 中的人工智能功能,而蘋果公司的 A 系列移動處理器和 M 系列 CPU 中都配備了神經(jīng)引擎。我們預(yù)計這很快就會在邊緣設(shè)備中普及。
當(dāng)然,許多公司正在尋求構(gòu)建人工智能加速器——專門用于進(jìn)行人工智能數(shù)學(xué)計算的專用芯片。但事實證明,這僅適用于像谷歌這樣控制其所有軟件的公司。這些專用芯片的一個重要問題是,它們往往針對一組特定的工作負(fù)載或人工智能模型進(jìn)行過度設(shè)計,當(dāng)這些模型發(fā)生變化時,這些芯片就會失去性能優(yōu)勢。
所有這些都導(dǎo)致了半導(dǎo)體領(lǐng)域最不為人知的領(lǐng)域之一——FPGA。這些是“可編程”芯片(“P”代表可編程),這意味著它們在生產(chǎn)后可以重新用于不同的任務(wù)。這些與專門構(gòu)建的 ASIC 處于相反的一端,專為 AI 加速器等特定任務(wù)而設(shè)計。
FPGA 已經(jīng)存在多年了。半導(dǎo)體的經(jīng)濟(jì)學(xué)通常意味著,超過一定的容量閾值,ASIC 更有意義,但對于工業(yè)和航空航天系統(tǒng)等小容量應(yīng)用,它們的工作效果非常好。因此,F(xiàn)PGA 無處不在,涉及數(shù)十個終端市場,但我們對它們不太熟悉,因為它們通常不會出現(xiàn)在普通消費者每天使用的大批量電子產(chǎn)品中。
人工智能的出現(xiàn)稍微改變了這種計算方式。對于這些工作負(fù)載,F(xiàn)PGA 可能對底層模型頻繁變化的人工智能推理需求有意義。在這里,F(xiàn)PGA 的可編程性超過了 FPGA 使用的典型經(jīng)濟(jì)性。需要明確的是,我們認(rèn)為 FPGA 不會成為使用數(shù)千個 GPU 的大規(guī)模人工智能系統(tǒng)的有力競爭對手,但我們確實認(rèn)為,隨著人工智能進(jìn)一步滲透到電子領(lǐng)域,F(xiàn)PGA 的應(yīng)用范圍將會擴(kuò)大。
簡而言之,GPU 可能仍然是大部分人工智能領(lǐng)域的主導(dǎo)芯片,尤其是對于高調(diào)、大容量的模型。但除此之外,我們認(rèn)為替代芯片的使用將成為生態(tài)系統(tǒng)的重要組成部分,這是一個比今天看起來更大的機(jī)會。
-
gpu
+關(guān)注
關(guān)注
28文章
4760瀏覽量
129135 -
人工智能
+關(guān)注
關(guān)注
1792文章
47508瀏覽量
239224 -
AI芯片
+關(guān)注
關(guān)注
17文章
1899瀏覽量
35126
原文標(biāo)題:AI芯片,就是GPU嗎?
文章出處:【微信號:晶揚(yáng)電子,微信公眾號:晶揚(yáng)電子】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
ASIC和GPU的原理和優(yōu)勢

GPU是如何訓(xùn)練AI大模型的
《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第3篇閱讀心得:GPU革命:從圖形引擎到AI加速器的蛻變
GPU服務(wù)器AI網(wǎng)絡(luò)架構(gòu)設(shè)計

為什么ai模型訓(xùn)練要用gpu
【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗】--全書概覽
名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析
AI初出企業(yè)Cerebras已申請IPO!稱發(fā)布的AI芯片比GPU更適合大模型訓(xùn)練


為什么GPU對AI如此重要?

為什么跑AI往往用GPU而不是CPU?

AI訓(xùn)練,為什么需要GPU?

評論