電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))隨著LLM在內(nèi)的AI模型從規(guī)模和計(jì)算復(fù)雜性上成倍增加,與數(shù)年前相比,訓(xùn)練優(yōu)秀AI模型的成本已經(jīng)上升到了一個(gè)新的高度。從最近不斷溢價(jià)、缺貨搶貨的GPU市場(chǎng)也可以看出,硬件成本已經(jīng)成了AI發(fā)展的最大瓶頸。
為了訓(xùn)練高質(zhì)量的AI模型,堆硬件數(shù)量幾乎是避無(wú)可避的。為此,越來越多的AI芯片廠商看到了這個(gè)缺口,力求以自己的高性能硬件產(chǎn)品來填補(bǔ)競(jìng)品造成的缺口。甚至不少此前專注在低功耗/邊緣AI計(jì)算的半導(dǎo)體公司,也計(jì)劃沖擊著更高的算力。
Leapmind
Leapmind是一家來自日本的邊緣AI公司,其主要產(chǎn)品為超低功耗的AI推理加速器IP,Efficiera。Efficiera專門針對(duì)FPGA和ASIC/ASSP設(shè)備上的CNN推理計(jì)算進(jìn)行了優(yōu)化,僅需極小的面積和功耗就能實(shí)現(xiàn)優(yōu)異的算力,所以很適合集成在邊緣設(shè)備中。
雖然主打超低功耗,但Efficiera的性能表現(xiàn)卻一點(diǎn)都不差,根據(jù)Leapmind的綜合測(cè)試,在7nm工藝和533MHz的主頻下,Efficiera可以實(shí)現(xiàn)107.8TOPS/W的能效表現(xiàn)。加上Efficiera對(duì)CNN的優(yōu)化,使其非常適合用于圖像識(shí)別類的應(yīng)用,比如AR/VR、智能相機(jī)等。據(jù)Leapmind透露,他們已經(jīng)在臺(tái)積電28nm和12nm上用此IP完成了數(shù)個(gè)SoC開發(fā)項(xiàng)目。
不過,Leapmind的野心并沒有止步于此,他們同樣看中了LLM大模型市場(chǎng),計(jì)劃開發(fā)一款新的AI芯片來解決性能瓶頸問題。Leapmind指出,新的AI芯片將專注于AI模型訓(xùn)練和推理,目標(biāo)性能是2PFLOPS,且旨在實(shí)現(xiàn)與同等性能GPU 10倍差距的性價(jià)比。
這一AI芯片的特點(diǎn)包括,與Efficiera一樣,強(qiáng)調(diào)低精度計(jì)算下的性能表現(xiàn),比如FP8等,從而減少所需的晶體管數(shù)量,也減少DRAM的帶寬壓力。同時(shí)Leapmind也會(huì)開源相關(guān)的驅(qū)動(dòng)程序和編譯器,畢竟開發(fā)AI模型所需的軟件棧絕對(duì)不是Leapmind這個(gè)體量的公司能解決的問題。
Mythic
數(shù)字AI芯片的競(jìng)爭(zhēng)或許異常激烈,但模擬AI芯片卻是Mythic的主戰(zhàn)場(chǎng)。他們打造的模擬矩陣處理器M1076芯片,可以實(shí)現(xiàn)單芯片25TOPS的性能,標(biāo)準(zhǔn)功耗卻只有3W到4W左右。
其模擬存內(nèi)計(jì)算架構(gòu)利用高密度的模擬內(nèi)存來片上存儲(chǔ)神經(jīng)網(wǎng)絡(luò),而不是像數(shù)據(jù)芯片一樣需要片外數(shù)據(jù)交換,這種架構(gòu)為其提供了遠(yuǎn)低于數(shù)字芯片的功耗和延遲,為此更適合用于圖像傳感類的應(yīng)用,比如物體識(shí)別等。
不過M1076的推出似乎并沒有給這家公司帶來足夠的客戶和利潤(rùn),哪怕他們甚至打入了洛克希德馬丁的供應(yīng)鏈。從去年底開始,就有報(bào)道稱Mythic已經(jīng)耗盡資金,無(wú)力進(jìn)行下一代模擬存內(nèi)計(jì)算架構(gòu)的研發(fā)。直到今年3月,現(xiàn)有投資者和Catapult Ventures等新投資者為其再度注入了1300萬(wàn)美元的資金,才將其從危機(jī)中挽救回來。
獲得新一輪融資后的Mythic的目標(biāo)仍是做邊緣端的AI計(jì)算,但他們已經(jīng)準(zhǔn)備好對(duì)標(biāo)桌面級(jí)GPU的算力表現(xiàn)了,為AR頭顯等算力需求持續(xù)拔高的機(jī)器視覺應(yīng)用提供硬件支持。Mythic表示,新的M2000將進(jìn)一步降低大小、功耗和成本,同時(shí)具備部署高性能機(jī)器視覺的能力,進(jìn)一步擴(kuò)大應(yīng)用領(lǐng)域。
寫在最后
其實(shí)對(duì)于多數(shù)AI初創(chuàng)芯片公司來說,雖然競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)量龐大,但低功耗AI芯片仍是一個(gè)相對(duì)更容易入局的市場(chǎng)。反倒是到了與GPU拼性能的時(shí)候,他們的競(jìng)爭(zhēng)對(duì)手往往變成了GPU大廠或云服務(wù)廠商,所以必須得具備獨(dú)一無(wú)二的特性和足夠高的性價(jià)比,才能吸引到客戶以及投資。但這也恰好證明了多數(shù)AI芯片的擴(kuò)展性,同樣的架構(gòu)在邊緣AI芯片上實(shí)現(xiàn)后,也能廣泛用于更大規(guī)模的高性能AI芯片上,但他們的差異化戰(zhàn)略能否一并成功延續(xù)過來,仍需要接受局面完全不同的市場(chǎng)考驗(yàn)。
-
gpu
+關(guān)注
關(guān)注
28文章
4916瀏覽量
130740 -
AI
+關(guān)注
關(guān)注
88文章
34421瀏覽量
275771 -
低功耗
+關(guān)注
關(guān)注
10文章
2748瀏覽量
104592
發(fā)布評(píng)論請(qǐng)先 登錄
超低功耗Wi-Fi 6模塊物聯(lián)網(wǎng):NRF7002
交流充電樁負(fù)載能效提升技術(shù)
能效比達(dá)2TOPS/W!解密邊緣AI芯片低功耗設(shè)計(jì)之法
正點(diǎn)原子Linux最小系統(tǒng)板RK3506B資料發(fā)布!超低功耗,滿載功耗低發(fā)熱小,實(shí)現(xiàn)性能與能效雙突破!
高密度、低功耗,關(guān)聯(lián)AI與云計(jì)算

Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......
AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
低功耗處理器的優(yōu)勢(shì)分析
大聯(lián)大控股世平推出基于瑞芯微RV1106的低功耗AOV IPC方案
訓(xùn)練AI大模型需要什么樣的gpu
新思科技Foundation IP:AI芯片低功耗設(shè)計(jì)必選項(xiàng)

低功耗SOC芯片的優(yōu)勢(shì)
天璣9400 GPU拿下能效霸主,實(shí)測(cè)直線滿幀冰涼手感

評(píng)論