有声小说在线收听网,小说阅读网站,辰东全部小说

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）隨著LLM在內(nèi)的AI模型從規(guī)模和計(jì)算復(fù)雜性上成倍增加，與數(shù)年前相比，訓(xùn)練優(yōu)秀AI模型的成本已經(jīng)上升到了一個(gè)新的高度。從最近不斷溢價(jià)、缺貨搶貨的GPU市場(chǎng)也可以看出，硬件成本已經(jīng)成了AI發(fā)展的最大瓶頸。

為了訓(xùn)練高質(zhì)量的AI模型，堆硬件數(shù)量幾乎是避無(wú)可避的。為此，越來越多的AI芯片廠商看到了這個(gè)缺口，力求以自己的高性能硬件產(chǎn)品來填補(bǔ)競(jìng)品造成的缺口。甚至不少此前專注在低功耗/邊緣AI計(jì)算的半導(dǎo)體公司，也計(jì)劃沖擊著更高的算力。

Leapmind

Leapmind是一家來自日本的邊緣AI公司，其主要產(chǎn)品為超低功耗的AI推理加速器IP，Efficiera。Efficiera專門針對(duì)FPGA和ASIC/ASSP設(shè)備上的CNN推理計(jì)算進(jìn)行了優(yōu)化，僅需極小的面積和功耗就能實(shí)現(xiàn)優(yōu)異的算力，所以很適合集成在邊緣設(shè)備中。

雖然主打超低功耗，但Efficiera的性能表現(xiàn)卻一點(diǎn)都不差，根據(jù)Leapmind的綜合測(cè)試，在7nm工藝和533MHz的主頻下，Efficiera可以實(shí)現(xiàn)107.8TOPS/W的能效表現(xiàn)。加上Efficiera對(duì)CNN的優(yōu)化，使其非常適合用于圖像識(shí)別類的應(yīng)用，比如AR/VR、智能相機(jī)等。據(jù)Leapmind透露，他們已經(jīng)在臺(tái)積電28nm和12nm上用此IP完成了數(shù)個(gè)SoC開發(fā)項(xiàng)目。

不過，Leapmind的野心并沒有止步于此，他們同樣看中了LLM大模型市場(chǎng)，計(jì)劃開發(fā)一款新的AI芯片來解決性能瓶頸問題。Leapmind指出，新的AI芯片將專注于AI模型訓(xùn)練和推理，目標(biāo)性能是2PFLOPS，且旨在實(shí)現(xiàn)與同等性能GPU 10倍差距的性價(jià)比。

這一AI芯片的特點(diǎn)包括，與Efficiera一樣，強(qiáng)調(diào)低精度計(jì)算下的性能表現(xiàn)，比如FP8等，從而減少所需的晶體管數(shù)量，也減少DRAM的帶寬壓力。同時(shí)Leapmind也會(huì)開源相關(guān)的驅(qū)動(dòng)程序和編譯器，畢竟開發(fā)AI模型所需的軟件棧絕對(duì)不是Leapmind這個(gè)體量的公司能解決的問題。

Mythic

數(shù)字AI芯片的競(jìng)爭(zhēng)或許異常激烈，但模擬AI芯片卻是Mythic的主戰(zhàn)場(chǎng)。他們打造的模擬矩陣處理器M1076芯片，可以實(shí)現(xiàn)單芯片25TOPS的性能，標(biāo)準(zhǔn)功耗卻只有3W到4W左右。

其模擬存內(nèi)計(jì)算架構(gòu)利用高密度的模擬內(nèi)存來片上存儲(chǔ)神經(jīng)網(wǎng)絡(luò)，而不是像數(shù)據(jù)芯片一樣需要片外數(shù)據(jù)交換，這種架構(gòu)為其提供了遠(yuǎn)低于數(shù)字芯片的功耗和延遲，為此更適合用于圖像傳感類的應(yīng)用，比如物體識(shí)別等。

不過M1076的推出似乎并沒有給這家公司帶來足夠的客戶和利潤(rùn)，哪怕他們甚至打入了洛克希德馬丁的供應(yīng)鏈。從去年底開始，就有報(bào)道稱Mythic已經(jīng)耗盡資金，無(wú)力進(jìn)行下一代模擬存內(nèi)計(jì)算架構(gòu)的研發(fā)。直到今年3月，現(xiàn)有投資者和Catapult Ventures等新投資者為其再度注入了1300萬(wàn)美元的資金，才將其從危機(jī)中挽救回來。

獲得新一輪融資后的Mythic的目標(biāo)仍是做邊緣端的AI計(jì)算，但他們已經(jīng)準(zhǔn)備好對(duì)標(biāo)桌面級(jí)GPU的算力表現(xiàn)了，為AR頭顯等算力需求持續(xù)拔高的機(jī)器視覺應(yīng)用提供硬件支持。Mythic表示，新的M2000將進(jìn)一步降低大小、功耗和成本，同時(shí)具備部署高性能機(jī)器視覺的能力，進(jìn)一步擴(kuò)大應(yīng)用領(lǐng)域。

寫在最后

其實(shí)對(duì)于多數(shù)AI初創(chuàng)芯片公司來說，雖然競(jìng)爭(zhēng)對(duì)手?jǐn)?shù)量龐大，但低功耗AI芯片仍是一個(gè)相對(duì)更容易入局的市場(chǎng)。反倒是到了與GPU拼性能的時(shí)候，他們的競(jìng)爭(zhēng)對(duì)手往往變成了GPU大廠或云服務(wù)廠商，所以必須得具備獨(dú)一無(wú)二的特性和足夠高的性價(jià)比，才能吸引到客戶以及投資。但這也恰好證明了多數(shù)AI芯片的擴(kuò)展性，同樣的架構(gòu)在邊緣AI芯片上實(shí)現(xiàn)后，也能廣泛用于更大規(guī)模的高性能AI芯片上，但他們的差異化戰(zhàn)略能否一并成功延續(xù)過來，仍需要接受局面完全不同的市場(chǎng)考驗(yàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

gpu

gpu

+關(guān)注

關(guān)注
28

文章
4916

瀏覽量
130740
AI

AI

+關(guān)注

關(guān)注
88

文章
34421

瀏覽量
275771
低功耗

低功耗

+關(guān)注

關(guān)注
10

文章
2748

瀏覽量
104592

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

與GPU能效齊平，低功耗AI公司的轉(zhuǎn)型

評(píng)論