電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))要說跟上AI時(shí)代的進(jìn)程,RISC-V相對(duì)其他架構(gòu)來說也一點(diǎn)不慢。從各個(gè)初創(chuàng)公司的產(chǎn)品或者路線圖也可以看出,AI計(jì)算是他們最為重視的一環(huán),甚至重要性要超過通用計(jì)算。畢竟這是RISC-V可以后發(fā)制人的一大領(lǐng)域,甚至不會(huì)有太多架構(gòu)設(shè)計(jì)上的歷史桎梏。為此,不少廠商也都從AI出發(fā),設(shè)計(jì)出了定位不一的RISC-V產(chǎn)品。
高性能AI計(jì)算
Esperanto作為為數(shù)不多的幾家沖擊高性能AI計(jì)算的公司,如今也開始察覺到了AI市場的風(fēng)向變動(dòng),于是決定將重心從過去的推薦加速改為大語言模型和HPC。Esperanto走進(jìn)大眾視野的方式相當(dāng)特別,他們的第一款產(chǎn)品就是千核RISC-V芯片ET-SOC-1。
ET-SOC-1基于臺(tái)積電7nm工藝打造,集成了1088個(gè)64位ET-Minion RISC-V核心和4個(gè)ET-Maxion核心,提供了超高的單線程性能。雖說ET-SOC-1對(duì)ML進(jìn)行了優(yōu)化,是一個(gè)理想的推理芯片選擇,但Esperanto為其打造的軟件棧主要還是以推薦場景打造。直到他們近期推出了新的AI軟件開發(fā)工具包,并專門針對(duì)LLM進(jìn)行了優(yōu)化,并展示了運(yùn)行300億參數(shù)的OPT模型。
據(jù)Esperanto表示,目前他們的生成式AI應(yīng)用已經(jīng)可以運(yùn)行最新的LLM和圖片生成模型,比如LLaMA2、Vicuma和Stable Diffusion等等。不過在千變?nèi)f化的AI市場下,單個(gè)模型往往難以維持長時(shí)間的熱度,所以Esperanto的計(jì)劃是持續(xù)跟進(jìn)最流行的開源模型。
IP廠商也不例外,除了SiFive、平頭哥、Tenstorrent等已經(jīng)推出高性能AI IP或?qū)ΜF(xiàn)有產(chǎn)品線進(jìn)行AI升級(jí)的公司外,Semidynamics也發(fā)布了最新完全可定制的矢量單元,用于配合其Atrevido CPU核心。該矢量單元有多個(gè)矢量內(nèi)核構(gòu)成,每個(gè)內(nèi)核都有算數(shù)單元,可以執(zhí)行加減、乘加等數(shù)字與邏輯運(yùn)算。
這個(gè)矢量單元的最大特色在于全定制性,與其他廠商只有部分配置選項(xiàng)不同,為了應(yīng)對(duì)未來各種AI模型的精度要求,Semidynamics的矢量單元在定制化后,可以支持FP64、FP32、FP16、BF16、INT64、INT32、INT16或INT8的數(shù)據(jù)類型。
盡管ASIC、GPU和FPGA常被視為最合適進(jìn)行AI計(jì)算的三大硬件,但在如今的市場環(huán)境下,無論是服務(wù)器還是消費(fèi)終端,CPU也都需要一些可觀的AI計(jì)算特性。所以開源社區(qū)推出了LLaMA.cpp這一模型,該模型是基于Meta的LLaMA模型打造而成,無需PyTorch等庫的外部依賴,僅靠C/C++編譯即可生成執(zhí)行文件,且無需GPU,只靠CPU就可以運(yùn)行。
曠視科技參考并借鑒了LLaMA.cpp項(xiàng)目,推出了InferLLM這一輕量級(jí)的LLM模型推理管家,且除了常見的Arm、x86和CUDA外,他們也針對(duì)RISCV-Vector做了專門的優(yōu)化,目前已經(jīng)可以部署在群芯閃耀科技發(fā)布的Milk-V Pioneer RISC-V主板上,而該主板用到的64位CPU正是算能科技的算豐SG2042。
算豐SG2042采用了單芯片64個(gè)RISC-V內(nèi)核的設(shè)計(jì),支持雙路CPU互聯(lián)、4通道DDR4和32通道PCIe 4.0,典型功耗為120W,可以說是典型的服務(wù)器芯片設(shè)計(jì)。但很明顯,即便是高性能CPU,在一些非重型AI負(fù)載下,也能有可觀的表現(xiàn)。
低功耗的邊緣端
盡管云端的生成式AI已經(jīng)變得越來越普及,企業(yè)在花了大成本購置硬件資源后也能在本地運(yùn)行更多的AI計(jì)算負(fù)載降低效率提高安全性。但對(duì)于消費(fèi)者而言,似乎真正部署在端側(cè)的生成式AI才更加值得關(guān)注,在實(shí)用性上也剛強(qiáng)一些,而且不只是手機(jī)這種使用高端芯片的產(chǎn)品,不少IoT產(chǎn)品也在規(guī)劃著如何接入生成式AI,因此大算力的邊緣AI芯片就成了首選。
云天勵(lì)飛作為國內(nèi)首批闖入AI賽道的廠商,此前一直在主攻AI算法領(lǐng)域,但單靠算法的泛化能力相對(duì)較弱,于是云天勵(lì)飛也就開始加入芯片設(shè)計(jì)賽道,比如2018年推出的DeepEye 1000等。
而在今年舉辦的第三屆滴水湖中國RISC-V論壇上,云天勵(lì)飛展示了去年成功流片,如今已經(jīng)接近量產(chǎn)的邊緣AP級(jí)SoC Deep Edge10V。從芯片結(jié)構(gòu)上看,Edge10V采用了Chiplet設(shè)計(jì),滿足國產(chǎn)Chiplet UCIE標(biāo)準(zhǔn)。CPU部分采用了1.2GHz的雙核C920,還集成了一個(gè)500MHz的NNP400T NPU,算力高達(dá)12TOPS@INT8。在視頻處理能力上,Edge10V也配備了支持H265/H264視頻編解碼的多媒體子系統(tǒng)。
另外值得一提的是,Edge10V僅僅是Edge10系列中的一環(huán),由于Chiplet設(shè)計(jì)支持多die擴(kuò)展,所以也可以在Edge10Max這一產(chǎn)品上實(shí)現(xiàn)高達(dá)64Tops的算力。云天勵(lì)飛芯片BD總監(jiān)張福林表示,Edge10V主要應(yīng)用于邊緣計(jì)算,而Edge10Max則應(yīng)用于邊緣CV大模型,比如Pytorch、Caffe、Tensorflow等框架下的模型。從應(yīng)用上來看,Edge10V的主要應(yīng)用場景還是云天勵(lì)飛擅長的機(jī)器視覺領(lǐng)域,比如機(jī)器人、智能安防之類的邊緣端。
本屆滴水湖論壇上,普林芯馳也展示了他們的智能離線語音交互MCU SPV20系列芯片。該系列的特色在于,除了基于SiFive E21RISC-V核心打造的CPU外,還有基于CEVA TL420核心的DSP與集成普林芯馳自有算法的NPU。該NPU支持CNN、DS-CNN等深度壓縮語音識(shí)別模型,可用于家電的智能語音控制。
嘉楠科技的第二代AI推理芯片,勘智K510,同樣是針對(duì)邊緣側(cè)AI開發(fā)的產(chǎn)品。這一芯片采用了雙核RISC-V 64位CPU,主頻最高達(dá)到800MHz。勘智K510支持INT8和BF16雙數(shù)據(jù)類型,且具備2.5TFLOPS的算力,還支持Tensorflow、Pytorch和ONNX等多種框架的算子庫。
用生成式AI設(shè)計(jì)RISC-V芯片
隨著生成式AI在代碼生成上日益精進(jìn)的表現(xiàn),如今利用生成式AI來設(shè)計(jì)芯片也成了可能。近日,開源硬件平臺(tái)Efabless就舉辦了一屆生成式開源芯片設(shè)計(jì)挑戰(zhàn)賽,其中清華RIOS Lab團(tuán)隊(duì)的RISC-V芯片,CyberRio獲得了亞軍。
據(jù)其Github頁面所示,該芯片的大部分Verilog代碼都是使用GPT-4生成的,從而基于一個(gè)經(jīng)典的5級(jí)流水線設(shè)計(jì)出了CyberRio。CyberRio也在Skywater提供的130nm的工藝平臺(tái)上得到了流片驗(yàn)證,這也意味著全球第一個(gè)由LLM完成主要涉及的CPU被成功制造出來。
不過開放團(tuán)隊(duì)也表示,GPT-4對(duì)硬件語言的理解并不算完整,無論是對(duì)設(shè)計(jì)語言本身的理解,還是對(duì)握手或并行處理等設(shè)計(jì)概念。這很可能是GPT-4訓(xùn)練過程本身的缺陷,不過開發(fā)團(tuán)隊(duì)也提出了Langchain之類的替代方案或許可以解決GPT-4信息缺失造成的問題。
寫在最后
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。
舉報(bào)投訴
-
機(jī)器人
+關(guān)注
關(guān)注
212文章
29421瀏覽量
211292 -
控制
+關(guān)注
關(guān)注
5文章
1021瀏覽量
123489 -
AI
+關(guān)注
關(guān)注
87文章
34000瀏覽量
275027
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
熱點(diǎn)推薦
大象機(jī)器人攜手進(jìn)迭時(shí)空推出 RISC-V 全棧開源六軸機(jī)械臂產(chǎn)品
、lightrack)等模型。倉庫將持續(xù)更新支持最前沿的模型應(yīng)用,滿足各種復(fù)雜 AI任務(wù)。
AI智慧零售套件
通過CPU融合AI的創(chuàng)新設(shè)計(jì),
發(fā)表于 04-25 17:59
關(guān)于RISC-V芯片的應(yīng)用學(xué)習(xí)總結(jié)
、智能網(wǎng)關(guān)等物聯(lián)網(wǎng)設(shè)備。此外,RISC-V的模塊化設(shè)計(jì)使得開發(fā)者可以根據(jù)具體需求靈活剪裁指令集,進(jìn)一步優(yōu)化功耗和性能。
在嵌入式系統(tǒng)方面,RISC-V芯片同樣表現(xiàn)出色。嵌入
發(fā)表于 01-29 08:38
新的一年 RISC-V前景如何呢?
1 月 7 日消息,RISC-V 領(lǐng)軍企業(yè) SiFive 成立中國分公司,中文名稱定為“芯伍科技”。
1 月 14 日消息,專注傳統(tǒng)與 AI 業(yè)務(wù),Imagination 放棄 RISC-V CPU 開發(fā)。
新的
發(fā)表于 01-24 16:19
如何使用 RISC-V 進(jìn)行嵌入式開發(fā)
RISC-V是一種開源的指令集架構(gòu)(ISA),它允許任何人設(shè)計(jì)、制造和銷售基于RISC-V的處理器,這為嵌入式開發(fā)提供了極大的靈活性和創(chuàng)新空間。以下是使用
Rivos全新產(chǎn)品采用Andes晶心科技NX45 RISC-V處理器
專注于加速數(shù)據(jù)分析和生成式AI工作負(fù)載的RISC-V主要會(huì)員公司Rivos與32/64位RISC-V處理器內(nèi)核的領(lǐng)先供貨商、
關(guān)于RISC-V學(xué)習(xí)路線圖推薦
向量指令集、密碼指令集等)進(jìn)行硬件加速和優(yōu)化。
嵌入式系統(tǒng)開發(fā) :
掌握RISC-V在嵌入式系統(tǒng)中的應(yīng)用,如物聯(lián)網(wǎng)設(shè)備、智能家居等。目前AI、大模型
發(fā)表于 11-30 15:21
《RISC-V能否復(fù)制Linux 的成功?》
的產(chǎn)品,Linux成為開源軟件發(fā)展的基石。
這種成功是否可以復(fù)制到開源硬件上呢?RISC-V這樣的指令集架構(gòu)(ISA)是否也可以像Linux內(nèi)核作為開源軟件的基礎(chǔ)一樣,成為開源硬件發(fā)展的基石呢?
這個(gè)
發(fā)表于 11-26 20:20
RISC-V,即將進(jìn)入應(yīng)用的爆發(fā)期
RISC-V是一種開放標(biāo)準(zhǔn)指令集架構(gòu) (ISA),最初由加州大學(xué)伯克利分校的研究人員于2010年開發(fā)。業(yè)界稱,這種開源特性為芯片設(shè)計(jì)者提供了極大的靈活性,可以根據(jù)具體需求定制AI加速器。
而A
發(fā)表于 10-31 16:06
RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫?
RISC-V如何支持不同的AI和機(jī)器學(xué)習(xí)框架和庫?還請(qǐng)壇友們多多指教一下。
發(fā)表于 10-10 22:24
芯原聯(lián)合主辦RISC-V和生成式AI論壇
隨著生成式AI技術(shù)的快速演進(jìn),相關(guān)應(yīng)用已開始向各行業(yè)滲透,AI模型在云側(cè)進(jìn)行訓(xùn)練、端側(cè)進(jìn)行推理和微調(diào)時(shí),產(chǎn)生了巨大的算力需求。
RISC-V最重要的方向是AI,但如何構(gòu)建RISC-V+AI生態(tài)系統(tǒng)?
普遍認(rèn)為RISC-V+AI是未來的大方向。在第四屆滴水湖中國RISC-V產(chǎn)業(yè)論壇上,圓桌論壇環(huán)節(jié)也著重聊到了RISC-V+AI這個(gè)話題。 ? 隨著A
risc-v的發(fā)展歷史
領(lǐng)域中得到廣泛應(yīng)用,包括嵌入式設(shè)備、個(gè)人電腦、服務(wù)器等。
國際合作:RISC-V基金會(huì)將繼續(xù)加強(qiáng)與國際企業(yè)和機(jī)構(gòu)的合作,共同推動(dòng)RISC-V架構(gòu)的發(fā)展和應(yīng)用。
綜上所述,RISC-V的
發(fā)表于 07-29 17:20
RISC-V適合什么樣的應(yīng)用場景
設(shè)計(jì)使得開發(fā)者可以靈活選擇所需的指令集和模塊,以滿足嵌入式系統(tǒng)的各種性能要求。
3. 人工智能(AI)和機(jī)器學(xué)習(xí)(ML)
高性能計(jì)算:RISC-V結(jié)合AI加速器或協(xié)處理器,可以提供高效
發(fā)表于 07-29 17:16
RISC-V在中國的發(fā)展機(jī)遇有哪些場景?
聯(lián)網(wǎng)市場的重要參與者,擁有龐大的用戶基數(shù)和豐富的應(yīng)用場景。RISC-V在中國的發(fā)展將受益于這一市場需求的增長。
2. 人工智能(AI)
AI算力需求:隨著人工智能技術(shù)的廣泛應(yīng)用,對(duì)算力
發(fā)表于 07-29 17:14
芯原股份RISC-V和生成式AI論壇成功舉辦
海世博中心舉辦。此次論壇邀請(qǐng)了烏鎮(zhèn)智庫、RISC-V國際基金會(huì)、Tenstorrent、MIPS、知合計(jì)算、芯來科技和華東政法大學(xué)等國內(nèi)外產(chǎn)學(xué)研界的專家,與芯原一同深入探討RISC-V與生成
評(píng)論