盗墓笔记有声小说,辰东,魔天记忘语小说

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布首款針對人工智能應(yīng)用的專用處理器產(chǎn)品線Nuclei Intelligence(NI)系列，以及NI系列的第一款AI專用RISC-V處理器CPU IP——NI900系列內(nèi)核。

隨著Chatgpt的橫空出世，全球掀起一股AI的浪潮，從云端數(shù)據(jù)中心到邊緣側(cè)對AI的需求進一步提升。AI應(yīng)用主要分布在訓練和推理，需要大量的并行計算和NPU來完成，更離不開高性能CPU的算力加持。CPU有著廣泛的普及性、兼容性、可擴展性和可靠性，并通過多核多節(jié)點進行串行計算、混合計算和安全防護等復(fù)雜任務(wù)；除此之外，CPU的通用矢量(Vector)指令集也可以提供強大且通用的并行計算能力，在AI領(lǐng)域進行高效的并行計算、前處理、后處理、激活函數(shù)等工作，更加靈活地處理GPU和NPU相對難以處理的復(fù)雜計算任務(wù)。

近期OpenAI發(fā)布的Sora模型將AI能夠理解和生成的內(nèi)容模態(tài)從文字和圖片拓展到視頻，進一步證明基礎(chǔ)模型能力上限不斷被突破，想象空間被打開，對算力基礎(chǔ)設(shè)施的需求也遠沒有停止。芯來科技此次推出的NI900重點布局AI應(yīng)用場景，助力本土芯片設(shè)計公司快速完成AI產(chǎn)品的設(shè)計。

NI900基于900系列處理器，針對“AI應(yīng)用”進行了多項特性優(yōu)化

基礎(chǔ)標量處理器：

可以配置為900系列的RV32或RV64的任何一款N900、U900、NX900、UX900。

RVV1.0 VPU：可配置基于RISC-V V Extension（RVV1.0 Vector指令集）的VPU單元，VPU的VLEN可配置為512-bit或者1024-bit。在INT8數(shù)據(jù)類型下對性能帶來的提升達數(shù)百倍；在INT32與FP32數(shù)據(jù)類型下對性能帶來的提升達數(shù)十倍。 NPU加速器：

可通過NI900的IOCP（IO Coherent Port）與處理器緊耦合，實現(xiàn)對CPU內(nèi)部Cache的一致性。

用戶自定義指令擴展接口：用戶可以使用Nuclei的NICE硬件擴展接口，增加自己自定義的指令，包括Scalar或Vector指令。

NI900支持RISC-VVector1.0標準

矢量擴展被稱之為RV指令集標準最重要的一組擴展，2015年發(fā)起，2021年正式生成標準。

RVV 1.0支持的數(shù)據(jù)類型廣泛，運算類型豐富且可動態(tài)擴展，同一套指令可無修改適配各種微架構(gòu)實現(xiàn)。

RISC-V GCC從10.2版本已經(jīng)支持RVV1.0指令，目前GCC13對應(yīng)的intrinsic API接口已經(jīng)升級到最新v0.12版本，且已部分支持自動向量化；預(yù)計GCC14正式發(fā)布，GCC的自動向量化會更加完備。RISC-V CLANG17版本也已支持最新v0.12版本intrinsic APl, 支持自動向量化。

RISC-V Linux 5.18 版本開始支持RVV,其它各種計算庫及應(yīng)用中間件都快速支持了RVV1.0。

有了RVV1.0標準和軟件生態(tài)的完備，為應(yīng)對AI算力的需求，需要RISC-V CPU 在微架構(gòu)設(shè)計上做更多有針對性的設(shè)計。

NI900擁有強大的并行計算能力

RVV參數(shù)描述：

VLEN：一個向量寄存器的總bit數(shù)（寬度）

DLEN：內(nèi)部運算單元能夠并行處理的一個向量元素的最大bit數(shù)

ELEN：并行處理的數(shù)據(jù)類型的最大寬度，如果ELEN=32，則最大的處理數(shù)據(jù)類型是INT32和FP32

可配選項	參數(shù)值
VLEN_512	VLEN=512,DLEN=512，ELEN=32/64
VLEN_1024	VLEN=1024,DLEN=1024，ELEN=32/64

VPU支持的數(shù)據(jù)類型和計算能力：

1024-bit的VPU支持多種數(shù)據(jù)類型的計算，包括：INT8 / 16 / 32 / 64, BFP16 / FP16 / FP32 / FP64。

1024-bit的VPU支持每個時鐘完成128x8-bit / 64x16-bit / 32x32-bit / 16x64-bit的數(shù)據(jù)計算

NI900擁有強大的Memory讀寫能力

?

VPU和CoreLSU共享MMU資源

VPU并非獨立的協(xié)處理器，而是與主Core的內(nèi)存空間實現(xiàn)完全的Coherent

Vector指令與普通Scalar一樣，支持虛擬地址訪問，使得NI900的Vector指令可以無縫運行于大型操作系統(tǒng)之上

VPU和CoreLSU共享Memory資源與通道

VPU擁有最高512-bit位寬直接訪問DC ache

VPU擁有最高1024-bit位寬直接訪問DLM

DLM具備1024-bit的SlavePort供SoC訪問

可單獨配置VLMport以進一步增加性能

VLMport可以直接連接到外部加速器或者內(nèi)存

VLMport位寬=VLEN(目前支持最多1024-bit)

ScalarCore也可以通過LoadStore訪問到VLM區(qū)間

NI900的VPU帶來極大的性能提升

通過強大的運算能力與強勁的Memory讀寫通道，NI900能帶來極大的并行計算性能提升。

如圖所示，VLEN=1024-bit的VPU在INT8數(shù)據(jù)類型下對性能帶來的提升達數(shù)百倍：

如圖所示，VLEN=1024-bit的VPU在INT32數(shù)據(jù)類型下對性能帶來的提升達數(shù)十倍：

如圖所示，VLEN=512-bit的VPU在FP32數(shù)據(jù)類型下對性能帶來的提升達數(shù)十倍：

NI900支持NPU等AI加速器與處理器緊耦合，實現(xiàn)對CPU內(nèi)部Cache的一致性

NI900支持整合外部AI加速器、NPU、PCIe、DMA，通過900系列的IOCP（IO Coherent Port）與900系列處理器緊耦合，實現(xiàn)對CPU內(nèi)部Cache的一致性。

NI900的Scalar/VectorNICE自定義指令接口提供更多特定場景的優(yōu)化可能性 NICE(Nuclei Instruction Co-unit Extension)是芯來CPU IP的一種用戶可擴展指令接口機制，允許用戶基于芯片的標準通用CPU內(nèi)核定義自己的擴展指令集。

NI900提供用于Scalar指令擴展的NICE接口，可支持單周期，多周期，流水線等不同指令類型

NI900提供用于Vector指令擴展的NICE接口，可支持單周期，多周期，流水線等不同指令類型

NI900的NICE擴展單元不僅可以進行運算型的自定義指令擴展，還可以通過專用總線訪問Core的存儲資源（DCache等）實現(xiàn)與主Core的內(nèi)存一致性，總線位寬可以達到VLEN(最高1024-bit)

用戶可以結(jié)合自己的應(yīng)用擴展自定義指令，將NI900處理器內(nèi)核擴展成為面向AI領(lǐng)域進一步強化的專用處理器。

RISC-V生態(tài)日益成熟，芯來NI900賦能AI時代

CPU是算力結(jié)構(gòu)中必不可少的一個環(huán)節(jié)，在已經(jīng)到來的人工智能算力時代，通用和專用芯片結(jié)合而成的異構(gòu)計算是未來AI算力基礎(chǔ)設(shè)施的主流。芯來致力于提供標量、矢量、以及自定義指令結(jié)合的計算架構(gòu)，以滿足端側(cè)云側(cè)數(shù)據(jù)中心的多元化的算力需求。

目前NI900已經(jīng)獲得多家下游客戶的認可并投入產(chǎn)品設(shè)計中，未來芯來將推出更多NI系列處理器內(nèi)核IP，賦能AI時代的算力基礎(chǔ)設(shè)施建設(shè)。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

處理器

處理器

+關(guān)注

關(guān)注
68

文章
19436

瀏覽量
231314
人工智能

人工智能

+關(guān)注

關(guān)注
1796

文章
47789

瀏覽量
240547
RISC-V

RISC-V

+關(guān)注

關(guān)注
45

文章
2328

瀏覽量
46672
AI加速器

AI加速器

+關(guān)注

關(guān)注
1

文章
69

瀏覽量
8678
芯來科技

芯來科技

+關(guān)注

關(guān)注
0

文章
62

瀏覽量
3093

原文標題：芯來科技發(fā)布最新NI系列內(nèi)核，NI900矢量寬度可達512/1024位

文章出處：【微信號：nucleisys，微信公眾號：芯來科技】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

兆芯開先KX-7000處理器賦能升騰D410 2桌面終端產(chǎn)品

基于開先KX-7000系列處理器，升騰可謂是“多路出擊”，在推出P410 2桌面終端、W410 2桌面一體機兩款新品的同時，針對云終端產(chǎn)品線也快速響應(yīng)，帶來了全新升級的D410 2桌面

發(fā)表于 01-21 16:28 ?287次閱讀

恩智浦i.MX 94應(yīng)用處理器如何變革工業(yè)和汽車連接

恩智浦半導(dǎo)體發(fā)布i.MX 94系列應(yīng)用處理器，為工業(yè)和汽車連接設(shè)定了新的標準。作為i.MX 9系列應(yīng)用處理器的最新成員，i.MX 94旨在提

發(fā)表于 01-17 10:51 ?285次閱讀

恩智浦發(fā)布i.MX 94系列應(yīng)用處理器

恩智浦半導(dǎo)體發(fā)布i.MX 9系列應(yīng)用處理器的新成員i.MX 94系列。該系列旨在用于工業(yè)控制、可編程邏輯控制

發(fā)表于 11-26 17:48 ?823次閱讀

極海電機產(chǎn)品線再添新品，APM32M3514系列電機控制專用SoC正式發(fā)布!

極海首款高集成、高性價比、高能效的電機控制專用SoC——APM32M3514系列，現(xiàn)已正式推出，為客戶電機系統(tǒng)應(yīng)用設(shè)計提供高性價比的系統(tǒng)集成，更豐富的

發(fā)表于 10-09 11:09 ?1141次閱讀

極海電機<b class='flag-5'>產(chǎn)品線</b>再添新品，APM32M3514<b class='flag-5'>系列</b>電機控制<b class='flag-5'>專用</b>SoC正式<b class='flag-5'>發(fā)布</b>!

OMAP5912應(yīng)用處理器數(shù)據(jù)表

電子發(fā)燒友網(wǎng)站提供《OMAP5912應(yīng)用處理器數(shù)據(jù)表.pdf》資料免費下載

發(fā)表于 08-07 09:16 ?0次下載

OMAP5912應(yīng)<b class='flag-5'>用處理器</b>數(shù)據(jù)表

格見發(fā)布基于芯來N300系列處理器內(nèi)核的通用型實時工業(yè)控制DSP產(chǎn)品

。GS32F003X系列內(nèi)置的RISC-V內(nèi)核基于芯來科技N300系列RISC-V處理器內(nèi)核深度定制，支持500+條RV32基礎(chǔ)/擴展指令和

發(fā)表于 08-06 15:56 ?1224次閱讀

格見<b class='flag-5'>發(fā)布</b>基于<b class='flag-5'>芯</b><b class='flag-5'>來</b>N300<b class='flag-5'>系列</b><b class='flag-5'>處理器</b>內(nèi)核的通用型實時工業(yè)控制DSP<b class='flag-5'>產(chǎn)品</b>

6nm異構(gòu)多核！國內(nèi)首款Arm架構(gòu)AI PC處理器此芯P1發(fā)布

計算平臺因此得到了廣泛的關(guān)注?，F(xiàn)在，國內(nèi)公司也完成了Arm架構(gòu)AI PC處理器“破冰”，開始揚帆啟航。 ? 7月30日，在以“從此芯出發(fā)”為主題的此芯科技AI PC戰(zhàn)略暨首

發(fā)表于 08-01 01:21 ?4308次閱讀

6nm異構(gòu)多核！國內(nèi)<b class='flag-5'>首</b><b class='flag-5'>款</b>Arm架構(gòu)AI PC<b class='flag-5'>處理器</b>此<b class='flag-5'>芯</b>P1<b class='flag-5'>發(fā)布</b>

芯來集成開發(fā)環(huán)境Nuclei Studio 2024.06版本發(fā)布

為了優(yōu)化Nuclei Studio的在性能調(diào)優(yōu)方面的體驗，以及引入商業(yè)工具鏈的支持，以及豐富基于Nuclei CPU/SoC IP的軟件生態(tài)，讓客戶和開發(fā)者能夠圍繞Nuclei IP做出更完善的RISC-V軟硬件一體化解決方案，

發(fā)表于 07-15 16:15 ?894次閱讀

Microchip發(fā)布多核64位微處理器系列產(chǎn)品

。PIC64GX MPU是即將發(fā)布的新產(chǎn)品系列中的首款產(chǎn)品，可支持工業(yè)、汽車、通信、物聯(lián)網(wǎng)、航空航天和國防領(lǐng)域的智能邊緣設(shè)計。

發(fā)表于 07-11 10:31 ?764次閱讀

經(jīng)緯恒潤INTEWORK-EAS產(chǎn)品成功適配芯來RISC-V處理器NA內(nèi)核

近日，經(jīng)緯恒潤AUTOSAR基礎(chǔ)軟件產(chǎn)品INTEWORK-EAS（ECU AUTOSAR Software，以下簡稱EAS）在芯來提供的HP060開發(fā)板上成功適配芯

發(fā)表于 03-29 14:38 ?1186次閱讀

經(jīng)緯恒潤INTEWORK-EAS<b class='flag-5'>產(chǎn)品</b>成功適配<b class='flag-5'>芯</b><b class='flag-5'>來</b>RISC-V<b class='flag-5'>處理器</b>NA內(nèi)核

芯來科技推出1000系列，進一步開啟了亂序高性能CPU的篇章

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布基于RISC-V指令集的高性能商業(yè)處理器CPU IP——UX1000

發(fā)表于 03-18 10:02 ?1161次閱讀

<b class='flag-5'>芯</b><b class='flag-5'>來</b>科技推出1000<b class='flag-5'>系列</b>，進一步開啟了亂序高性能CPU的篇章

芯來科技正式發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布基于RISC-V處理器的HSM子系統(tǒng)解決方案，提供專業(yè)有效的信息安全保護以及加解密

發(fā)表于 03-11 11:01 ?1537次閱讀

<b class='flag-5'>芯</b><b class='flag-5'>來</b>科<b class='flag-5'>技正</b>式<b class='flag-5'>發(fā)布</b>基于RISC-V<b class='flag-5'>處理器</b>的HSM子系統(tǒng)解決方案

芯來科技發(fā)布超低功耗嵌入式RISC-V處理器CPU IP—NS100系列內(nèi)核

本土RISC-V CPU IP領(lǐng)軍企業(yè)——芯來科技正式發(fā)布針對信息安全的超低功耗嵌入式RISC-V處理器CPU IP——NS100

發(fā)表于 03-04 11:19 ?1522次閱讀

<b class='flag-5'>芯</b><b class='flag-5'>來</b>科技<b class='flag-5'>發(fā)布</b>超低功耗嵌入式RISC-V<b class='flag-5'>處理器</b>CPU IP—NS100<b class='flag-5'>系列</b>內(nèi)核

5G網(wǎng)絡(luò)優(yōu)化處理器和AI PC搶鏡英特爾攜三大重磅產(chǎn)品線亮相MWC24

此次在MWC24上，英特爾帶來三大旗艦產(chǎn)品線：一、用于網(wǎng)絡(luò)工作負載的未來Granite Rapids-D和Sierra Forest處理器；二、幫助運營商變現(xiàn)其邊緣部署的英特爾邊緣平臺；三、用于商用AI PC的英特爾酷睿Ultra處理器

發(fā)表于 02-29 15:16 ?4426次閱讀

芯來科技發(fā)布AI專用RISC-V處理器內(nèi)核NI900系列

在AI技術(shù)迅速發(fā)展的當下，RISC-V CPU IP領(lǐng)域的領(lǐng)軍企業(yè)芯來科技，正式發(fā)布了針對人工智能應(yīng)用的專用處理器產(chǎn)品線——

發(fā)表于 02-26 09:36 ?897次閱讀

在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

搜索歷史

芯來科技正式發(fā)布首款專用處理器產(chǎn)品線Nuclei Intelligence系列

評論