在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

RISC-V處理器優(yōu)化,不可依賴于放之四海而皆準的方法

Codasip 科達希普 ? 來源:Codasip 科達希普 ? 2023-05-31 15:25 ? 次閱讀

隨著對高性能處理器的需求不斷增長,半導(dǎo)體的縮放定律不斷顯示其極限,對處理器的優(yōu)化需求變得不可避免。正如我在之前的博客中解釋的那樣,RISC-V的設(shè)計就是為了實現(xiàn)這一點。然而,在處理器優(yōu)化方面沒有一個放之四海而皆準的方法。由于每個工作負載和應(yīng)用程序都有自己的要求,因此優(yōu)化方法也因個體而異。我們可以在不同的層面上修改處理器IP,每一種都有自己的優(yōu)勢。在這篇博文中,讓我們來定義和探索處理器優(yōu)化的不同層次。從配置到定制,如何使用它們來創(chuàng)建滿足特定要求的優(yōu)化過的品質(zhì)處理器。

首先定義三個不同級別的處理器優(yōu)化,它們有著不同的優(yōu)勢和使用場景。所有三個級別不但不相互排斥,還可以將三者結(jié)合起來,以實現(xiàn)PPA目標。

fb49572c-ff75-11ed-90ce-dac502259ad0.png

3 levels of processor customization. Source: Codasip

配置:將標準內(nèi)核的RTL參數(shù)設(shè)置為預(yù)先定義的值

每個處理器IP都有一套可調(diào)整的、預(yù)先定義的參數(shù)。它們在交付時有一個默認值,該默認值可以修改并設(shè)置為特定用例所需的值。大家通??梢栽赗TL級別設(shè)置并輕松修改這些參數(shù)。這種級別的優(yōu)化在業(yè)界非常普遍,而且廣泛傳播。這些參數(shù)可能包括中斷次數(shù),是否存在簡單的功能或緩存的大小等。

在RTL級別的調(diào)整對于任何處理器IP來說都是可以預(yù)期的,并且可以通過Codasip以RTL形式提供的標準Codasip RISC-V核來實現(xiàn)。該IP是經(jīng)過完全驗證的,簡化后的集成,但是參數(shù)的范圍和可能的值是有限的,探索空間也相對有限。

雖然這些參數(shù)是必要的,但不足以為特定需求創(chuàng)造一個真正獨特的差異化產(chǎn)品。原因是它們既是有限的選項集,同時也是在RTL層面的實現(xiàn)的,而RTL級別的實現(xiàn)是難以參數(shù)化的,這在業(yè)界眾所周知。因此,配置只能給予對最終設(shè)計的有限控制。

高級配置:結(jié)構(gòu)性變化以適應(yīng)設(shè)計

除了配置之外,還有高級配置可以運用。在高級別配置上,這個概念看起來很相似。但我們的想法是啟用更大、更復(fù)雜的參數(shù),從而得到明顯差異化的RTL 。配置選項的例子包括:

1. 緩存和TCM的增加

2. 浮點單元的存在

3. 或分支預(yù)測器的存在

這種靈活性對于處理器IP來說雖然不太常見,但是可以使用Codasip IP來實現(xiàn)。所有的Codasip RISC-V內(nèi)核都是用一種叫做CodAL的高級語言設(shè)計的,并且可以用Codasip Studio設(shè)計自動化進行配置。只需從配置器GUI中選擇高級參數(shù),該工具就會自動生成只包含自定義優(yōu)化配置的RTL。

處理器的CodAL源代碼可向用戶提供所有選項。然后,Codasip Studio工具將CodAL合成為RTL。

Codasip提供大量的CodAL配置選項,也意味著客戶不需要任何關(guān)于CodAL的具體知識(盡管這種類似C語言編程語言很簡單和直接)。這中方法為實現(xiàn)特定應(yīng)用定制產(chǎn)品提供了保證。并完全可以從同一個源代碼中同時優(yōu)化硬件和軟件。

定制:更深層次的處理器IP優(yōu)化

更深層次的IP優(yōu)化實際上是設(shè)計師對IP的修改,以便為目標應(yīng)用獲得更高的效率性能。這是定制計算的領(lǐng)域,也是Codasip提供的具有競品優(yōu)勢的解決方案。其他IP供應(yīng)商可能會宣稱處理器也可以進行定制,但如果沒有自動化設(shè)計流程,這種期待只能停留在理論上,而且可定制范圍非常有限。

Codasip RISC-V內(nèi)核的定制意味著對IP進行細粒度的修改,能夠在架構(gòu)和微架構(gòu)層面上修改需要的任何東西??梢栽黾踊騽h除指令,改變寄存器集或增加全新的功能或接口,而不僅僅是修改現(xiàn)有的參數(shù)。CodAL語言的使用使這些修改變得快速而簡單。Codasip Studio的分析功能指出了需要改進的潛在領(lǐng)域,并能非常快速地反饋應(yīng)用程序在這些修改后的表現(xiàn),這對快速迭代和獲得最佳結(jié)果至關(guān)重要。

fb64efbe-ff75-11ed-90ce-dac502259ad0.png

Automated approach to custom compute. Source: Codasip

而從一個經(jīng)過完整驗證的RISC-V內(nèi)核開始,也使這個定制過程變得更快,并可以大大減少驗證工作,而驗證環(huán)節(jié)通常是設(shè)計項目中最耗時的任務(wù)。在Codasip Studio中用CodAL對Codasip RISC-V內(nèi)核進行全面優(yōu)化,是為應(yīng)用獲得定制計算的一種實用方法。它最大的優(yōu)勢在于整個設(shè)計流程是自動化的,而且該工具會自動生成一個SDK和HDK,這些SDK和HDK并已知與定制內(nèi)核相匹配的相關(guān)。而不需要手動來創(chuàng)建一切!

處理器優(yōu)化案例

可以想象一下,如果想為特定的機器學(xué)習(xí)工作負載優(yōu)化一個處理器,以卷積神經(jīng)網(wǎng)絡(luò)(CNN)為例。

隨著向設(shè)備級人工智能處理的重要轉(zhuǎn)變,在為物聯(lián)網(wǎng)應(yīng)用選擇SoC或MC時,運行人工智能/機器學(xué)習(xí)任務(wù)的能力成為必須具備的條件。但是嵌入式設(shè)備通常受到資源限制,因此很難在嵌入式平臺上運行人工智能算法

使用Codasip L31 RISC-V內(nèi)核和Codasip Studio,我們可以探索和定制處理器設(shè)計,以提高其運行機器學(xué)習(xí)算法時的效率。Codasip Studio中包含的剖析工具使設(shè)計者能夠比較標準內(nèi)核和優(yōu)化內(nèi)核的性能,突出神經(jīng)網(wǎng)絡(luò)定制指令的好處。

fb8f3594-ff75-11ed-90ce-dac502259ad0.png

Our approach to processor optimization for ML workloads (use case). Source: Codasip

Codasipde的方法是在不同的層次上對處理器進行調(diào)整:

我們?yōu)镸L工作負載優(yōu)化處理器的Codasip方法(使用案例):高級配置和定制

通過對圖像識別的基準應(yīng)用進行分析,我們用Codasip Studio工具證實,圖像卷積是一個主要的瓶頸,占用了89%以上的CPU時間。不到200行的CodAL代碼足以實現(xiàn)一個緊密集成在Codasip L31內(nèi)核的卷積加速器。在對最大頻率影響不到10%的情況下,這種修改提供了大于5倍的性能提升和小于3倍的能耗。Codasip Studio自動生成一個優(yōu)化的編譯器,在不改變軟件的情況下實現(xiàn)了效率的提高!

如果您對神經(jīng)網(wǎng)絡(luò)加速器技術(shù)白皮書感興趣,請移步該鏈接下載英文原版:https://codasip.com/papers/compact-nn-accelerator-in-codal-technical-paper/

各種處理器優(yōu)化方法相結(jié)合以求最佳結(jié)果

正如我們所說,在處理器優(yōu)化方面沒有一個放之四海而皆準的方法。處理器IP修改可以在不同層面進行,每個層面都可以帶來不同的優(yōu)勢。這種組合的相結(jié)合則能協(xié)助客戶在開發(fā)獨特產(chǎn)品時實現(xiàn)最佳的PPA目標。

fba37b30-ff75-11ed-90ce-dac502259ad0.jpg

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    19440

    瀏覽量

    231321
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    3

    文章

    1384

    瀏覽量

    40442
  • RISC-V
    +關(guān)注

    關(guān)注

    45

    文章

    2328

    瀏覽量

    46678

原文標題:RISC-V處理器優(yōu)化,不可依賴于放之四海而皆準的方法。

文章出處:【微信號:Codasip 科達希普,微信公眾號:Codasip 科達希普】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    晶心科技推出突破性的RISC-V 27系列處理器及向量擴展指令處理器

    晶心科技今天宣布推出AndesCore? 27系列處理器核心,成為RISC-V指令集架構(gòu)中領(lǐng)先支持向量擴展架構(gòu)(RISC-V V-extension)的
    發(fā)表于 01-03 14:56 ?2982次閱讀

    開放性與碎片化,RISC-V能否撼動處理器架構(gòu)的格局?

    芯片設(shè)計工作中必不可少的就是IP核,為此不少企業(yè)推出了自己的RISC-V處理器IP。但單靠IP并不足以支撐龐大的RISC-V生態(tài),為了實現(xiàn)生態(tài)發(fā)展與統(tǒng)一,許多專注于
    的頭像 發(fā)表于 10-08 00:09 ?1.2w次閱讀

    關(guān)于RISC-V和開源處理器的一些解讀

    來記錄描述,處理器實現(xiàn)是基于指令集規(guī)范完成的源代碼。RISC-V是一個指令集規(guī)范。我們可以基于x86/ARM/ RISC-V指令集,進行處理器
    發(fā)表于 06-22 16:47

    學(xué)習(xí)RISC-V入門 基于RISC-V架構(gòu)的開源處理器及SoC研究

    流水線處理器、可執(zhí)行微碼的處理器。(7)PicoRV32PicoRV32是由RISC-V開發(fā)者Clifford Wolf設(shè)計發(fā)布的一款大小經(jīng)過優(yōu)化的開源
    發(fā)表于 07-27 18:09

    RISC-V是什么?如何去設(shè)計RISC-V處理器?

    RISC-V是什么?有哪些特點?如何去設(shè)計RISC-V處理器?
    發(fā)表于 06-18 09:24

    RISC-V開源處理器核介紹

    本期文章目錄一個小型RISC-V開源處理器核介紹!#SOC#FPGA#RISC-V點擊閱讀數(shù)字積木從零開始寫RISC-V處理器(超詳細)#
    發(fā)表于 07-23 09:42

    優(yōu)化的關(guān)鍵,RISC-V中的性能監(jiān)控

    分析/監(jiān)控工具成了處理器開發(fā)時必不可少的軟件。盡管RISC-V的ISA規(guī)范已經(jīng)定義了硬件性能監(jiān)控(HPM),但總體支持程度上仍未完善。就以Linux上的性能分析工具Perf為例,該工具可以借助PMU
    發(fā)表于 12-27 08:00

    RISC-V工具鏈簡介

    作者:云海最近,RISC-V風(fēng)靡一時,其開放性和可擴展性引起了人們對可定制處理器的興趣。因此,許多半導(dǎo)體公司都試圖加入這個市場,也吸引了大量的開發(fā)者涌入。有關(guān) RISC-V 的文章已成為科技界
    發(fā)表于 03-09 06:32

    香山處理器 RISC-V的典范

    https://github.com/JiaoXianjun/XiangShan談到RISC-V,應(yīng)該都會想到香山處理器。其經(jīng)歷了幾代的演進,性能越來越高。采用Chisel Rocketchip框架,能夠方便的定制屬于你的RISC-V
    發(fā)表于 04-14 15:51

    RISC-V是通用RISC處理器還是可定制的處理器?

    隨著這些年的發(fā)展,RISC-V的受重視程度與與日俱增。這主要因為它是免費的、靈活的,并且速度很快。這使RISC-V成為許多開發(fā)人員的安全便捷選擇。但是您會認為RISC-V是通用RISC
    的頭像 發(fā)表于 11-17 16:11 ?3593次閱讀

    美國芯片企業(yè)開發(fā)出全球最快的64位Risc-V處理器

    據(jù)外媒報道指美國芯片企業(yè)Micro Magic開發(fā)出了全球最快的64位Risc-V處理器,性能比當下性能最強的ARM處理器--蘋果M1還要強,功耗更低。考慮到中國正在努力擺脫對ARM
    的頭像 發(fā)表于 12-17 14:48 ?3407次閱讀

    基于形式驗證的高效RISC-V處理器驗證方法

    隨著RISC-V處理器的快速發(fā)展,如何保證其正確性成為了一個重要的問題。傳統(tǒng)的測試方法只能覆蓋一部分錯誤情況,而且無法完全保證處理器的正確性。因此,基于形式驗證的
    的頭像 發(fā)表于 06-02 10:35 ?1454次閱讀

    基于形式的高效 RISC-V 處理器驗證方法

    RISC-V的開放性允許定制和擴展基于 RISC-V 內(nèi)核的架構(gòu)和微架構(gòu),以滿足特定需求。這種對設(shè)計自由的渴望也正在將驗證部分的職責(zé)轉(zhuǎn)移到不斷壯大的開發(fā)人員社群。然而,隨著越來越多的企業(yè)和開發(fā)人員轉(zhuǎn)型RISC-V,大家才發(fā)現(xiàn)
    的頭像 發(fā)表于 07-10 09:42 ?734次閱讀
    基于形式的高效 <b class='flag-5'>RISC-V</b> <b class='flag-5'>處理器</b>驗證<b class='flag-5'>方法</b>

    fpga和risc-v處理器的區(qū)別

    FPGA(現(xiàn)場可編程門陣列)和RISC-V處理器在多個方面存在顯著的區(qū)別。
    的頭像 發(fā)表于 03-27 14:21 ?1296次閱讀

    使用 RISC-V 進行高效數(shù)據(jù)處理方法

    使用RISC-V進行高效數(shù)據(jù)處理方法涉及多個方面,包括處理器內(nèi)核與DSA(領(lǐng)域特定加速)之間的通信優(yōu)
    的頭像 發(fā)表于 12-11 17:52 ?497次閱讀
    主站蜘蛛池模板: 国产三级精品三级在线观看 | 欧美猛交喷潮在线播放 | 欧美高清成人videosex | 国产免费人成在线视频视频 | 国产精品国产三级在线高清观看 | h小视频在线观看 | 色婷婷综合久久久中文字幕 | 538porm在线看国产亚洲 | 午夜黄页网站在线播放 | 永久免费看的啪啪网站 | 丁香月婷婷 | 中文字幕一区在线观看视频 | 韩国中文字幕在线观看 | 四虎伊人 | 成人窝窝午夜看片 | 一区二区三区久久 | 啪啪网免费视频 | 免费美剧在线观看 | 美女网色站 | 天天干天 | 在线电影你懂得 | 国产精品福利视频手机免费观看 | 四虎影院免费在线播放 | 鲁老汉精品视频在线观看 | 好大好硬好深好爽想要免费视频 | 日本不卡高清视频 | 瑟瑟网站免费 | 国产欧美日韩电影 | 嫩草影院地址一地址二 | 人人爽天天爽夜夜爽曰 | 久久香蕉综合色一综合色88 | 色视频免费在线 | 天天激情 | 免费h视频在线观看 | 性夜影院爽黄a爽免费看网站 | 午夜三级国产精品理论三级 | 亚洲444kkk| fxxx性xxx性| 免费激情网站 | 免费一级在线观看 | 国产乱人视频免费播放 |