在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

低功耗下,高能效AI加速器如何設(shè)計(jì)?

新思科技 ? 來源:新思科技 ? 2023-10-26 09:18 ? 次閱讀

如果在數(shù)據(jù)中心和邊緣設(shè)備中部署上人工智能AI)加速器,那么它們將能夠快速處理PB級的數(shù)據(jù)量,還能幫助克服傳統(tǒng)的馮·諾依曼瓶頸。在Chat GPT、高級駕駛輔助系統(tǒng)(ADAS)、攝像頭和傳感器等智能邊緣設(shè)備中,我們都能看到AI加速器的身影。

半導(dǎo)體領(lǐng)域,實(shí)現(xiàn)出色的性能功耗比永遠(yuǎn)都是首要目標(biāo)。AI加速器的能效比通用系統(tǒng)的能效通常會(huì)高出100倍甚至1000倍,但生成出色AI模型所需的算力資源每3.4個(gè)月就會(huì)翻一番。AI產(chǎn)生的能耗不容小覷,以GPT3為例,僅訓(xùn)練這一個(gè)深度學(xué)習(xí)模型所產(chǎn)生的二氧化碳就高達(dá)500噸,相當(dāng)于一輛普通燃油車行駛100多萬英里。

降低能耗不僅能夠盡量減少對環(huán)境的影響,還能降低運(yùn)營成本,并在有限的功耗預(yù)算內(nèi)盡可能地提高性能,緩解熱挑戰(zhàn)。

本文將進(jìn)一步討論開發(fā)者們?nèi)绾卫枚说蕉斯姆治鼋鉀Q方案,打造新一代更高效節(jié)能的AI加速器。

為十億門級以上設(shè)計(jì)優(yōu)化功耗

AI加速器的端到端節(jié)能方法必須從設(shè)計(jì)流程的初始階段開始,涵蓋架構(gòu)和微架構(gòu)層面,并一直延續(xù)到簽核階段。因此,AI芯片開發(fā)者需要利用架構(gòu)探索平臺,對具體訓(xùn)練或推理應(yīng)用的功耗、性能和面積(PPA)進(jìn)行權(quán)衡分析和評估,并主動(dòng)識別后續(xù)分析的關(guān)鍵矢量。

由于AI硬件通常包括多個(gè)由數(shù)千個(gè)處理單元組成的大型陣列,因此十億門級以上設(shè)計(jì)需要進(jìn)行多域軟硬件功耗驗(yàn)證,盡可能降低能耗和漏電。然而,要想分析關(guān)鍵功耗模塊和時(shí)間窗口,需要先進(jìn)的硬件加速系統(tǒng),以便運(yùn)行數(shù)十億個(gè)循環(huán)并快速精確地實(shí)現(xiàn)多次迭代。只有在完成這一步后,寄存器傳輸級(RTL)功耗分析和物理實(shí)現(xiàn)工具才能有效地優(yōu)化動(dòng)態(tài)(晶體管門開關(guān))功耗和靜態(tài)(漏電)功耗。

為了始終提供準(zhǔn)確的結(jié)果,用于AI芯片設(shè)計(jì)的RTL功耗分析工具應(yīng)具備以下功能:

時(shí)序驅(qū)動(dòng)型快速綜合:內(nèi)部功耗計(jì)算錯(cuò)誤通常是基于扇出的快速綜合工具未能根據(jù)時(shí)序約束正確地確定單元大小。同后續(xù)的布局布線工具相同,RTL功耗分析工具中嵌入的快速綜合功能必須由時(shí)序驅(qū)動(dòng)。

物理感知型快速綜合:RTL功耗分析工具應(yīng)該具備“物理感知”能力,能夠通過完成一次設(shè)計(jì)單元擺放以及全局布線就可以獲得準(zhǔn)確的連線電容值。與基于扇出的方法不同,基于物理感知的電容估算能夠?yàn)槊織l連線提供唯一的準(zhǔn)確值。

簽核質(zhì)量的功耗計(jì)算引擎:傳統(tǒng)的RTL功耗分析工具使用word-level邏輯推理進(jìn)行快速綜合,這種方法只能采用啟發(fā)式算法來計(jì)算毛刺功耗,因此并不準(zhǔn)確。要準(zhǔn)確計(jì)算毛刺功耗(可能高達(dá)芯片總功耗的40%)并減少高度重復(fù)的處理單元,RTL功耗分析工具必須具備簽核質(zhì)量功耗分析引擎、網(wǎng)表級設(shè)計(jì)表示并集成時(shí)序計(jì)算引擎。

在完成RTL功耗分析和優(yōu)化后,便可使用物理實(shí)現(xiàn)(綜合和布局布線)工具來進(jìn)一步優(yōu)化PPA。為確保可靠性、可擴(kuò)展性以及良好的用戶體驗(yàn),這些實(shí)現(xiàn)工具應(yīng)包含統(tǒng)一的集成式數(shù)據(jù)模型架構(gòu)、交錯(cuò)式引擎和統(tǒng)一的命令界面。同樣重要的是,實(shí)現(xiàn)工具應(yīng)能對先進(jìn)節(jié)點(diǎn)效應(yīng)和毛刺功耗進(jìn)行精確建模,從而加速工程變更命令(ECO)和最終設(shè)計(jì)收斂。

出色的能效與性能

新思科技提供全面的端到端功耗解決方案,幫助AI芯片開發(fā)者以經(jīng)濟(jì)高效的方式達(dá)成或超越充滿挑戰(zhàn)性的性能和能效目標(biāo),同時(shí)縮短產(chǎn)品上市時(shí)間。新思科技的Platform Architect用于設(shè)計(jì)流程的初始階段,能夠?yàn)锳I芯片開發(fā)者提供SystemC事務(wù)級建模(TLM)工具和高效方法,幫助開發(fā)者快速地對復(fù)雜的芯片架構(gòu)進(jìn)行建模、分析和優(yōu)化。新思科技ZeBu Empower是一款快速的功耗分析工具,用于AI芯片設(shè)計(jì)流程的下一階段:基于數(shù)億個(gè)循環(huán)來分析和調(diào)試軟件實(shí)際工作負(fù)載下的能耗。

許多業(yè)內(nèi)領(lǐng)先的半導(dǎo)體公司借助新思科技ZeBu Empower大幅降低了功耗,其中包括美國硅谷的AI芯片初創(chuàng)公司SiMa.ai,該公司致力于為智能邊緣設(shè)計(jì)高性能、低能耗的AI芯片。具體而言,該公司的SiMa.ai低功耗MLSoC實(shí)現(xiàn)了每瓦特幀率(FPS)提升2.5倍的成果。在2023年硅谷SNUG大會(huì)上,SiMa.ai公司的芯片開發(fā)總監(jiān)Sounil Biswas指出,流片后驗(yàn)證結(jié)果表明,新思科技ZeBu Empower給出的數(shù)據(jù)與電路板的測量結(jié)果之間具有出色的相關(guān)性。

為了補(bǔ)充ZeBu Empower并助力實(shí)現(xiàn)低功耗RTL設(shè)計(jì),新思科技提供了PrimePower RTL,這是一款RTL功耗分析與優(yōu)化工具,通過將時(shí)序驅(qū)動(dòng)型綜合、物理感知型綜合與集成式計(jì)算引擎相結(jié)合,可以持續(xù)獲得準(zhǔn)確的結(jié)果(與布線后實(shí)現(xiàn)的結(jié)果相比誤差在+/- 15%以內(nèi))。新思科技PrimePower RTL還提供分步指導(dǎo),幫助AI芯片開發(fā)者進(jìn)一步減少毛刺并降低總功耗。

新思科技的Fusion Compiler是一款綜合的集成式RTL-to-GDSII實(shí)現(xiàn)系統(tǒng),可幫助實(shí)現(xiàn)進(jìn)一步的PPA優(yōu)化。在這之后,可以使用新思科技的黃金功耗簽核解決方案PrimePower對AI設(shè)計(jì)進(jìn)行分析。新思科技的PrimePower通過了全球多家領(lǐng)先代工廠的認(rèn)證,3nm工藝能夠在簽核時(shí)實(shí)現(xiàn)高精度,同SPICE的芯片測量的誤差極小。

為邊緣AI推理設(shè)計(jì)差異化芯片

AI加速器使許多熱門應(yīng)用能夠在幾毫秒內(nèi)快速分析海量信息并準(zhǔn)確推斷結(jié)果。與此同時(shí),實(shí)現(xiàn)出色的性能功耗比依然是芯片開發(fā)者的首要目標(biāo)。這一點(diǎn)在邊緣領(lǐng)域尤為明顯,在該領(lǐng)域,為了縮小芯片尺寸并盡可能地降低功耗,性能通常會(huì)受到限制。

然而,這些限制也為半導(dǎo)體公司創(chuàng)造了新的機(jī)遇,讓半導(dǎo)體公司可以通過精確校準(zhǔn)PPA來滿足低延遲、高帶寬應(yīng)用的特定要求,從而設(shè)計(jì)出差異化芯片。例如,自主導(dǎo)航應(yīng)用要求計(jì)算響應(yīng)延遲時(shí)間限制在20μs以內(nèi),而語音和視頻助手則要求能夠在10μs之內(nèi)理解語音關(guān)鍵詞,并在幾百毫秒內(nèi)理解手勢含義。要想成功實(shí)現(xiàn)PPA權(quán)衡,芯片開發(fā)者應(yīng)該采用整體性方法,利用端到端解決方案,從早期架構(gòu)探索到最后的黃金功耗簽核,持續(xù)優(yōu)化功耗。








審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 加速器
    +關(guān)注

    關(guān)注

    2

    文章

    807

    瀏覽量

    38093
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9746

    瀏覽量

    138918
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47683

    瀏覽量

    240338
  • RTL
    RTL
    +關(guān)注

    關(guān)注

    1

    文章

    385

    瀏覽量

    59954
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    1906

    瀏覽量

    35219

原文標(biāo)題:邊緣端也要跑大模型:低功耗下,高能效AI加速器如何設(shè)計(jì)?

文章出處:【微信號:Synopsys_CN,微信公眾號:新思科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    從版本控制到全流程支持:揭秘Helix Core如何成為您的創(chuàng)意加速器

    加速器
    龍智DevSecOps
    發(fā)布于 :2024年11月26日 13:42:47

    IBM與AMD攜手部署MI300X加速器,強(qiáng)化AI與HPC能力

    舉措預(yù)計(jì)將于2025年上半年正式推出。 此次合作的核心目標(biāo)是提升通用人工智能(AI)模型的性能與能,并為企業(yè)客戶提供高性能計(jì)算(HPC)應(yīng)用的強(qiáng)大支持。AMD的Instinct MI300X加速器憑借其
    的頭像 發(fā)表于 11-21 11:07 ?305次閱讀

    IBM將在云平臺部署AMD加速器

    IBM與AMD近期宣布了一項(xiàng)重要合作協(xié)議,根據(jù)協(xié)議,IBM將在其云平臺上部署AMD Instinct MI300X加速器。這一舉措旨在提升企業(yè)客戶在生成式AI模型方面的性能和能,進(jìn)一步推動(dòng)A
    的頭像 發(fā)表于 11-19 16:24 ?275次閱讀

    聯(lián)發(fā)科天璣9400發(fā)布:能比與端側(cè)AI引領(lǐng)移動(dòng)芯片行業(yè)革新

    AI大模型的推動(dòng),智能手機(jī)市場的高端化進(jìn)程進(jìn)一步加速,旗艦機(jī)型的競爭已不再單純依賴于“大力飛磚”式的極限性能比拼,而是更加注重綜合素質(zhì)的提升。特別是在手機(jī)芯片領(lǐng)域,高性能與低功耗
    的頭像 發(fā)表于 10-12 15:56 ?656次閱讀

    瑞薩電子推出新一代高能AI加速器DRP-AI3

    必須兼顧高效能與低能耗,確保在執(zhí)行復(fù)雜計(jì)算任務(wù)的同時(shí),保持低功耗并有效控制發(fā)熱,以保障設(shè)備的穩(wěn)定運(yùn)行,延長設(shè)備使用壽命。
    的頭像 發(fā)表于 10-11 11:47 ?488次閱讀

    什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點(diǎn)?

    )和圖形處理(GPU)雖然可以處理神經(jīng)網(wǎng)絡(luò)計(jì)算,但在能比和計(jì)算密度上往往難以滿足特定應(yīng)用場景的需求。因此,神經(jīng)網(wǎng)絡(luò)加速器應(yīng)運(yùn)而生,它通過優(yōu)化硬件架構(gòu)和算法實(shí)現(xiàn),針對神經(jīng)網(wǎng)絡(luò)計(jì)算的特點(diǎn)進(jìn)行定制化設(shè)計(jì),以達(dá)到更高的計(jì)算效率和更低
    的頭像 發(fā)表于 07-11 10:40 ?579次閱讀

    美國限制向中東AI加速器出口,審查國家安全

    AI加速器能協(xié)助數(shù)據(jù)中心處理大量人工智能聊天機(jī)器人和其他工具的開發(fā)信息。如今,它們已然成為構(gòu)建AI基礎(chǔ)設(shè)施的企業(yè)和政府的必需品。
    的頭像 發(fā)表于 05-31 09:20 ?644次閱讀

    芯品#MAX78002 新型AI MCU,能夠使神經(jīng)網(wǎng)絡(luò)以超低功耗運(yùn)行

    人工智能(AI)需要超強(qiáng)的計(jì)算能力,而Maxim則大大降低了AI計(jì)算所需的功耗。MAX78002是一款新型的AI微控制,使神經(jīng)網(wǎng)絡(luò)能夠在互
    的頭像 發(fā)表于 05-07 17:47 ?7467次閱讀
    芯品#MAX78002 新型<b class='flag-5'>AI</b> MCU,能夠使神經(jīng)網(wǎng)絡(luò)以超<b class='flag-5'>低功耗</b>運(yùn)行

    構(gòu)建強(qiáng)大、高能的i.MX 8ULP應(yīng)用處理合作生態(tài)體系

    工程師們正在借助i.MX 8ULP應(yīng)用處理應(yīng)對這一挑戰(zhàn),在更緊湊的體積中實(shí)現(xiàn)更強(qiáng)大的功能,同時(shí)為下一代邊緣設(shè)備提供了驚艷的能水平。恩智浦最新的超低功耗微處理現(xiàn)在可供嵌入式設(shè)計(jì)工
    的頭像 發(fā)表于 04-24 16:35 ?2003次閱讀
    構(gòu)建強(qiáng)大、<b class='flag-5'>高能</b><b class='flag-5'>效</b>的i.MX 8ULP應(yīng)用處理<b class='flag-5'>器</b>合作生態(tài)體系

    Arm發(fā)布新一代Ethos-U AI加速器 Arm旨在瞄準(zhǔn)國產(chǎn)CPU市場

    Arm發(fā)布的新一代Ethos-U AI加速器確實(shí)在業(yè)界引起了廣泛關(guān)注。
    的頭像 發(fā)表于 04-18 15:59 ?824次閱讀

    MCX N系列微處理之NPU使用方法簡析

    MCX N系列是高性能、低功耗微控制,配備智能外設(shè)和加速器,可提供多任務(wù)功能和高能
    的頭像 發(fā)表于 04-18 10:32 ?2121次閱讀
    MCX N系列微處理<b class='flag-5'>器</b>之NPU使用方法簡析

    Arm推動(dòng)生成式AI落地邊緣!全新Ethos-U85 AI加速器支持Transformer 架構(gòu),性能提升四倍

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)在嵌入式領(lǐng)域,邊緣與端側(cè)AI推理需求不斷增長,Arm既有Helium 技術(shù)使 CPU 能夠執(zhí)行更多計(jì)算密集型的 AI 推理算法,也有Ethos 系列 AI 加速器
    的頭像 發(fā)表于 04-16 09:10 ?4729次閱讀
    Arm推動(dòng)生成式<b class='flag-5'>AI</b>落地邊緣!全新Ethos-U85 <b class='flag-5'>AI</b><b class='flag-5'>加速器</b>支持Transformer 架構(gòu),性能提升四倍

    MCX N微處理SmartDMA對圖像數(shù)據(jù)的定制處理實(shí)現(xiàn)

    MCX N系列是高性能、低功耗微控制,配備智能外設(shè)和加速器,可提供多任務(wù)功能和高能
    的頭像 發(fā)表于 03-28 11:42 ?1271次閱讀
    MCX N微處理<b class='flag-5'>器</b>SmartDMA對圖像數(shù)據(jù)的定制處理實(shí)現(xiàn)

    瑞薩發(fā)布下一代動(dòng)態(tài)可重構(gòu)人工智能處理加速器

    瑞薩最新發(fā)布的動(dòng)態(tài)可重構(gòu)人工智能處理(DRP-AI加速器,在業(yè)界引起了廣泛關(guān)注。這款加速器擁有卓越的10 TOPS/W高功率效率,相比傳統(tǒng)技術(shù),效率提升了驚人的10倍。其獨(dú)特之處在
    的頭像 發(fā)表于 03-08 13:45 ?831次閱讀

    家居智能化,推動(dòng)AI加速器的發(fā)展

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)AI加速芯片,也稱為人工智能加速器AI Accelerator),是一種專為執(zhí)行機(jī)器學(xué)習(xí)和深度學(xué)習(xí)任務(wù)而設(shè)計(jì)的ASIC或定制化處理
    的頭像 發(fā)表于 02-23 00:18 ?4687次閱讀
    主站蜘蛛池模板: 国产高清视频免费最新在线 | 亚洲伊人成人 | 久久久久久夜精品精品免费 | 黄 色 成 年人网站 黄 色 成 年人在线 | 亚洲精品美女久久久 | 欧美四虎影院 | 午夜黄大色黄大片美女图片 | 天天碰夜夜操 | 午夜高清福利 | 日本黄色小视频网站 | 欧美性久久久久 | 男女视频在线观看免费高清观看 | 免费视频不卡一区二区三区 | 国产乱码精品一区二区三 | 又粗又爽又色男女乱淫播放男女 | 永久视频在线观看 | 国产高清免费在线 | 日本拍拍拍 | 成人国产在线24小时播放视频 | 欧美在线小视频 | 又色又污又爽又黄的网站 | 99草精品视频 | 日本三级全黄 | 欧美一区二区三区黄色 | asian极品呦女爱爱 | 亚洲成人精品 | 日本高清www | 伊人丁香婷婷综合一区二区 | 午夜免费福利片 | 色噜噜中文网 | 亚洲人成综合网站在线 | 国产一线在线观看 | 9999毛片免费看 | 最新欧美一级视频 | 人人插人人爱 | 宅男午夜视频在线观看 | 亚洲娇小性色xxxx | 在线观看精品国产入口 | 精品特级毛片 | 久久一卡二卡 | 黄色免费网站在线观看 |