在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一種用于AI視覺處理芯片的驗證加速方案

路科驗證 ? 來源:路科驗證 ? 作者:路科驗證 ? 2023-03-28 16:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹

本文中所涉及的AI邊緣推斷視覺處理芯片的實際用例都較為復雜,而且也需要牽扯到多個模塊參與,例如攝像頭輸入、多通道數據的媒體編解碼、圖像處理、多顯示支持等。要去協調這么多的模塊,還要將它們與神經網絡算法結合構建用例。

由于對系統中各個硬件要素的協調調度要求較多,AI視覺處理芯片需要更多使用固件去進行測試,這對于從IP/子系統層的測試用例到系統層的移植、以及在早期階段獲得較為準確的性能數據和功耗數據都提出了要求。這篇論文提供了一個作者在功能、性能和功耗這三個方面的硬件加速驗證方案。

問題闡述

不同于常見的SoC在數據傳輸和控制上的測試方案,AI視覺處理芯片往往需要結合多個高帶寬的多媒體控制器發起多個數據幀,模擬真實應用。而這么大的數據處理量,仿真往往會受制于仿真性能無法有較好的表現,所以在AI芯片驗證方面,如果想要測試真實場景,那么就需要將固件在硬件加速器(emulator)上去處理。

由于功能、性能、功耗三個方面的驗證在工具層面都缺少統一的平臺做處理,而且不同形式的測試向量和方法學也讓這些測試場景無法做到自動化映射。從工程實現角度考慮,一個需求是把功能測試的數據能夠給到性能分析和功耗評估,另外一個需求是將IP/子系統層面的測試用例能夠給到SoC層面測試。

功能驗證方案

下方給出了在采用固件驗證的情況下的測試方案。固件在早期驗證中,可能使用的是例如SystemC/C++這類的純軟件測試平臺,在此基礎上他們可以提供早期的固件和十六進制文件(在后期的硬件加速測試中使用)。同時,在IP/子系統硬件加速測試中,可以根據測試文件(二進制文件和log文件)做后處理繼而獲得測試中的硬件配置數據和圖形文件。

在接下來的SoC emulation,可以將從早期軟件測試中固件、IP/子系統emulation中提取的硬件配置、圖形文件共同作為SoC測試中的元素,讓他們用來盡可能實現從IP/子系統到SoC的測試場景移植。 接下來可以利用emulator中的總線監測組件,獲得總線傳輸數據,并將這些數據信息交由Python腳本去做處理,以便達到數據比較、性能監測等目的。

7a7f12dc-cd41-11ed-bfe3-dac502259ad0.png

這個方案意味著測試從大的層面來看,是以最終通過固件測試為目的,也就是說從一開始構建測試場景時,就需要固件的人參與其中。這就不得不考慮在開發AI視覺芯片時的驗證分工協作的場景不單單是simulation、emulation參與在內,也同樣需要固件。盡管一開始硬件可能還不穩定,需要simulation/emulation讓硬件逐步穩定,但固件的人只要前期有SystemC/C++這樣的模型在的話也可以在早期做固件有關的測試準備。

這一點挺重要的,如果固件的人直到emulation階段才參與進來的話,那么也就沒有上面方案里的Software Testbench部分了,所有的信息都只能等到IP/子系統emulation階段得出。更甚至,如果在IP/子系統emulation階段沒有固件參與的話,那么在SoC層面去做固件相關的測試,從開發固件測試用例到做參考比較都會延緩測試進度。更為推薦的是固件也有條件在某個測試平臺(software testbench、IP/subsys emulation testbench)完成測試。

還有一點,在IP/subsys階段的測試,方案中是通過測試中的bin文件、log文件來做后處理,繼而生成SoC層面可以使用的配置。這一點不同于我們以往所理解的將測試文件從IP/subsys到SoC階段的修改移植。可能是為了實現準確的、自動化的配置參數,它是按照后處理的方式,提取出來對目標硬件做的各項配置,這些提取的信息可能按照某個格式做了中間信息的保存,并且結合SoC的結構特征,做了自動化的配置測試生成。

在SoC emulation階段,利用的是內置的總線監測(可能有多個),周期性地獲得數據,并完成數據完整性檢查(可能在測試中或者測試后通過Python腳本完成)。

性能分析方案

在性能分析時,也需要利用測試場景的移植(porting)和分析時的多個深度。從IP/subsys到SoC的移植,就性能分析而言分為了3個階段。 第1階段即是將IP/subsys的傳輸數據移植到SoC層面,這一點可以利用IP/subsys emulation過程中log文件的后處理來獲得。 第2階段是將IP/subsys的固件移植到SoC層面,這一點也可以利用“功能驗證方案”中已有的“software testbench”信息。 第3階段是為了讓多個多媒體控制器、接口的數據信息能夠并行運行以期達到真實的、大規模的數據吞吐。這種場景需要文中提到的一個特殊的混合方法(unique hybrid methodology),共同利用數據網絡(network)和固件,將多個多媒體控制器充分并行調動,構建復雜的測試場景。

7aa67de0-cd41-11ed-bfe3-dac502259ad0.png ?

功耗估測方案

在功耗估測中,需要考慮的是相比于通常在仿真中收集功耗有關數據,如何在emulation中收集數據,并且做到準確的、快速的功耗分析。在下面的方案中,利用了波形數據獲得開關信息文件SAIF,并結合power engine去獲得平均功耗和峰值功耗(論文并沒有就power engine給出詳細的信息)。 這里附贈一篇文章: 《Using Emulators For Power/Performance Tradeoffs》 https://semiengineering.com/using-emulators-for-power-performance-tradeoffs/

7ac2c7fc-cd41-11ed-bfe3-dac502259ad0.png

結果分析

受益于可以從IP/subsys層將測試用例有關的數據自動遷移到SoC級,使得與VPU(視覺處理單元)、DMA、ISP(Image Signal Processing)有關的測試用例能夠在4周的時間完成交付。這里的測試用例遷移我們應該吸取文章中的經驗,那就是它不是從測試用例自身文本的遷移去實現的,而是通過log/bin文件的后處理,獲得某種中間型的標準信息文件,再結合系統測試的環境配置數據,最終生成SoC測試用例。

從發現的bug類型來看,有接近40%來自于固件級別的測試,這也突出了AI類芯片在測試時需要結合實際場景的需求,畢竟整個系統的調動牽扯很多模塊,需要固件人員在早期就能夠參與進來。這也進一步突出了如何規劃一個跨平臺的方案在系統級測試上面有多么重要,我們不應該被SV/UVM/C所限制,也應該考慮如何讓這個測試平臺能夠被更多的人所使用。

7adaf46c-cd41-11ed-bfe3-dac502259ad0.png

相比于SoC仿真動輒需要用2天左右的時間完成某一個固件級的測試用例,emulation僅需要大概90分鐘的時間即能夠完成測試,并且更快地將性能數據反饋給架構組合設計組。在將simulation與emulation對比過程中,無論是固件測試用例數量、可支持數據幀的數目還是數據保存時間窗口,emulation的優勢都更為明顯。

7aea8a76-cd41-11ed-bfe3-dac502259ad0.png

而在功耗評估中,emualtion的功耗評估數據準確度與傳統的功耗分析工具差別大致在5%以內,而所消耗的時間則顯著縮短(大致是傳統功耗分析工具的125倍)。論文這里仍然沒有給出消耗時間的計算方式,是否包含了每個測試用例在simulation與emulation的耗時差別,還是只是包含了兩種工具用于功耗評估的時間。如果是后者的話,那么文中的power engine可能是內部開發的工具了,線索在文章的引文中(有一篇“pre-silicon power estimation methodology using emulation”,也一并在論文下載鏈接中提供)。

給出的參考論文來自于SNUG India 2020,而在2021年的時候Synopsys推出了業界第一款用來對運行真實軟件做功耗驗證(hardware+software)的工具ZeBu Empower。 https://www.synopsys.com/verification/emulation/zebu-empower.html

7b16ff3e-cd41-11ed-bfe3-dac502259ad0.png

7b2fd874-cd41-11ed-bfe3-dac502259ad0.png

Fastest Power Emulation for Hardware-Software Power Verification

7b3cfe28-cd41-11ed-bfe3-dac502259ad0.png






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 控制器
    +關注

    關注

    114

    文章

    17088

    瀏覽量

    184072
  • soc
    soc
    +關注

    關注

    38

    文章

    4385

    瀏覽量

    222599
  • AI
    AI
    +關注

    關注

    88

    文章

    35041

    瀏覽量

    279100
  • 硬件加速器
    +關注

    關注

    0

    文章

    43

    瀏覽量

    13050
  • 視覺處理芯片

    關注

    2

    文章

    10

    瀏覽量

    6715

原文標題:DVCon文賞-2023w14 一種用于AI視覺處理芯片的驗證加速方案

文章出處:【微信號:Rocker-IC,微信公眾號:路科驗證】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI芯片加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發展離不開高性能計算硬件的支持,而傳統CPU由于架構限制,難以高效處理AI任務中的大規模并行計算需求。因此,專為AI優化的芯片
    的頭像 發表于 07-09 15:59 ?109次閱讀

    硬件輔助驗證(HAV) 對軟件驗證的價值

    生態系統和定制指令集開發的唯途徑。 當下,芯片企業正在設計 RISC-V 人工智能 (AI) 與機器學習 (ML) 定制加速器,以實現特定工作負載的
    的頭像 發表于 05-13 18:21 ?897次閱讀

    肇觀電子AI視覺芯片推動汽車智能化升級

    作為國內領先的AI視覺芯片設計企業,肇觀電子(NextVPU)憑借自主研發的端側智能視覺處理器,持續推動汽車智能化升級。
    的頭像 發表于 05-09 10:25 ?329次閱讀

    Banana Pi 發布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計算與嵌入式開發

    低功耗特性。搭載 Renesas 獨有的 DRP-AI 加速器,支持 15 Sparse TOPS的 AI 計算能力,使其在計算機視覺、邊緣 AI
    發表于 03-19 17:54

    支持實時物體識別的視覺人工智能微處理器RZ/V2MA數據手冊

    DRP-AI 采用了一種由動態可重構處理器(DRP)和 AI-MAC組成的人工智能加速器,該加速
    的頭像 發表于 03-18 18:12 ?441次閱讀
    支持實時物體識別的<b class='flag-5'>視覺</b>人工智能微<b class='flag-5'>處理</b>器RZ/V2MA數據手冊

    AI MPU# 瑞薩RZ/V2H 四核視覺 ,采用 DRP-AI3 加速器和高性能實時處理

    RZ/V2H 高端 AI MPU 采用瑞薩電子專有的AI 加速器-動態可重配置處理器 (DRP-AI3)、四核 Arm^?^ Cortex
    的頭像 發表于 03-15 11:50 ?1443次閱讀
    <b class='flag-5'>AI</b> MPU# 瑞薩RZ/V2H 四核<b class='flag-5'>視覺</b> ,采用 DRP-<b class='flag-5'>AI</b>3 <b class='flag-5'>加速</b>器和高性能實時<b class='flag-5'>處理</b>器

    AI Agent 應用與項目實戰》----- 學習如何開發視頻應用

    再次感謝發燒友提供的閱讀體驗活動。本期跟隨《AI Agent 應用與項目實戰》這本書學習如何構建開發個視頻應用。AI Agent是一種智能應用,能夠根據用戶需求和環境變化做出相應響應
    發表于 03-05 19:52

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預測......

    起暢想! 、關于FPGA的前世今生——“無處不在的加速引擎”我們首先文科普什么是FPGA?FPGA(Field-Programmable Gate Array,現場可編程門陣列)是一種
    發表于 03-03 11:21

    文詳解視覺語言模型

    視覺語言模型(VLM)是一種多模態、生成式 AI 模型,能夠理解和處理視頻、圖像和文本。
    的頭像 發表于 02-12 11:13 ?1732次閱讀
    <b class='flag-5'>一</b>文詳解<b class='flag-5'>視覺</b>語言模型

    一種使用LDO簡單電源電路解決方案

    本期我們介紹一種使用LDO簡單電源電路解決方案,該方案可以處理12V/24V、多節鋰離子電池和4節干電池等相對較高的輸入電壓。
    的頭像 發表于 12-04 16:05 ?803次閱讀
    <b class='flag-5'>一種</b>使用LDO簡單電源電路解決<b class='flag-5'>方案</b>

    面向視覺 AI 應用的全新 MPU 平臺:瑞薩RZ/V2H MPU

    視覺 AI 是發展最快的嵌入式人工智能學科之,它加入了 AI 增強的語音工具和實時分析,成為快速收集、處理和訓練大量數據的
    的頭像 發表于 11-22 15:08 ?1018次閱讀

    BitEnergy AI公司開發出一種AI處理方法

    BitEnergy AI公司,家專注于人工智能(AI)推理技術的企業,其工程師團隊創新性地開發了一種名為線性復雜度乘法(L-Mul)的AI
    的頭像 發表于 10-22 15:15 ?817次閱讀

    什么是AI服務器?AI服務器的優勢是什么?

    AI服務器是一種專門為人工智能應用設計的服務器,它采用異構形式的硬件架構,通常搭載GPU、FPGA、ASIC等加速芯片,利用CPU與加速
    的頭像 發表于 09-21 11:43 ?2007次閱讀

    EPSON差分晶振SG3225VEN頻點312.5mhz應用于AI加速

    AI加速卡,通常也被稱為AI算力卡,是一種專為加速人工智能(AI)應用和算法而設計的硬件設備。
    發表于 09-10 14:56 ?0次下載

    AI視覺芯片技術升級,加速智能終端設備迭代

    AR眼鏡。行業人士認為,AR眼鏡有望成為AI落地的理想載體。 ? AI 眼鏡對視覺芯片的要求 ? AI智能眼鏡作為新型可穿戴設備,既強調眼鏡
    的頭像 發表于 08-21 00:22 ?4594次閱讀
    主站蜘蛛池模板: 国内真实实拍伦视频在线观看 | 在线亚洲精品 | 免费视频亚洲 | 欧美性色黄在线视 | 中文字幕在线播放第一页 | 毛片大全免费 | 手机看片精品国产福利盒子 | 中文字幕123区 | h网站免费 | 午夜黄色影片 | 特一级黄 | 午夜男人影院 | 久操视频免费观看 | 亚洲va久久久噜噜噜久久天堂 | 青草久操 | 国产精品久久久久天天影视 | 日本久久黄色 | 五月婷婷丁香色 | 国产男女怕怕怕免费视频 | 两性色午夜视频自由成熟的性 | 很黄很暴力 很污秽的小说 很黄很黄叫声床戏免费视频 | 天天色资料 | 一区二区三区国模大胆 | 夜夜夜夜曰天天天天拍国产 | 午夜男人影院 | 亚洲迅雷 | 国产黄在线观看免费观看不卡 | 狠狠色综合网站久久久久久久 | 全国男人的天堂天堂网 | 日本特级视频 | 亚洲一区在线视频观看 | 午夜网站视频 | 无人码一区二区三区视频 | 377p亚洲欧洲日本大胆色噜噜 | 夜夜精品视频一区二区 | 天天插日日射 | 天天干天天爱天天射 | 成人a毛片手机免费播放 | 91日本在线观看亚洲精品 | 91久久人澡人人添人人爽 | 特级中国aaa毛片 |