Chips&Media 成功采用 Mentor Catapult High-Level Synthesis (HLS) 平臺實現(xiàn)了首個計算機視覺 IP;
Chips&Media 通過 Catapult HLS 將模塊設(shè)計/驗證時間縮短了一半,并實現(xiàn)了關(guān)鍵的現(xiàn)場可編程門陣列 (FPGA) 演示系統(tǒng);
Catapult HLS 方法論使探索多種架構(gòu)并為深度神經(jīng)網(wǎng)絡(luò)加速器尋找最佳實現(xiàn)方案成為了可能。
Mentor, A Siemens Business 宣布 Chips&Media 已成功部署 Mentor Catapult HLS 平臺,將使用深度神經(jīng)網(wǎng)絡(luò) (DNN) 算法設(shè)計和驗證其 c.WAVE 計算機視覺 IP 的實時對象檢測。Chips&Media 是一家面向片上系統(tǒng) (SoC) 設(shè)計高性能、高質(zhì)量視頻 IP 的領(lǐng)先供應(yīng)商,其產(chǎn)品廣泛應(yīng)用于汽車、監(jiān)控和消費電子領(lǐng)域。
Chips&Media 需要通過減少功能驗證時間、時序收斂、自定義和最終優(yōu)化來大幅提高生產(chǎn)力,把更多時間用于機器算法和架構(gòu)的研發(fā)上,從而為客戶快速提供差異化的機器學(xué)習(xí) IP。為實現(xiàn)這些目標(biāo),他們棄用了傳統(tǒng)的手工編碼寄存器傳輸級 (RTL) 流程,轉(zhuǎn)而采用 Catapult HLS 平臺,以使用 C 語言編寫算法和驗證平臺。與同一項目中使用 RTL 流程的團隊相比,HLS 設(shè)計和驗證團隊將項目時間縮短了一半。
“要應(yīng)對以推理為目標(biāo)的設(shè)備帶來的加速挑戰(zhàn),我們認(rèn)為關(guān)鍵在于使用深度神經(jīng)網(wǎng)絡(luò)建立一個專注于功耗、性能和面積 (PPA) 并高度優(yōu)化的硬件架構(gòu),”Chips&Media 首席技術(shù)官 Mickey Jeon 表示。“HLS 使我們能夠極其高效地完成這項工作。我們的項目取得了突出的成績,我們計劃在接下來的項目中部署應(yīng)用 Catapult 的 HLS 流程。”
基于 DNN 的計算機視覺處理的特征,就是乘法/加法/累加的重復(fù)計算,同時通過神經(jīng)網(wǎng)絡(luò)層進行大量數(shù)據(jù)遷移。DNN 是在 Caffe 或 TensorFlow 等框架上開發(fā)的,然后在 C 模型中捕獲其算法。Chips&Media 將此算法 C 模型改進為可綜合的 C 代碼,并使用 Catapult HLS 平臺快速探索各種架構(gòu)并綜合到 RTL 中,以找到此類設(shè)計的最佳解決方案。
“根據(jù)我們的觀察,在市場快速變化的多個應(yīng)用領(lǐng)域,采用 Catapult HLS 是提高生產(chǎn)力來獲得成功的唯一途徑,”Mentor 數(shù)字設(shè)計和實施解決方案總經(jīng)理 Badru Agarwala 表示。“我們一直與 Chips&Media 密切合作,以確保他們平穩(wěn)過渡到 HLS。該平臺可以讓他們專注于算法/架構(gòu)設(shè)計,而不是底層實現(xiàn)和調(diào)試等細(xì)節(jié),從而更快地把想法變成產(chǎn)品,然后推向市場。”
借助 Catapult HLS 平臺,設(shè)計人員便能利用行業(yè)標(biāo)準(zhǔn) ANSI C++ 和 SystemC 來描述功能意圖,并將其提高到生產(chǎn)率更高的抽象層次。根據(jù)這些高層次的描述,Catapult 即可快速生成產(chǎn)品級的 RTL。Catapult 平臺將綜合與形式 C 屬性檢查功能相結(jié)合,以便及早發(fā)現(xiàn) C++/SystemC 級別的錯誤并在綜合之前全面驗證源代碼。高度交互的 Catapult 工作流程可提供對綜合過程的完全可見性和控制,使設(shè)計人員能夠迅速收斂到 PPA 的最佳實現(xiàn)方案。此外,Catapult 的高級功耗優(yōu)化功能也可以自動大幅降低動態(tài)功耗。
-
計算機視覺
+關(guān)注
關(guān)注
8文章
1702瀏覽量
46195 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5523瀏覽量
121746
發(fā)布評論請先 登錄
相關(guān)推薦
數(shù)據(jù)中心中的FPGA硬件加速器


NPU在深度學(xué)習(xí)中的應(yīng)用
FPGA加速深度學(xué)習(xí)模型的案例
深度學(xué)習(xí)GPU加速效果如何
TDA4VM上的硬件加速運動恢復(fù)結(jié)構(gòu)算法

AM62A SoC通過硬件加速視覺處理改進條形碼讀取器

適用于數(shù)據(jù)中心應(yīng)用中的硬件加速器的直流/直流轉(zhuǎn)換器解決方案

圖形圖像硬件加速器卡設(shè)計原理圖:270-VC709E 基于FMC接口的Virtex7 XC7VX690T PCIeX8 接口卡

什么是神經(jīng)網(wǎng)絡(luò)加速器?它有哪些特點?
西門子推出Catapult AI NN軟件,賦能神經(jīng)網(wǎng)絡(luò)加速器設(shè)計
PSoC 6 MCUBoot和mbedTLS是否支持加密硬件加速?
Elektrobit利用其首創(chuàng)的硬件加速軟件優(yōu)化汽車通信網(wǎng)絡(luò)的性能
330-基于FMC接口的Kintex-7 XC7K325T PCIeX4 3U PXIe接口卡 圖形圖像硬件加速器

評論