在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

用于加速嵌入式視覺和推理的開放標準

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Neil Trevett ? 2022-07-08 16:07 ? 次閱讀

機器學習領域的不斷發(fā)展為部署利用神經(jīng)網(wǎng)絡推理的設備和應用程序創(chuàng)造了新的機會,這些設備和應用程序具有前所未有的基于視覺的功能和準確性水平。但是,快速發(fā)展的領域已經(jīng)讓位于處理器、加速器和庫的混亂局面。本文介紹了開放互操作性標準及其在降低成本和降低在實際產(chǎn)品中使用推理和視覺加速的障礙方面的作用。

每個行業(yè)都需要開放標準,通過增加生態(tài)系統(tǒng)元素之間的互操作性來降低成本和縮短上市時間。開放標準和專有技術具有復雜且相互依存的關系。專有 API接口通常是達爾文式的試驗場,并且可以在聰明的市場領導者手中保持主導地位,這也是理所當然的。強大的開放標準源于行業(yè)對成熟技術的更廣泛需求,可以提供健康、激勵的競爭。從長遠來看,不受任何一家公司控制或依賴于任何一家公司的開放標準通常可以成為行業(yè)向前發(fā)展的連續(xù)性線索,因為技術、平臺和市場地位不斷變化和發(fā)展。

Khronos Group 是一個非營利性標準聯(lián)盟,任何公司都可以加入,擁有超過 150 名成員。所有標準組織的存在都是為了為競爭者提供一個安全的場所,讓他們?yōu)榱怂腥说睦孢M行合作。Khronos Group 的專業(yè)領域是創(chuàng)建開放、免版稅的 API 標準,使軟件應用程序庫和引擎能夠利用硅加速的力量來滿足要求苛刻的用例,例如 3D 圖形、并行計算、視覺處理和推理。

創(chuàng)建嵌入式機器學習應用程序

許多互操作部分需要協(xié)同工作來訓練神經(jīng)網(wǎng)絡并將其成功部署在嵌入式加速推理平臺上——如圖 1 所示。有效的神經(jīng)網(wǎng)絡訓練通常需要大型數(shù)據(jù)集,使用浮點精度并在強大的 GPU 上運行- 加速臺式機或云端。訓練完成后,經(jīng)過訓練的神經(jīng)網(wǎng)絡將被引入為快速張量操作優(yōu)化的推理運行時引擎,或?qū)⑸窠?jīng)網(wǎng)絡描述轉(zhuǎn)換為可執(zhí)行代碼的機器學習編譯器。無論使用引擎還是編譯器,最后一步都是在從 GPU 到專用張量處理器的各種加速器架構之一上加速推理代碼。

pYYBAGLH5cmAXuFCAAJhgp-Opv4100.png

圖 1. 訓練神經(jīng)網(wǎng)絡并將其部署在加速推理平臺上的步驟

那么,行業(yè)開放標準如何幫助簡化這一過程呢?圖 2. 說明了在視覺和推理加速領域中使用的 Khronos 標準。總的來說,隨著處理器頻率擴展讓位于并行編程作為以可接受的成本和功率水平提供所需性能的最有效方式,人們對所有這些標準的興趣越來越大。

pYYBAGLH5dOASBtiAAIJ445kYak388.png

圖 2. 用于加速視覺和推理應用程序和引擎的 Khronos 標準

從廣義上講,這些標準可以分為兩組:高級和低級。高級 API 側重于易于編程,具有跨多個硬件架構的有效性能可移植性。相比之下,低級 API 提供對硬件資源的直接、顯式訪問,以實現(xiàn)最大的靈活性和控制。每個項目都必須了解最適合其開發(fā)需求的 API 級別。此外,高級 API 通常會在其實現(xiàn)中使用低級 API。

讓我們更詳細地了解其中的一些 Khronos 標準。

SYCL - C++ 單源異構編程

SYCL(發(fā)音為“鐮刀”)使用 C++ 模板庫來調(diào)度標準 ISO C++ 應用程序的選定部分以卸載處理器。SYCL 使復雜的 C++ 機器學習框架和庫能夠直接編譯并加速到在許多情況下優(yōu)于手動調(diào)整代碼的性能水平。如圖 3 所示,默認情況下,SYCL 是通過較低級別的 OpenCL 標準 API 實現(xiàn)的:將用于加速的代碼提供給 OpenCL,而剩余的主機代碼則通過系統(tǒng)的默認 CPU 編譯器提供。

poYBAGLH5dqAFG0OAAI8w6STPIc221.png

圖 3. SYCL 將標準 C++ 應用程序拆分為 CPU 和 OpenCL 加速代碼

越來越多的 SYCL 實現(xiàn),其中一些使用專有后端,例如 NVIDIA 的 CUDA 用于加速代碼。值得注意的是,英特爾的新 oneAPI Initiative 包含一個名為 DPC++ 的并行 C++ 編譯器,它是基于 OpenCL 的符合 SYCL 實現(xiàn)。

NNEF——神經(jīng)網(wǎng)絡交換格式

當今使用的神經(jīng)網(wǎng)絡訓練框架有數(shù)十種,包括 Torch、Caffe、TensorFlow、Theano、Chainer、Caffe2、PyTorch 和 MXNet 等等,并且都使用專有格式來描述他們訓練的網(wǎng)絡。還有數(shù)十種甚至數(shù)百種嵌入式推理處理器進入市場。迫使許多硬件供應商理解和導入如此多的格式是一個典型的碎片問題,可以通過如圖 4 所示的開放標準來解決。

pYYBAGLH5eKAShmEAASIIpYpJyE961.png

圖 4. NNEF 神經(jīng)網(wǎng)絡交換格式通過推理加速器簡化訓練網(wǎng)絡的攝取

NNEF 文件格式旨在在網(wǎng)絡訓練和推理芯片領域之間架起一座有效的橋梁——Khronos 久經(jīng)考驗的多公司治理模型讓硬件社區(qū)對格式如何以一種滿足開發(fā)處理器工具鏈和框架的公司,通常在安全關鍵市場。

NNEF 并不是業(yè)界唯一的神經(jīng)網(wǎng)絡交換格式,ONNX 是由 Facebook 和微軟共同創(chuàng)立的開源項目,是一種被廣泛采用的格式,主要專注于訓練框架之間的網(wǎng)絡交換。NNEF 和 ONNX 是互補的,因為 ONNX 跟蹤培訓創(chuàng)新和機器學習研究社區(qū)的快速變化,而 NNEF 的目標是嵌入式推理硬件供應商,這些供應商需要一種具有更深思熟慮的路線圖演變的格式。Khronos 圍繞 NNEF 發(fā)起了一個不斷發(fā)展的開源工具生態(tài)系統(tǒng),包括來自關鍵框架的導入器和導出器以及一個模型動物園,以使硬件開發(fā)人員能夠測試他們的推理解決方案。

OpenVX – 便攜式加速視覺處理

OpenVX(VX 代表“視覺加速”)通過提供圖形級抽象來簡化視覺和推理軟件的開發(fā),使程序員能夠通過連接一組函數(shù)或“節(jié)點”來構建他們所需的功能。這種高級抽象使芯片供應商能夠非常有效地優(yōu)化他們的 OpenVX 驅(qū)動程序,以便在幾乎任何處理器架構上高效執(zhí)行。隨著時間的推移,OpenVX 在原始視覺節(jié)點旁邊添加了推理功能——畢竟神經(jīng)網(wǎng)絡只是另一個圖!通過將 NNEF 訓練的網(wǎng)絡直接導入 OpenVX 圖中,OpenVX 和 NNEF 之間的協(xié)同作用越來越大,如圖 5 所示。

pYYBAGLH5euADsg7AAJ1aNHA8U4884.png

圖 5. OpenVX 圖可以描述從 NNEF 文件導入的視覺節(jié)點和推理操作的任意組合

OpenVX 1.3 于 2019 年 10 月發(fā)布,使針對垂直細分市場(例如推理)的精心挑選的規(guī)范子集能夠被實施和測試,使其符合官方標準。OpenVX 還與 OpenCL 深度集成,使程序員能夠添加自己的自定義加速節(jié)點以在 OpenVX 圖形中使用 - 提供簡單的可編程性和可定制性的獨特組合。

OpenCL – 異構并行編程

OpenCL 是一種低級標準,用于對 PC、服務器、移動設備和嵌入式設備中的各種異構處理器進行跨平臺并行編程。OpenCL 提供了基于 C 和 C++ 的語言來構建內(nèi)核程序,這些內(nèi)核程序可以在具有 OpenCL 編譯器的系統(tǒng)中的任何處理器上并行編譯和執(zhí)行,從而為程序員明確控制在哪些處理器上執(zhí)行哪些內(nèi)核。OpenCL 運行時協(xié)調(diào)加速器設備的發(fā)現(xiàn),為選定的設備編譯內(nèi)核,以復雜的同步級別執(zhí)行內(nèi)核并收集結果,如圖 6 所示。

poYBAGLH5fOAQRVmAAEds4YdBAc603.png

圖 6. OpenCL 使 C 或 C++ 內(nèi)核程序能夠跨異構處理器的任意組合并行編譯和執(zhí)行

OpenCL 在整個行業(yè)中廣泛使用,為計算、視覺和機器學習庫、引擎和編譯器提供最低的“接近金屬”執(zhí)行層。

OpenCL 最初是為在高端 PC 和超級計算機硬件上執(zhí)行而設計的,但在與 OpenVX 類似的演變過程中,需要 OpenCL 的處理器越來越小,精度越來越低,因為它們以邊緣視覺和推理為目標。OpenCL 工作組正在努力定義為嵌入式處理器量身定制的功能,并使供應商能夠交付針對關鍵功耗和成本敏感用例的選定功能,并且完全符合要求。

審核編輯:郭婷

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    19432

    瀏覽量

    231258
  • 計算機
    +關注

    關注

    19

    文章

    7546

    瀏覽量

    88689
  • 編譯器
    +關注

    關注

    1

    文章

    1642

    瀏覽量

    49305
收藏 人收藏

    評論

    相關推薦

    什么是嵌入式人工智能

    嵌入式人工智能是指將人工智能技術應用于嵌入式系統(tǒng)中的一種技術。嵌入式系統(tǒng)是嵌入到其他設備或系統(tǒng)中的計算機系統(tǒng),通常
    的頭像 發(fā)表于 12-11 09:23 ?427次閱讀
    什么是<b class='flag-5'>嵌入式</b>人工智能

    嵌入式和人工智能究竟是什么關系?

    、連接主義和深度學習等不同的階段。目前,人工智能已經(jīng)廣泛應用于各種領域,如自然語言處理、計算機視覺、智能推薦等。 嵌入式系統(tǒng)和人工智能在許多方面都存在密切的關聯(lián)性。首先,嵌入式系統(tǒng)可
    發(fā)表于 11-14 16:39

    ARMxy嵌入式計算機在機器視覺中的卓越表現(xiàn)

    嵌入式視覺是指在嵌入式系統(tǒng)中使用計算機視覺技術,與經(jīng)常所說的機器視覺系統(tǒng)的區(qū)別在于嵌入式
    的頭像 發(fā)表于 10-10 14:47 ?310次閱讀
    ARMxy<b class='flag-5'>嵌入式</b>計算機在機器<b class='flag-5'>視覺</b>中的卓越表現(xiàn)

    嵌入式主板是什么意思?嵌入式主板全面解析

    嵌入式主板,通常被稱為嵌入式系統(tǒng)的核心組件,是一種用于控制和數(shù)據(jù)處理的計算機硬件,其設計旨在嵌入特定設備中執(zhí)行專門任務。嵌入式主板如同是設備
    的頭像 發(fā)表于 09-30 10:05 ?1012次閱讀

    飛凌嵌入式「在線文檔」功能上線 | 開放靈活,盡在掌握

    在忙碌的研發(fā)過程中,效率十分關鍵,飛凌嵌入式深知“便捷獲取最新資料”的重要性,為此全新上線【在線文檔】功能——進入飛凌嵌入式官網(wǎng),產(chǎn)品資料全面升級為在線文檔形式,旨在為客戶帶來更加開放與靈活的使用體驗。
    的頭像 發(fā)表于 09-13 09:46 ?401次閱讀
    飛凌<b class='flag-5'>嵌入式</b>「在線文檔」功能上線 | <b class='flag-5'>開放</b>靈活,盡在掌握

    嵌入式linux開發(fā)板芯片的工作原理

    嵌入式Linux開發(fā)板是一種基于Linux操作系統(tǒng)的嵌入式系統(tǒng)開發(fā)平臺,它廣泛應用于工業(yè)控制、智能家居、智能交通、醫(yī)療設備等領域。 嵌入式Linux開發(fā)板概述
    的頭像 發(fā)表于 09-02 09:07 ?477次閱讀

    Astra? SL系列SL1680詳細介紹,嵌入式物聯(lián)網(wǎng)處理器

    Astra? SL系列嵌入式處理器是高度集成的AI原生Linux?和Android?的片上系統(tǒng)(SoC),針對多模式消費者、企業(yè)和工業(yè)物聯(lián)網(wǎng)工作負載進行硬件優(yōu)化,并配備了邊緣推理、安全、視頻、圖形
    的頭像 發(fā)表于 08-15 10:32 ?340次閱讀
    Astra? SL系列SL1680詳細介紹,<b class='flag-5'>嵌入式</b>物聯(lián)網(wǎng)處理器

    機器視覺嵌入式中的應用

    機器視覺嵌入式系統(tǒng)中的應用是一個廣泛而深入的話題,涉及到許多不同的領域和技術。 機器視覺嵌入式系統(tǒng)中的應用 1. 引言 機器視覺是一種模
    的頭像 發(fā)表于 07-16 10:30 ?615次閱讀

    嵌入式學習-飛凌嵌入式ElfBoard ELF 1板卡-如何移植NCNN?

    在計算機視覺和深度學習領域,NCNN(Netural Network Computer Vision)是一個輕量級的神經(jīng)網(wǎng)絡計算框架,被廣泛應用于各類嵌入式設備和移動平臺。今天,讓我們一同跟隨共創(chuàng)
    發(fā)表于 05-29 17:24

    嵌入式技術領域的視覺、安全與AI應用

    本次2024年度德國版嵌入式世界展的大獎評選共收到全球百余家企業(yè)的申請,經(jīng)由評審團嚴格篩選,最終選出三項候選提名,并于會場進行了隆重的頒獎儀式。其中,嵌入式視覺、安全與安防、人工智能等應用領域備受矚目。
    的頭像 發(fā)表于 04-29 11:20 ?421次閱讀

    AI與開源力推嵌入式系統(tǒng)創(chuàng)新升級

    AMD在此次展會上宣布擴大AMD Versal?自適應片上系統(tǒng)(SoC)產(chǎn)品線,推出全新第二代Versal AI Edge和Versal Prime系列自適應SoC。該系列將預處理、AI推理和后處理集成于單一器件中,為AI驅(qū)動的嵌入式系統(tǒng)提供全方位
    的頭像 發(fā)表于 04-29 11:11 ?599次閱讀

    嵌入式主板,你了解多少?

    嵌入式主板,也稱為嵌入式計算機主板,是一種專門設計用于嵌入式系統(tǒng)的計算機主板。與臺式機和筆記本電腦中使用的常規(guī)主板不同,嵌入式主板設計
    的頭像 發(fā)表于 04-17 15:11 ?1694次閱讀

    嵌入式熱門發(fā)展方向有哪些?

    熱門發(fā)展方向,包括但不限于: 1.物聯(lián)網(wǎng): 隨著物聯(lián)網(wǎng)的快速發(fā)展,嵌入式系統(tǒng)在物聯(lián)網(wǎng)領域的應用也越來越廣泛。嵌入式系統(tǒng)可以用于物聯(lián)網(wǎng)設備的控制、監(jiān)測和數(shù)據(jù)處理等方面。例如,在服務領域,如遠程點菜器等
    發(fā)表于 04-11 14:17

    嵌入式fpga是什么意思

    嵌入式FPGA是指將FPGA技術集成到嵌入式系統(tǒng)中的一種解決方案。嵌入式系統(tǒng)是一種為特定應用而設計的計算機系統(tǒng),它通常包括處理器、內(nèi)存、外設接口等組件,并且被嵌入到更大的設備或系統(tǒng)中,
    的頭像 發(fā)表于 03-15 14:29 ?1397次閱讀

    fpga是嵌入式

    FPGA(現(xiàn)場可編程門陣列)不是嵌入式系統(tǒng),但FPGA在嵌入式系統(tǒng)中有著重要的應用。
    的頭像 發(fā)表于 03-14 17:19 ?2544次閱讀
    主站蜘蛛池模板: 日本三级黄在线观看 | yy6080一级毛片高清 | 中日韩在线视频 | 亚洲综合啪啪 | 5060精品国产福利午夜 | 一区二区三区四区在线 | 色婷婷综合和线在线 | 你懂的网站在线播放 | 激情网页 | 377p亚洲欧洲日本大胆色噜噜 | 亚洲一区二区三区高清视频 | 色综合色综合色综合色综合网 | 国产精品毛片久久久久久久 | 天天干天天草天天 | 精品国产免费一区二区 | 最近最新中文字幕在线第一页 | 天天爽夜夜爽一区二区三区 | 国产色秀视频在线观看 | 色777777女人色| 一级毛片日韩 | 亚洲国产成人在线 | 青青热久免费精品视频在线观看 | www干| 日本老师xxxxxxxxx79| 免费日本黄色网址 | 久久国产乱子伦精品免费看 | 俺也射 | 一区二区三区四区在线观看视频 | 中年艳妇乱小玩 | 久久精品国产精品亚洲红杏 | 四虎影院永久免费观看 | 91免费网站在线看入口黄 | 日本三黄色大 | 天堂网在线最新版官网 | 中文字幕在线观看一区 | 久久影院午夜伦手机不四虎卡 | 免费一级特黄特色大片在线观看 | 天天干天天要 | 国产资源网站 | 精品国产欧美一区二区最新 | 69久久夜色精品国产69小说 |