在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CEVA NeuPro-M異構和安全處理器架構

星星科技指導員 ? 來源:嵌入式計算設計 ? 作者:Tiera Oliver ? 2022-07-11 09:25 ? 次閱讀

CEVA, Inc.推出的適用于人工智能機器學習AI/ML) 推理工作負載的最新一代處理器架構 NeuPro-M。

NeuPro-M針對 Edge AI 和 Edge Compute 的廣闊市場, 是一個自包含的異構架構,由多個專用協處理器和可配置的硬件加速器組成,可無縫同時處理深度神經網絡的各種工作負載,將性能提升 5 -15X 與其前身相比。

作為業界首創,NeuPro-M 支持片上系統 (SoC) 和異構 SoC (HSoC) 可擴展性,可實現高達 1,200 TOPS,并提供可選的穩健安全啟動和端到端數據隱私。

NeuPro–M 兼容處理器最初包括以下預配置內核:

NPM11 – 單個 NeuPro-M 引擎,在 1.25GHz 時高達 20 TOPS

NPM18 – 8 個 NeuPro-M 引擎,在 1.25GHz 時高達 160 TOPS

據該公司稱,在處理 ResNet50 卷積神經網絡時,單個 NPM11 內核實現了 5 倍的性能提升和 6 倍的內存帶寬減少,從而實現了高達每瓦 24 TOPS 的合適功率效率。

NeuPro-M 能夠處理所有已知的神經網絡架構,以及對下一代網絡(如轉換器、3D 卷積、自注意力和所有類型的遞歸神經網絡)的集成原生支持。NeuPro-M 經過優化,可處理 250 多個神經網絡、450 多個 AI 內核和 50 多個算法嵌入式矢量處理單元 (VPU) 確保基于未來的軟件支持新的神經網絡拓撲和 AI 工作負載的新進展。此外,CDNN 離線壓縮工具可以將 NeuPro-M 的 FPS/Watt 提高 5-10 倍,用于常見基準測試,而對準確性的影響最小。

NeuPro-M 異構架構由特定功能的協處理器和負載平衡機制組成,與前代產品相比,它們是性能和效率飛躍的主要貢獻者。通過將控制功能分配給本地控制器并以分層方式實現本地內存資源,NeuPro-M 實現了數據流的靈活性,可實現 90% 以上的利用率,并在任何給定時間防止不同協處理器和加速器的數據不足。 CDNN 框架通過實踐針對特定網絡、所需帶寬、可用內存和目標性能所采用的各種數據流方案來獲得最佳負載平衡。

NeuPro-M 架構亮點包括:

由 4K MAC(乘加)組成的主網格陣列,混合精度為 2-16 位。

用于權重和激活的 Winograd 變換引擎,將卷積時間減少 2 倍,并允許 8 位卷積處理,精度下降 《0.5%。

稀疏引擎可避免每層使用零值權重或激活的操作,從而獲得高達 4 倍的性能提升,同時降低內存帶寬和功耗。

完全可編程的向量處理單元,用于處理具有所有數據類型的新的不受支持的神經網絡架構,從 32 位浮點到 2 位二進制神經網絡 (BNN)。

可配置的權重和數據壓縮到 2 位,同時存儲到內存中,并在讀取時實時解壓縮,以減少內存帶寬。

動態配置的兩級存儲器架構可最大限度地減少因與外部 SDRAM 之間的數據傳輸而導致的功耗。

為了說明這些功能在 NeuPro-M 架構中的優勢,同時使用 Winograd 變換、稀疏引擎和低分辨率 4x4 位激活的正交機制,可將 Resnet50 等網絡的循環計數減少 3 倍以上和 Yolo V3。

由于神經網絡權重和偏差、數據集和網絡拓撲成為所有者的關鍵知識產權,因此需要保護它們免遭未經授權的使用。NeuPro-M 架構以可選的信任根、身份驗證和加密加速器的形式支持安全訪問。

對于汽車市場,NeuPro-M 內核及其 CEVA 深度神經網絡 (CDNN) 深度學習編譯器和軟件工具包符合汽車 ISO26262 ASIL-B 功能安全標準,并符合嚴格的質量保證標準 IATF16949 和 A-Spice。

結合 CEVA 的神經網絡編譯器 CDNN 及其強大的軟件開發環境,NeuPro-M 為客戶提供了一個完全可編程的硬件/軟件 AI 開發環境,以最大限度地提高他們的 AI 性能。CDNN 包含的軟件可以充分利用客戶的 NeuPro-M 定制硬件來優化功率、性能和帶寬。CDNN 軟件還包括一個內存管理器,用于減少內存和優化負載平衡算法,并廣泛支持各種網絡格式,包括 ONNX、Caffe、TensorFlow、TensorFlow Lite、Pytorch 等。CDNN 與常見的開源框架兼容,包括 Glow、tvm、Halide 和 TensorFlow,并在使用精度守恒方法的同時包括“層融合”和“訓練后量化”等模型優化功能。

NeuPro-M 可用于今天的主要客戶許可和今年第二季度的一般許可。NeuPro-M 客戶還可以從 CEVA 的異構 SoC 設計服務中受益,以幫助集成和支持系統設計和小芯片開發。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 存儲器
    +關注

    關注

    38

    文章

    7534

    瀏覽量

    164475
  • AI
    AI
    +關注

    關注

    87

    文章

    31843

    瀏覽量

    270628
  • 編譯器
    +關注

    關注

    1

    文章

    1642

    瀏覽量

    49330
收藏 人收藏

    評論

    相關推薦

    Ceva與賽微科技、AIZIP及Edge Impulse深化合作

    Ceva公司近期與賽微科技和AIZIP攜手,共同為Ceva-NeuPro-Nano嵌入式人工智能NPU(神經網絡處理器)提供了一系列預優化的人工智能模型。這些模型涵蓋了關鍵詞探知、人臉識別和說話者
    的頭像 發表于 01-16 16:14 ?172次閱讀

    CEVA Ceva-NeuPro-Nano NPU在AIoT和MCU市場大獲成功

    CEVA公司近日宣布,其屢獲殊榮的Ceva-NeuPro-Nano嵌入式AI NPU在人工智能物聯網(AIoT)和MCU市場上取得了顯著進展,成功贏得了多家客戶的青睞。這款NPU配備了增強的開發
    的頭像 發表于 01-15 17:23 ?418次閱讀

    Ceva-NeuPro-Nano NPU榮獲EE Awards Asia年度最佳IP/處理器產品獎

    近日,全球領先的半導體產品和軟件IP授權許可廠商Ceva公司宣布,其Ceva-NeuPro-Nano NPU在近期于中國臺北舉辦的亞洲金選獎(EE Awards Asia)中榮獲年度最佳IP/處理器
    的頭像 發表于 12-25 15:36 ?289次閱讀

    基于IMX8MM處理器Cortex-A核和Cortex-M核的RPMsg通信方案

    RPMsg全稱為 remote processor messages,是一種基于virtio的消息傳遞總線,專為異構處理器系統之間的通信設計。
    的頭像 發表于 12-06 10:07 ?1971次閱讀
    基于IMX8MM<b class='flag-5'>處理器</b>Cortex-A核和Cortex-<b class='flag-5'>M</b>核的RPMsg通信方案

    走進北大 | 算能RISC-V通用處理器設計成功開課

    芯片設計》是涉及到多個異構硬件子系統的體系架構設計和集成的系統性工程,該課程圍繞現代SoC芯片的體系架構和微架構實現技術,特別是高性能通用處理器
    的頭像 發表于 12-06 01:06 ?481次閱讀
    走進北大 | 算能RISC-V通用<b class='flag-5'>處理器</b>設計成功開課

    迅為3A6000_7A2000核心主板龍芯全國產處理器LoongArch架構

    ,也證明了國內有能力在自研 CPU 架構上做出一流的產品。 龍芯 3A6000 處理器采用龍芯自主指令系統龍架構(LoongArch),是龍芯第四代微架構的首款產品,主頻達到 2.5G
    發表于 10-12 11:25

    對稱多處理器和非對稱多處理器的區別

    隨著計算需求的日益增長,單處理器系統已經無法滿足高性能計算的需求。多處理器系統應運而生,它們通過將多個處理器集成到一個系統中來提高計算能力。在多處理器系統中,有兩種主要的
    的頭像 發表于 10-10 15:58 ?1387次閱讀

    簡述微處理器的指令集架構

    處理器的指令集架構(Instruction Set Architecture,ISA)是計算機體系結構中的核心組成部分,它定義了計算機能夠執行的指令集合、數據類型、寄存、內存訪問方式等,是連接
    的頭像 發表于 10-05 14:59 ?612次閱讀

    ARM處理器和CISC處理器的區別

    ARM處理器和CISC(復雜指令集計算機)處理器在多個方面存在顯著的區別。這些區別主要體現在架構原理、性能與功耗、設計目標、應用領域以及市場生態等方面。
    的頭像 發表于 09-10 11:10 ?591次閱讀

    淺談國產異構雙核RISC-V+FPGA處理器AG32VF407的優勢和應用場景

    傳統的ASIC(專用集成電路)設計,FPGA的靈活性使得其開發成本更低,且能夠快速響應市場變化。RISC-V的開源特性也進一步降低了開發成本。 安全性與可靠性 : 異構處理器可以通過硬件隔離等
    發表于 08-31 08:32

    處理器的指令集架構介紹

    處理器的指令集架構(Instruction Set Architecture,ISA)是計算機體系結構中至關重要的部分,它定義了微處理器能夠執行的操作和指令的集合,以及這些指令如何被組織、存儲
    的頭像 發表于 08-22 10:53 ?1652次閱讀

    嵌入式微處理器的分類 嵌入式微處理器的種類和型號

    的分類可以從多個角度進行劃分,比如架構、指令集、用途等。下面將從這些角度詳細介紹嵌入式微處理器的種類和型號。 一、架構分類 嵌入式微處理器架構
    的頭像 發表于 05-04 16:31 ?2411次閱讀

    嵌入式微處理器架構可分為

    嵌入式微處理器架構是指用于嵌入式系統的微處理器的設計和組織方式。嵌入式系統是指內嵌在其他電子設備中的計算機系統,它們通常用于實時控制、通信、處理數據等任務。嵌入式微
    的頭像 發表于 04-21 14:39 ?1242次閱讀

    嵌入式微處理器的基礎是什么

    要求的硬件和軟件技術。 在嵌入式微處理器的基礎上,我們可以考慮以下幾個方面進行詳細討論: 處理器架構和指令集:嵌入式微處理器通常在特定的指令集架構
    的頭像 發表于 04-21 14:34 ?1161次閱讀

    蘋果M3芯片相當于什么處理器

    蘋果M3芯片在性能上相當于英特爾的高端處理器,但具體與哪一款處理器完全對等是一個相對復雜的問題,因為兩者的架構、應用場景和優化方向都有所不同。
    的頭像 發表于 03-08 15:58 ?8835次閱讀
    主站蜘蛛池模板: 最新国产在线播放 | 午夜影音 | 美女黄色在线看 | 久久精品综合 | 黄色录像大全 | 欧美午夜免费观看福利片 | 34pao强力打造免费永久视频 | 国产二区三区 | 一区二区三区www | 日本高清视频成人网www | a天堂资源 | 色多多在线免费观看 | 欧美极品在线视频 | 能看毛片的网址 | 另类free性欧美护士 | 极品国产一区二区三区 | 久久精品亚洲精品国产欧美 | 男男之h啪肉np文 | 国产精品天天操 | 国语一级毛片私人影院 | 丁香网五月天 | 亚洲美女精品 | 六月丁香啪啪六月激情 | china国语对白刺激videos chinese国产videoxx实拍 | 天天插天天摸 | 日韩欧美卡一卡二卡新区 | 中文字幕一区二区三区在线不卡 | 亚洲一卡二卡在线 | 亚洲午夜一区 | 免费看日本大片免费 | 美女把尿口扒开让男人桶出水 | 国产精品丝袜在线观看 | 欧美黄色一级视频 | 久久久精品免费视频 | 亚洲最大黄色网址 | 可以免费观看的一级毛片 | 人人搞人人搞 | 国产乱理论片在线观看理论 | 国产精品永久免费 | 国产三级久久久精品三级 | 黄黄的网站 |