信息革命的浪潮正快速推進!隨著科技日新月異的發展,人工智能(AI) 的應用已悄然融入人們的日常生活,無論是 Google 的搜索引擎、Facebook 的推薦系統,還是電商平臺的銷售排行,AI 技術正潛移默化地改變著我們的生活方式。這些科技成果的普及,使得低成本、高效能的解決方案成為當下的關鍵需求。
同時,視覺相關的AI應用正以驚人的速度改變著我們的世界。無論是在汽車、工業還是醫療領域,其獨特價值都得到了充分展現。展望未來,隨著視覺AI技術的不斷進步,更多創新應用將逐步落地,深刻影響并重塑我們的日常生活和工作方式。以下是視覺AI在各領域的典型應用:
◆ 智能監控:通過實時目標檢測、行為分析和入侵預警,為智慧城市的安全管理提供有力支持。
◆ 智慧零售:借助顧客行為分析和智能貨架管理,優化購物體驗,同時提升銷售效率和運營效益。
◆ 醫療影像分析:輔助醫生進行精準診斷,例如腫瘤檢測與分析,從而提高醫療效率和診斷準確性。
◆ 工業質檢:利用視覺AI快速識別產品缺陷,確保生產質量的穩定性,并顯著提升生產效率。
◆ 自動駕駛:車載AI通過視覺處理技術分析道路環境、行人及障礙物,實時做出決策,大幅提升駕駛的安全性與可靠性。
邊緣計算(Edge Computing)將成為推動該技術發展的關鍵因素。隨著神經處理單元(Neural Processing Unit, NPU)的問世,計算性能實現了指數級提升,使機器學習和人工智能應用得以廣泛應用于移動設備、傳感器等多種硬件中,從而讓智能計算更加貼近人們的日常生活。為此,MemryX 推出了 MX3 AI 芯片,該芯片能夠提供每瓦高達 5 TOPS 的算力性能,并支持浮點數(Brain Floating Point)運算,以確保用戶模塊的計算精度。每顆芯片內置 10.5 MB 的靜態隨機存取存儲器(SRAM),用于模塊訪問,不會占用主系統資源。此外,最多可串聯 16 顆芯片以進一步擴展性能。

圖1 MemryX AI芯片規格示意圖
2024年,MemryX 重磅推出外掛式 MemryX MX3 AI 推理加速卡,采用 PCIe Gen3 M.2 M-Key 接口,具備高達 20 TOPS 的卓越計算性能,為各類工業電腦帶來即插即用的便捷體驗。該解決方案以“平臺升級,迎接AI智能時代”為設計理念助力企業與開發者輕松邁向人工智能領域。本方案特別結合了 Orange Pi 5 Plus (Rockchip RK3588) 與 MemryX AI 加速卡,構建出一套高性價比的智能解決方案。憑借 MemryX 提供的豐富軟件資源及對主流深度學習框架 (如 TensorFlow、PyTorch、ONNX) 的支持,即便是新手也能快速上手,輕松部署 AI 模型,實現智能應用開發。

圖2 基于 MemryX AI 加速卡結合 Rockchip RK3588 多路物體檢測解決方案優勢示意圖
憑借 MemryX 的強大運算能力,能夠輕松實現多路(Multi-Streamer) 的物體檢測(Object Detection)應用。只需要使用普通的USB攝像頭或通過網絡來源串聯,即可適用于市面上常見的停車場管理系統、智慧停車柱、智慧交通監控、商場人流檢測、居家無死角意外檢測等應用。現在就加入我們,體驗人工智能的無限魅力!讓 AI 助力您的創新,開創屬于您的智能應用時代!
搭配 MemryX 所構建的開發環境 Developer Hub,開發者能夠簡單且快速地上手將 TensorFlow Lite、ONNX、Pytorch、Keras 等熱門深度學習框架的模塊轉換為 MemryX MX3+ 芯片所需的 DFP 框架。并通過原廠豐富的示例應用與公共工具,即可一步步實現 AI 應用。

圖4 MemryX 開發環境示意圖
▼ 編譯器(Compiler)
神經編譯器提供多種功能,如多模型整合(Multi-Model)、模型剪枝(Model Cropping)、多路流輸入單一應用(Multiple Input Streams)、單路流輸入多個應用(Shared Input Stream)、混合精度權重(Mixed-Precision Weights)、模塊資源使用情況顯示(Resources Utilization)。通過簡單的命令行指令,能夠幫助開發者。快速轉換模塊將 Pytorch、Keras、Tensorflow、Tensorflow Lite、ONNX 等模型轉換為 MemryX DFP 模組格式。
▼ 運行時(Runtime)
提供優化的用戶體驗,利用 Benchmark 搭配模型庫能夠幫助開發者快速評估其硬件性能與準確度,并且提供多種開源示例 DEMO (MemryX_Example) 與簡潔有力的 API 能夠幫助開發者快速實現與部署AI應用。
加速器 API(Python,C/C++)
▼ 公用工具(Utility Tools)
模擬器 (Simulator):為 MemryX 提供一套軟件,以解決手頭沒有 MX3 芯片的開發者進行性能評估的問題。
可視化工具(Viewer):為 MemryX 提供的 GUI 界面,包含上述編譯器、模擬器、加速器。
檢查器(DFP Inspect):為 MemryX 提供的一套檢查 DFP 文件的工具。
如下圖所示,展示了更多實際的應用,如物體檢測、語義分割、車輛識別、深度估算、肢體識別、虛擬畫筆、人臉識別、車牌識別、表情檢測、圍欄警示等。都可以通過你的想象力與創造力,開發出更具潛力的殺手級應用!這里還提供了實際應用數據,大多數應用都能輕松達到每秒 30 幀以上的推理速度!并主打浮點數運算 (BF16),確保模型的準確性!潛力無限!

圖6 MemryX M3+ 芯片性能數據表
?場景應用圖

?展示板照片

?方案方塊圖

?核心技術優勢
◆ 采用浮點數 BF16 進行計算,確保模塊準確度:
模塊設計以 BF16(Brain Floating Point 16)為基礎進行運算,相較于傳統的浮點數格式,BF16 能夠在大幅減少內存使用量的同時,仍然提供接近 FP32 的計算準確度。這使其特別適合用于人工智能和深度學習模型的推理與訓練場景,確保結果的精確性。
◆ 不占用系統內存:
模塊運行時采用了獨立內存的架構,無需占用主系統的 RAM 資源,有效降低對系統整體性能的影響。這種設計特性確保模塊在高效運行的同時,仍然能為其他應用程序預留足夠的系統資源。
◆ 高度可擴展性:
支持連接多達 16 個模塊,通過模塊化設計實現高擴展性。這使得系統能夠根據需求靈活擴展計算能力,以應對不同場景的計算需求,例如需要更高性能的數據中心或邊緣計算。
◆ 最佳數據流優化,最大限度減少數據移動:
模塊內部針對數據流進行了高度優化設計,通過智能路由和緩存機制,能夠最大程度地減少數據在運行過程中的移動頻率,從而提升處理性能并降低延遲。此外,這樣的設計也有助于降低能耗,進一步增強系統的運行效率。
◆ 高性價比與低功耗解決方案:
將主平臺 Orange Pi 5 Plus 搭配 MemryX MX+ 的 AI 芯片,即可無痛升級為更高階的 AI 平臺,每秒能夠運行約 480 幀(YOLOv8)的物體檢測;且 MX3+ 擁有 5 TOPS/W 的性能表現,整套多路物體檢測解決方案僅耗電約 14 W。
◆ 多路應用的新概念:
相較于近年來興起的邊緣計算,將其概念套用到區域性場景或許是一個新穎且能夠大幅降低成本的解決方案。利用輕松易得的攝像頭,再搭配一臺智能工業主機,即可實現許多應用,并且能夠對前端的攝像頭進行任意更換與配置。
?方案規格
◆ 主平臺開發板采用 RockChip RK3588 平臺為基礎,搭載四顆 Cortex-A76 處理器與四顆 Cortex-A55 處理器,并提供高性能圖像處理器 Arm Mali-G610 與神經運算處理器 NPU 等強大核心架構。
◆ I/O Board 開發板提供強大的周邊配置,如 Gigabit Ethernet 千兆以太網、USB Type A/C 3.0 通用串行總線接口、HDMI 高清多媒體接口、M.2 E-Key 傳輸接口、M.2 M-Key 傳輸接口,并能夠通過擴展的 40 pin 針腳來模擬常用的 UART、I2C、SPI、CAN 等信號。
◆ MemryX MX3+ 芯片提供強大的 AI 運算能力(20 TOPS),以 PCIe Gen3 M.2 2280 M-Key 接口為主,其 M.2 加速卡搭載四顆 MX3+ 芯片,每顆芯片能夠提供 5 TOPS/W 的性能,并內置 10.5 MB 的靜態隨機存取存儲器用于存取模塊。支持 Linux 與 Windows 兩大操作系統,并提供豐富的軟件資源供開發者使用,能夠直接移植 Tensorflow、ONNX、Pytorch、Keras 等熱門的深度學習框架。
本文作者 大大通博主:ATU 伊布小編 (一部)
了解MPU技術整合、深度學習、電腦視覺技術與人工智能(AI)的發展等更多相關內容!
登錄大大通網站,向作者提問,下載方案技術文檔,了解更多資訊!
-
Rockchip
+關注
關注
0文章
76瀏覽量
18931 -
NPU
+關注
關注
2文章
308瀏覽量
19287
發布評論請先 登錄
相關推薦
RK3588核心板在邊緣AI計算中的顛覆性優勢與場景落地
《RK3588核心板:AIoT邊緣計算的革命性引擎,能否解鎖智能物聯新范式?》
有獎直播 | @4/8 輕松部署,強大擴展邊緣運算 AI 新世代

添越智創基于 RK3588 開發板部署測試 DeepSeek 模型全攻略
RK3588 原廠設計資料首次公開(規格書+原理圖+設計說明+DDR參考),速搶
米爾RK3576和RK3588怎么選?-看這篇就夠了
EPSON差分晶振SG3225VEN頻點312.5mhz應用于AI加速卡
基于迅為RK3568/RK3588開發板的AI圖像識別方案
基于迅為RK3588開發板的AI圖像識別方案
研華發布RK3588 SMARC 2.1核心模塊ROM-6881 助力機器視覺應用智能升級

基于RK3588核心板的AI邊緣計算網關設計方案

評論