集成Helium的RA8 MCU支持什么?
Helium性能提升是通過處理寬128位矢量寄存器來實現的,這些寄存器可以通過一條指令保存多個數據元素 (SIMD)。在流水線執行階段,可能會有多個指令重疊。Cortex-M85是一個雙節拍CPU內核,可以在一個時鐘周期內處理兩個32位數據字,如圖1所示。乘法累加操作需要從內存加載到向量寄存器,然后進行乘法累加,這可能會在從內存加載下一個數據的同時發生。加載和乘法的重疊使CPU的性能是同等標量處理器的兩倍,而不會造成面積和功耗上的損失。
圖1 CM85是一個雙拍CPU
這意味著每個時鐘周期可以處理兩個32位字
Helium引入了150條新的標量和矢量指令,用于加速信號處理和機器學習,包括:
低開銷分支擴展(LOBE),用于優化分支和環路操作
允許有條件地執行向量中每個通道的通道預測
用于讀取和寫入非連續內存位置的矢量收集-加載和分散存儲指令,在實現循環緩沖區時很有用
DSP功能,例如用于FIR濾波器的循環緩沖器、用于FFT實現的位反轉尋址、圖像和視頻處理中的格式轉換
支持有限域算術、加密算法和糾錯的多項式數學
支持音頻/圖像處理中使用的8、16和32位定點整數數據,以及用于信號處理的ML和半精度、單精度和雙精度浮點數據
這些特性使支持Helium的MCU特別適合AI/ML和DSP類型的任務,而無需在系統中使用額外的DSP或硬件AI加速器,從而降低成本和功耗。
采用RA8M1 MCU的語音AI應用
瑞薩在一些AI/ML用例中成功展示了Helium的這種性能提升,與Cortex-M7 MCU相比,性能顯著提升——在某些情況下超過3.6倍。其中一個應用是在RA8M1上運行的語音命令識別用例,它實現了深度神經網絡(DNN),該網絡經過數千種不同的聲音進行訓練,并支持40多種語言。此語音應用程序對簡單的關鍵字識別進行了增強,并支持自然語言理解(NLU)的修改形式,該形式不僅依賴于命令單詞或短語,而是尋找意圖。這樣就可以使用更自然的語言,而不必記住確切的關鍵詞或短語。
語音實現利用了帶有Helium的Cortex-M85內核上提供的SIMD指令。RA8M1具有大容量內存、支持音頻采集,最重要的是,Cortex-M85內核和Helium實現了高性能和ML加速,因此非常適合此類語音AI解決方案。即使該解決方案在有和沒有Helium的情況下初步實現也表明,與基于 Cortex-M7的MCU相比,提高了2倍以上的推理性能,如圖2所示。
圖2 RA8M1 MCU上的語音AI應用展示了CM85在有和沒有 Helium的情況下比CM7的性能改進
很明顯,采用Helium的RA8 MCU無需任何額外的硬件加速即可顯著提高神經網絡性能,從而為實現更簡單的AI和機器學習用例提供了低成本、低功耗的選擇。
RA8系列產品介紹
RA8系列目前已有3款產品量產,包含RA8M1、RA8D1 及RA8T1。
RA8M1
此產品是RA8系列主流通用型MCU,適用于工業自動化、家用電器、智能家居、消費品、樓宇/家居自動化和醫療/保健細分市場中的各種高性能和計算密集型應用場景。同時由靈活軟件包(FSP)和一整套軟硬件開發工具提供全面支持。
RA8D1
此產品針對HMI應用,集成了高性能CM85內核和大內存,以及豐富的外設集,包括帶并行RGB和MIPI-DSI接口的高分辨率TFT-LCD控制器、2D繪圖引擎、16位攝像頭接口和多個外部內存接口,經過優化可滿足各種圖形和視覺AI應用的需求。同時由靈活軟件包(FSP)和一整套軟硬件開發工具提供全面支持。
RA8T1
此產品針對電機應用,不僅集成了高達2MB的大容量閃存、1MB SRAM(包括TCM)、PWM定時器、模擬功能、多種連接功能,還支持高級安全特性和安全功能。RA8T1產品組通過其高性能和豐富的集成功能,在用戶系統上實現高級電機控制或附加功能。RA8T1產品組支持靈活配置軟件包(FSP)和合作伙伴生態系統,以及電機控制評估套件、軟件和工具。
審核編輯:劉清
-
寄存器
+關注
關注
31文章
5363瀏覽量
121162 -
瑞薩電子
+關注
關注
37文章
2876瀏覽量
72406 -
fir濾波器
+關注
關注
1文章
95瀏覽量
19093 -
AI加速器
+關注
關注
1文章
69瀏覽量
8673 -
Cortex-M85
+關注
關注
0文章
13瀏覽量
553
原文標題:瑞薩電子RA8搭載強大的Arm CM85核 為邊緣AI應用提供支持(下)
文章出處:【微信號:瑞薩MCU小百科,微信公眾號:瑞薩MCU小百科】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論