作者:Arm 物聯(lián)網(wǎng)事業(yè)部軟件產(chǎn)品管理總監(jiān) Christophe Fava-Rivi
Arm Cortex-A320 CPU 的推出具有重要的里程碑意義。作為首個基于 Armv9 架構(gòu)的超高能效 CPU,這一突破性的處理器為功耗有限的設(shè)備引入了此前僅在尖端移動計算解決方案中使用的先進(jìn)功能,使其在人工智能 (AI) 處理、安全性和整體能效方面均實(shí)現(xiàn)了顯著提升。
鑒于已有其他 Arm 處理器在為多樣化的邊緣側(cè)和端點(diǎn)設(shè)備提供良好支持,為何還要將 Armv9 功能引入一款服務(wù)相同目標(biāo)設(shè)備的處理器技術(shù)中呢?答案是順“時”而為。
當(dāng)今的物聯(lián)網(wǎng) (IoT) 環(huán)境對邊緣設(shè)備的需求更勝以往。智能攝像頭需要在本地運(yùn)行復(fù)雜的計算機(jī)視覺算法;工業(yè)傳感器須處理復(fù)雜的機(jī)器學(xué)習(xí) (ML) 模型以進(jìn)行預(yù)測性維護(hù);即使是簡單的端點(diǎn)設(shè)備,也越來越離不開增強(qiáng)的安全性和虛擬化功能。這些不斷變化的需求使得 Armv9 的先進(jìn)功能不再只是錦上添花,而是新一代物聯(lián)網(wǎng)創(chuàng)新的必備條件。
Armv9 架構(gòu)將 Cortex-A320 的革新功能帶到了邊緣側(cè),通過可伸縮向量擴(kuò)展(SVE2) 等關(guān)鍵的 Armv9 特性,增強(qiáng)了 AI 和數(shù)字信號處理 (DSP) 性能;同時,它還利用了內(nèi)存標(biāo)記擴(kuò)展 (MTE) 以及通過 Secure EL2 (S-EL2) 提供的先進(jìn)虛擬化支持等全面的安全特性。這些功能與 Cortex-A320 高能效的微架構(gòu)相結(jié)合,使其能夠維持嚴(yán)格的能耗預(yù)算,并同時為邊緣 AI 處理開創(chuàng)新的可能性。
讓我們一同來跟隨本文探索這些功能。
采用通用 Armv9 架構(gòu)的優(yōu)勢
Armv9 架構(gòu)的一大突出特性是支持 SVE2。SVE2 有助于提升 DSP 任務(wù)性能,該特性使得處理復(fù)雜算法更加快速、高效。這對于 AI 和 ML 工作負(fù)載等需要高算力的應(yīng)用特別有助益。借助 SVE2,智能攝像頭可以更高效地處理視頻流,語音接口能夠以更低的延遲進(jìn)行自然語言處理,而工業(yè)傳感器則可在保持長時間電池續(xù)航的同時,運(yùn)行復(fù)雜的分析算法。
Cortex-A320 先進(jìn)的安全性
安全性在當(dāng)今的數(shù)字時代至關(guān)重要。為滿足這一需求,Cortex-A320 采用了 MTE、指針驗(yàn)證 (PAC) 和分支目標(biāo)識別 (BTI) 等先進(jìn)的安全特性,并協(xié)同發(fā)揮作用,以防御各種網(wǎng)絡(luò)安全威脅。
MTE 有助于檢測和減少 C/C++ 程序中常見的內(nèi)存安全漏洞。通過對內(nèi)存分配進(jìn)行標(biāo)記,并在訪問時檢查這些標(biāo)記,MTE 可以識別并防范潛在的安全漏洞。PAC 通過確保函數(shù)指針和返回地址的完整性,為系統(tǒng)增加了一層額外的安全保護(hù),以減少攻擊者利用軟件漏洞的機(jī)會。而 BTI 則是通過確保間接分支僅指向有效位置,來保護(hù)系統(tǒng)免受控制流攻擊。
S-EL2 虛擬化增強(qiáng)隔離性
虛擬化是現(xiàn)代計算中的一項(xiàng)關(guān)鍵技術(shù),它能夠高效利用資源并改善不同工作負(fù)載之間的隔離性。Cortex-A320 支持 S-EL2 虛擬化,增強(qiáng)了在同一硬件上運(yùn)行的虛擬機(jī)之間的隔離性。這在多用戶環(huán)境中尤為重要,因?yàn)樵诖祟惌h(huán)境中,不同的用戶或應(yīng)用共享相同的物理資源。
S-EL2 為虛擬機(jī)提供了一個安全的執(zhí)行環(huán)境,可確保敏感數(shù)據(jù)和操作不受其他虛擬機(jī)以及底層虛擬機(jī)監(jiān)控程序的影響。該級別的隔離對于維護(hù)云計算和邊緣計算場景中數(shù)據(jù)的完整性和機(jī)密性相當(dāng)重要。
為了保護(hù)敏感數(shù)據(jù)和代碼免受未經(jīng)授權(quán)的訪問,TrustZone 是 Arm 處理器內(nèi)置的安全特性,它創(chuàng)建了一個獨(dú)立且受保護(hù)的環(huán)境,確保關(guān)鍵任務(wù)與潛在威脅隔離運(yùn)行。另一個選擇是 Hafnium,這是一個針對 Arm 的 A 處理器的安全固件參考實(shí)現(xiàn),為受信任的應(yīng)用提供堅實(shí)根基,并增強(qiáng)了系統(tǒng)對網(wǎng)絡(luò)威脅的防護(hù)。
SVE2 提升 DSP 性能
SVE2 對于提升 Cortex-A320 的 DSP 能力至關(guān)重要。DSP 任務(wù)在音視頻處理、通訊及科學(xué)計算等眾多應(yīng)用中必不可少。SVE2 通過引入一系列新指令和數(shù)據(jù)類型,優(yōu)化了這些任務(wù)的處理性能,從而進(jìn)一步擴(kuò)展了 Armv9 架構(gòu)的功能。
例如,SVE2 引入了用于矩陣乘法的新指令,這一操作是許多 ML 算法的基礎(chǔ)。這些指令使得處理大數(shù)據(jù)集變得更加快速和高效,從而提高了 ML 工作負(fù)載的性能。此外,SVE2 還支持如 BF16 等專為 ML 和 AI 應(yīng)用優(yōu)化的新數(shù)據(jù)類型。
利用龐大的 Armv9 軟件生態(tài)系統(tǒng)
Cortex-A320 的一大優(yōu)勢在于,它與廣泛的 Armv9 軟件生態(tài)系統(tǒng)的兼容性。該生態(tài)系統(tǒng)涵蓋一系列專為新一代邊緣 AI 開發(fā)和優(yōu)化的工具、庫和框架,如高度優(yōu)化的編譯器(包括支持循環(huán)優(yōu)化的 LLVM、加密和 SIMD)等。超過 2,000 萬名的 Arm 開發(fā)者均能借助這一生態(tài)系統(tǒng),充分受益于最新的軟件技術(shù)進(jìn)展,進(jìn)而加速其應(yīng)用的開發(fā)。
Armv9 軟件生態(tài)系統(tǒng)支持 Linux 和安卓等主流的操作系統(tǒng),并能夠提供更出色的性能和安全特性,以及容器化和云開發(fā)方法。開發(fā)者可訪問 Arm 廣泛的工具和資源,高效地構(gòu)建和部署應(yīng)用。
運(yùn)行實(shí)時操作系統(tǒng)
Cortex-A320 兼容 Zephyr 等實(shí)時操作系統(tǒng) (RTOS),使其在物聯(lián)網(wǎng)和嵌入式應(yīng)用中的用途更為廣泛。Zephyr 是一款專為資源有限設(shè)備設(shè)計的可擴(kuò)展 RTOS,支持多種硬件架構(gòu)和通信協(xié)議,能夠?qū)崿F(xiàn)高效且可靠的開發(fā)。
Kleidi 賦能邊緣 AI 性能
Arm KleidiAI 是一款輕量級的開源 AI 庫。得益于關(guān)鍵的 ML 框架和運(yùn)行時集成,其優(yōu)化并加速了Cortex-A320 上的 AI 工作負(fù)載,使開發(fā)者能夠利用 Armv9 架構(gòu)的先進(jìn)功能和靈活性。Kleidi 優(yōu)化了跨不同工作負(fù)載的軟件級性能,以充分發(fā)揮 Arm CPU 上的 AI 加速。其高度優(yōu)化的內(nèi)核提升了 ExecuTorch、LiteRT(前身為 Tensorflow Lite)等主流 AI 框架性能,從而實(shí)現(xiàn)了更快速的邊緣 AI 執(zhí)行,以及 CPU 和 NPU 間順暢的工作負(fù)載靈活性。
現(xiàn)在,Arm Kleidi 將擴(kuò)展至物聯(lián)網(wǎng)領(lǐng)域,為新一代邊緣 AI 應(yīng)用釋放 CPU 性能。Kleidi 在嵌入式和物聯(lián)網(wǎng)用例中實(shí)現(xiàn)了顯著的性能加速。例如,在 Llama.cpp 上運(yùn)行微軟的 Tiny Stories 小語言模型時,Cortex-A320 的性能提升了近 70%。這一強(qiáng)大的組合簡化了 AI 開發(fā),并加速了數(shù)十億設(shè)備的性能,使開發(fā)者能夠更輕松地在恰當(dāng)?shù)臅r間和位置上執(zhí)行合適的 AI 工作負(fù)載。
Cortex-A320 塑造物聯(lián)網(wǎng)的未來
Cortex-A320 CPU 的推出標(biāo)志著計算技術(shù)的演進(jìn)歷程中的一個重要里程碑。憑借其先進(jìn)的特性和強(qiáng)大的架構(gòu),Cortex-A320 有望革新物聯(lián)網(wǎng)行業(yè),并為未來的創(chuàng)新應(yīng)用鋪平道路。廣泛采用的通用 Armv9 架構(gòu)、增強(qiáng)的安全特性、S-EL2 虛擬化、借助 SVE2 提升的 DSP 性能、與龐大的 Armv9 軟件生態(tài)系統(tǒng)的兼容性、對 Zephyr 等 RTOS 的運(yùn)行支持,以及 Arm Kleidi 的引入,使其成為開發(fā)者和企業(yè)的理想之選。
將 Armv9 功能引入超高能效設(shè)備為邊緣側(cè)的創(chuàng)新開辟了全新的可能性。開發(fā)者現(xiàn)在可以構(gòu)思并打造以前在功耗有限環(huán)境中無法實(shí)現(xiàn)的應(yīng)用,譬如在本地運(yùn)行復(fù)雜 AI 的智能攝像頭、實(shí)時處理復(fù)雜 ML 模型的工業(yè)系統(tǒng),以及在不犧牲電池續(xù)航情況下實(shí)現(xiàn)企業(yè)級安全性的物聯(lián)網(wǎng)設(shè)備。
無論你是在開發(fā)物聯(lián)網(wǎng)解決方案、AI 和 ML 應(yīng)用,還是構(gòu)建安全計算環(huán)境,Cortex-A320 都能為你提供 AI 時代所需的工具和能力,助你旗開得勝。
-
處理器
+關(guān)注
關(guān)注
68文章
19500瀏覽量
231627 -
ARM
+關(guān)注
關(guān)注
134文章
9200瀏覽量
370415 -
物聯(lián)網(wǎng)
+關(guān)注
關(guān)注
2914文章
45118瀏覽量
378881
原文標(biāo)題:深入了解 Armv9 架構(gòu)特性及優(yōu)勢,利用 Arm Cortex-A320 迎接行業(yè)未來革新
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
Arm Cortex-A320 CPU助力嵌入式設(shè)備實(shí)現(xiàn)高能效AI計算

Arm發(fā)布基于Armv9架構(gòu)的Cortex-A320處理器
Arm推出全球首個Armv9邊緣AI計算平臺
TMS320C55x DSP CPU參考指南

Arm Cortex-X925為用戶實(shí)際需求提供強(qiáng)勁性能
AM3517/AM3505高性能ARM Cortex-A8微處理器數(shù)據(jù)表

天璣9300旗艦芯:全大核CPU架構(gòu),性能與能效的提升
ARM Cortex-A53嵌入式開發(fā)平臺Android手冊
Arm推第三代邊緣AI加速器:Arm Ethos-U85

Imagination新推APXM-6200 CPU,性能超越Cortex-A53
適用于ARM Cortex?—A53處理器和FPGA TPS65219 數(shù)據(jù)表

適用于 ARM Cortex?—A53 處理器TPS65219-Q1數(shù)據(jù)表

適用于ARM Cortex—A53處理器和FPGA TPS65219數(shù)據(jù)表

適用于ARM? Cortex?-A8/A9 SOC 和 FPGA 的TPS65218電源管理數(shù)據(jù)表

適用于ARM Cortex?—A53 處理器TPS65219-Q1數(shù)據(jù)表

評論