從按下快門前就對照片進行即時銳化,到通話過程中實時消除背景噪音,再到離線狀態下與人工智能 (AI) 助手互動,端側 AI 正在重塑移動體驗。而 Arm 計算平臺正是實現這些無縫交互體驗的強勁驅動力。
隨著 AI 工作負載變得日益復雜且廣泛滲透至各個領域,移動開發者面臨的需求也與日俱增:他們需要在內存、電力和熱預算等嚴格且多樣化的限制下,實現實時且高效的性能表現,同時確保不會給應用及其工作負載增加額外的復雜性。
為了應對這些挑戰,Arm 推出了可伸縮矩陣擴展 2 (SME2) 技術,以直接在移動 CPU 上加速高強度的矩陣計算工作負載——這些工作負載對計算機視覺和生成式 AI 應用至關重要。SME2 是 Armv9 架構中的一組高級 CPU 指令,它基于 SME 升級、能夠在 AI 異構計算框架下,高效支持圖像處理、自然語言處理、語音生成等實時移動端推理任務。
開發者如何獲取 SME2 的優勢
移動開發者無需改動現有代碼、模型或應用程序,即可直接獲取 SME2 帶來的性能提升。這得益于 Arm 的軟件加速層——Arm KleidiAI,它能夠無縫集成到主流運行時庫和 AI 框架中,為開發者提供開箱即用的性能體驗。
得益于 KleidiAI 深入且廣泛的集成,SME2 已在 Google 專為安卓系統優化的神經網絡推理庫 XNNPACK 中實現支持。此外,SME2 也被集成至多個框架中,包括阿里巴巴 MNN、Google LiteRT 和MediaPipe、微軟 ONNX Runtime,以及 llama.cpp。這些集成意味著 SME2 已深度嵌入到軟件棧中。當設備支持并啟用 SME2 時,XNNPACK 會自動通過 KleidiAI 將矩陣計算密集型任務路由至 SME2,從而讓開發者在無需改動任何應用邏輯或基礎架構的情況下,直接實現性能提升。
與此同時,KleidiAI 不僅著眼于當下的性能加速,更是為滿足未來需求而設計。隨著 Arm 不斷推出新特性與架構升級,KleidiAI 將持續為所支持的 AI 框架和運行時庫帶來自動的性能提升,而無需開發者投入額外精力。
大規模 AI 性能與能效優化
搭載 SME2 增強硬件的安卓新機即將上市,開發者可率先通過硬件加速解鎖 AI 性能躍升。與此同時,SME2 已支持最新的 iOS 設備[1],只要應用中使用了集成 SME2 的 AI 框架,便可自動享受這些性能提升。
在搭載 SME2 增強硬件的設備上運行 Google Gemma 3 模型時,其聊天交互中的 AI 響應速度比未啟用 SME2 的同款設備快六倍。此外,僅用單個 CPU 核心,Gemma 3 便可在不到一秒的時間內啟動多達 800 字的文本摘要任務。目前,一家領先的獨立軟件供應商 (ISV) 已承諾將其應用中的大部分詞元 (token) 生成工作負載從云端遷移到移動端,這在一定程度上得益于端側 AI 能力的持續突破。
“
Google 安卓杰出軟件工程師 Iliyan Malchev 表示:借助 SME2 增強的硬件,更先進的 AI 模型(如 Gemma 3)能夠直接在各類設備上運行。隨著 SME2 的持續擴展,移動開發者能夠在不同生態系統中無縫部署下一代 AI 功能,從而為終端用戶帶來低延遲、廣泛可用的智能手機體驗。
”
除了性能的提升,SME2 還為 Arm 生態系統(如 iOS 與安卓)提供了可移植的解決方案。目前,已有 900 萬款應用在 Arm 計算平臺上運行,超過 2,200 萬名軟件開發者基于 Arm 平臺構建他們的應用和工作負載。
助力開發者構建 AI 的未來
對安卓開發者而言,他們只要將應用構建在集成了 KleidiAI 的 AI 框架和運行時庫之上,就能自動獲得 SME2 帶來的性能提升,并可在各類設備上無縫部署下一代 AI 功能。
開發者若提前布局,即可確保其應用在 SME2 增強硬件推向市場時實現優化,無需改動任何一行代碼,便可為用戶帶來更快的性能、更低的延遲以及更高的能效。
此外,Arm 還發布了開發者啟動平臺,幫助移動開發者充分利用 SME2 的技術優勢,通過豐富案例展示如何針對 KleidiAI 增強框架進行開發,從而默認激活硬件層面的最新加速能力。
作者:Arm 人工智能平臺和開發者平臺與服務高級副總裁 Alex Spinelli
-
ARM
+關注
關注
134文章
9353瀏覽量
377657 -
AI
+關注
關注
88文章
35164瀏覽量
280074 -
安卓
+關注
關注
5文章
2155瀏覽量
58707
原文標題:Arm SME2 技術加速安卓 AI 升級,驅動移動應用下一代功能革新
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
下一代高速芯片晶體管解制造問題解決了!
下一代PX5 RTOS具有哪些優勢
Arm 與微軟合作,為基于 Arm 架構的 PC 和移動設備應用提供超強 AI 體驗

NVIDIA 采用納微半導體開發新一代數據中心電源架構 800V HVDC 方案,賦能下一代AI兆瓦級算力需求

光庭信息推出下一代整車操作系統A2OS

納米壓印技術:開創下一代光刻的新篇章

雷諾下一代車載語音助手Reno將引入生成式AI技術
軟件定義汽車與AI驅動的車載技術革新
實現下一代具有電壓電平轉換功能的處理器、FPGA 和ASSP

下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理

評論