作者:Arm 終端事業部產品管理高級總監 Stefan Rosinger
在之前有關 Arm Cortex-X925 CPU 的文章中,Arm 技術專家曾探討了每時鐘周期指令數 (IPC) 作為評估 CPU 性能的關鍵指標的重要性。與主要將頻率作為性能指標的做法不同,IPC 衡量的是 CPU 每個時鐘周期內能處理的指令數。對于移動設備而言,電池續航和散熱管理是影響實際應用、用戶體驗和設備處理復雜工作負載的關鍵所在。因而,IPC 對于評估移動設備性能而言,至關重要。
更高的頻率 ≠ 最優表現
IPC 越高,表示在一個時鐘周期內執行的指令越多;即便時鐘速度較慢,也能帶來更好的性能。這對于內存受限的工作負載尤為重要,因為其性能會受到 CPU 外部因素的制約。更高的 IPC 使得 CPU 能以更低的頻率運行,從而減少電量消耗和功耗,設備發熱也會緩解。這對于需要保持穩定性能的移動設備來說,尤為有利。
雖然高頻 CPU 乍聽起來很有吸引力,但它并不能反映性能的全貌。頻率表示 CPU 每秒完成的時鐘周期數量,而 IPC 則表示每個周期所完成的工作量。事實上,最高頻率很少會用到。例如,對于游戲和其他算力要求較高的工作負載來說,并不會以最大頻率使用 CPU,大多數時間反而是以中檔頻率運行。此時的能效更高,可以延長電池續航時間并降低設備溫度,而這兩者是提升整體用戶體驗的重要指標。
在相同的時間周期內,具有更高 IPC 的 CPU 在處理實際應用和復雜工作負載時會表現出更優的性能。即便是當今具有復雜計算需求的 AI 應用(例如聊天機器人、實時語言翻譯和虛擬助手),在 IPC 更高的 CPU 上運行時也會表現得更加出色。此外,就能效而言,在一個周期內執行更多的指令意味著可以更快地完成任務,使得 CPU 處于高能耗狀態的時間減少,從而節省電池電量。
卓越的架構設計
在基于 Armv9 架構的 CPU 設計中,可伸縮向量擴展 (SVE2) 是提高 IPC 的關鍵所在。這一架構特性采用新的專用向量指令,是加速智能手機關鍵工作負載和應用的理想之選。
SVE2 可將 HDR 視頻解碼速度提高約 10%,這樣用戶在主流應用上觀看點播視頻時,能獲得更長的電池續航時間。此外,通過加速常用的圖像處理庫,SVE2 還增強了視頻通話期間用戶體驗的流暢度,同時提高了畫面質量。其中包括更好的攝像頭旋轉體驗,以及圖像濾鏡的切換和使用體驗。
不僅如此,SVE2 還不受向量長度的影響,這意味著代碼開發將支持更大的向量長度,例如 256 位。由此可確保與移動計算未來發展的兼容性,包括未來更注重邏輯擴展,而非 RAM 的先進工藝節點。移動端市場將因此能夠適應更大的向量長度,有利于游戲和 AI 模型中 SVE 代碼的呈現。
通過深入研究設計,IPC 性能可借助一系列特定的微架構改進得以提高。其中包括但不限于:
超標量亂序執行
分支預測和預取器
數據推測
適當的緩存選擇
Arm Cortex CPU 一直在逐年推進各種類似的微架構改進,以實現更高的性能水平。
面向移動端的最新 Armv9 CPU
上述的架構特性和微架構提升是 Arm 面向移動端市場的最新 Armv9 CPU 的核心所在。作為 MediaTek 天璣 9400(已被搭載于 vivo X200 系列等旗艦智能手機)的核心,Cortex-X925 對私有 L2 緩存進行了升級,從 2MB 增加到 3MB。再加上 Cortex-X925 能夠更加快速、高效地預取數據和復雜指令,從而顯著增強了 CPU 的整體性能和能效。得益于此,Arm 計算平臺在 2024 年實現了驚人的兩位數 IPC 性能提升。
如此一來,終端用戶能夠享受到一系列實際性能的提升,包括更快的應用響應速度、更好的游戲體驗、更流暢的視頻流媒體傳輸、更快的網頁瀏覽和順暢的多任務處理。同時,更高的 IPC 也帶來了能效的提升,延長了用戶的沉浸式體驗。
與此同時,Cortex-A725 作為 CPU 工作負載的主力,也進行了一系列針對性更新,著力于需要持續出色性能的關鍵 AI 和游戲用例。與 Cortex-A720 相比,Cortex-A725 的性能效率提升了 35%,能效提升了 25%。
在 Armv9.2 集群中,每個 CPU 組件都能應對廣泛的實際用例和復雜的工作負載。例如,Cortex-X925 可處理應用啟動和網頁瀏覽的“突發”工作負載,而 Cortex-A725 則可以在常見的移動端用例(包括游戲、網頁瀏覽、基于攝像頭的應用和視頻流媒體)中持續提供穩定性能,以延長設備的使用時間(即電量耗盡之前,用戶可在設備上使用某些用例的平均時間)。
打造無可比擬的移動端體驗
從根本上說,移動設備需要兼具性能與能效,而 IPC 的提升恰好能同時滿足這個需求。用戶因而能更長時間體驗各種需要高算力的應用。最新的 Armv9 CPU 將卓越的 IPC 水平與高時鐘頻率相結合,將性能和能效提升到一個更高的水平,從而為最終用戶帶來更加出色的用戶體驗。這也正是為什么全球 99% 的智能手機都基于 Arm 計算平臺打造的原因之一。
-
ARM
+關注
關注
134文章
9340瀏覽量
376122 -
cpu
+關注
關注
68文章
11063瀏覽量
216469 -
IPC
+關注
關注
3文章
365瀏覽量
53022 -
移動計算
+關注
關注
0文章
30瀏覽量
10371
原文標題:內有劇透!打造高性能、高能效移動計算的關鍵是?
文章出處:【微信號:Arm社區,微信公眾號:Arm社區】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
ARM Mali GPU 深度解讀
Arm 公司面向 PC 市場的 ?Arm Niva? 深度解讀
Arm 公司面向移動端市場的 ?Arm Lumex? 深度解讀
Arm 公司面向汽車市場的 ?Arm Zena? 深度解讀
Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能效與先進 AI 能力賦能物聯網革新

搶先試用此芯Armv9 AI PC開發套件瑞莎“星睿O6”

Arm Cortex-A320 CPU助力嵌入式設備實現高能效AI計算

評論