在《深入淺出編譯優化選項(上)》中,我們介紹了如何在IAR Embedded Workbench編譯器中進行編譯優化等級配置、多文件編譯配置、靈活配置編譯優化選項作用域、鏈接階段優化選項配置等。
本文將進一步探索編譯優化技術,介紹編譯優化策略以及如何進行編譯優化微調項配置。如果把編譯優化等級選項看作粗調參數,那么編譯優化微調項就可以比作細調參數,幫助用戶進一步打磨關鍵代碼的體積和性能的最佳配比。
編譯優化等級如何對應到編譯優化策略
《深入淺出編譯優化選項(上)》一文中的“編譯器代碼構建過程”章節詳細介紹了代碼構建過程,如上圖所示。圖中右邊紅框內的內容為編譯過程中所實施的編譯優化策略,我們在配置編譯優化等級時,其實就是配置了一組相對應的編譯優化策略。
以IAR Embedded Workbench(基于EWARM v9.32.2)編譯器為例,通過菜單欄(Project -> Options)打開項目選項界面,選中“C/C++ Compiler”欄目,并且在右邊選項卡選中“Optimizations”,即可進行編譯優化選項配置,如下圖所示。
IAR Embedded Workbench共分為4個優化等級(None, Low, Medium, High),其中優化等級 “High” 又分為3個子優化等級(Balanced, Size, Speed)。下表總結各個優化等級對應的優化策略組合。
由上表可以看出,各個編譯優化等級包含了不同的編譯優化策略組合,每種組合都是IAR根據大量用戶使用經驗進行配比,因此設置編譯優化等級能夠滿足大多數軟件編譯優化的需求。但是我們也看到上表中4個優化等級對應了10個以上的編譯優化策略,如果能夠在設置編譯優化等級的基礎上,再使能對優化策略的精細配置,那么有助于用戶進一步打磨關鍵代碼的體積和性能的最佳配比。
編譯優化微調項配置
IAR Embedded Workbench編譯器作為一款業界領先的編譯工具鏈,除了提供最佳編譯性能之外,也提供了極其靈活的編譯優化選項配置來滿足上述需求。用戶除了可以進行編譯優化等級的配置外,IAR Embedded Workbench還提供了編譯優化微調項(Enabled transformations),在不同的編譯優化等級中,可以進一步打開或者關閉一些優化策略,使得用戶可以根據關鍵代碼需求配置出更加精準的編譯優化策略組合。
具體微調選項在下圖中所示:
公共子表達式消除(Common subexpression elimination)
在編譯器優化階段,消除程序中重復計算的表達式。如下圖示例,如果程序中存在多處使用相同的表達式,那么在進行“公共子表達式消除”優化后,只需要計算一次該表達式,然后將結果緩存起來供其他地方使用,從而減少程序的運行時間和計算量。
循環展開(Loop unrolling)
在編譯器優化階段,將循環體中的代碼復制多次,以減少循環次數和內存訪問次數,從而提高程序的執行效率。如下圖示例,如果程序中有一個循環體,每次循環都進行一次printf操作,那么在進行“循環展開”優化后,可以將循環體中的代碼復制多次,從而減少循環次數和內存訪問次數,從而提高程序的執行效率。
函數內聯(Function inline)
指的是在編譯器優化階段,將函數調用的代碼替換為函數本體代碼,從而減少函數調用的開銷和程序的執行時間。如下圖示例,如果程序中有一個函數調用語句,那么在進行“函數內聯”優化后,可以將函數調用語句替換為函數體中的代碼,從而避免了函數調用的開銷,同時也使得程序更加緊湊,提高程序的執行效率。
代碼移動(Code motion)
指的是在編譯器優化階段,將程序中的某些計算或操作移到可以共享的位置,以減少程序執行時的計算量和內存訪問次數,從而提高程序的效率。如下圖示例,如果程序中有多處重復計算相同的表達式,那么在進行“代碼移動”優化后,可以將這些計算移到一個共享的位置,只計算一次,并將結果緩存起來供其他地方使用,從而減少程序的計算量和內存訪問次數。
類型別名分析(Type-based alias analysis)
在嵌入式系統中,內存訪問往往是非常“昂貴”的操作,而內存的訪問速度會影響系統的響應速度和能耗。因此,在編寫嵌入式C代碼時,需要考慮如何盡可能減少內存訪問次數以提高系統的性能。"類型別名分析"是一種編譯器優化技術,可在編譯代碼時識別出哪些變量指向了同一個內存地址,從而可以更有效地使用內存,并避免在訪問內存時出現重復數據的加載和存儲。如下圖示例,優化后,使用臨時變量i(通常保存在CPU寄存器)進行計算并賦值給sum,而不使用*a,避免重新從內存中加載,從而提高運行性能。
靜態聚類(Static clustering)
指的是在編譯器優化階段,通過對代碼進行靜態分析,將相關的代碼組合在一起,以便在執行時能夠更好地利用硬件資源,提高程序的執行效率和響應速度。具體來說,“靜態聚類”技術會根據程序中的數據流分析,將具有相同數據依賴關系的代碼段組合成獨立的塊,然后為每個塊分配內存空間,并將其存儲在連續的物理內存地址上,以便在執行時能夠更好地利用緩存和預取機制,減少內存訪問延遲,提高程序的性能。
指令調度(Instruction scheduling)
指的是在編譯器優化階段,重新安排程序中指令的順序,將需要等待某些操作完成的指令與其他指令分離開來,以優化指令的執行順序,從而減少CPU流水線上的空閑時間和內存訪問次數,以提高運行性能。
矢量化(Vectorization)
“矢量化”將順序循環轉換為 NEON 硬件矢量操作,無需編寫匯編代碼或使用內部函數。這增強了便攜性。僅當目標處理器具有 NEON 功能并啟用了自動矢量化時,才會對循環進行矢量化。
編譯優化微調選項
對代碼體積和代碼性能的影響
以上編譯優化微調選項會對生成的代碼體積和性能產生不同的影響,用戶可以根據下表進行按需配置。
總結
了解各項編譯器優化選項的定義和使用,用戶就可以按照項目需求,嵌入式應用特點,靈活的配置編譯器優化,實現嵌入式軟件代碼性能和體積達到最佳平衡點。
IAR Embedded Workbench是一款業界領先的編譯工具鏈,除了提供卓越的性能之外,也提供了豐富靈活的編譯優化選項配置,可以幫助用戶在不同的嵌入式軟件應用需求下,都能配比出最佳代碼性能和代碼體積。
審核編輯:湯梓紅
-
IAR
+關注
關注
5文章
354瀏覽量
36780 -
函數
+關注
關注
3文章
4346瀏覽量
62972 -
C++
+關注
關注
22文章
2114瀏覽量
73857 -
代碼
+關注
關注
30文章
4827瀏覽量
69052 -
編譯器
+關注
關注
1文章
1642瀏覽量
49286
原文標題:深入淺出編譯優化選項(下)
文章出處:【微信號:IAR愛亞系統,微信公眾號:IAR愛亞系統】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論