在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MCUXpresso IDE下編譯優化等級設置方法

恩智浦MCU加油站 ? 來源:恩智浦MCU加油站 ? 作者:恩智浦MCU加油站 ? 2022-09-08 09:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

最近為了測試一款Cortex-M33產品性能達標,驗證團隊將coremark基準測試程序當作了一個測試用例,而在RTL環境里指定的 C 編譯器是標準GCC,當發現跑出來的 coremark程序測試結果與Arm給的Cortex-M33參考值4.02 CoreMark/MHz有一定差距,因此對這個問題進行了調查。

在Arm的Cortex-M33主頁,其備注了4.02 CoreMark/MHz參考值來自于 EEMBC官網上的一款恩智浦LPC55S69JBD100芯片跑出來的結果,頁面里備注了跑分結果是在Arm Clang Compiler v6.12下開啟最高優化等級 -Omax 下得到的,而驗證團隊用得是GCC,由此斷定問題大概率是由不同編譯器優化性能差異引起的,借著這個實際問題,今天就跟大家聊一聊MCUXpresso IDE下編譯優化等級設置方法。

注:本文使用的MCUXpresso IDE軟件版本是 v11.6.0_8187。

一、查看MCUXpresso的GCC版本

有朋友可能會覺得奇怪,文章開頭里明明聊得是GCC下coremark跑分問題,為何要引出MCUXpresso IDE?其實MCUXpresso IDE是恩智浦推出的免費集成開發環境,其底層編譯器就是標準GCC工具鏈,使用MCUXpresso IDE,我們就不用像使用GCC那樣手動準備相應Makefile去做編譯了。

因為我們是借助MCUXpresso IDE來測試GCC編譯優化性能,所以需要了解當前 GCC版本,可以在MCUXpresso IDE安裝目錄的如下路徑下找到GCC版本信息。

執行 arm-none-eabi-gcc.exe -v 命令即可知道其版本,MCUXpresso IDE v11.6 使用得是 GCC v10.3.1。

MCUXpressoIDE_11.6.0_8187ide oolsinarm-none-eabi-gcc.exe

MCUXpressoIDE_11.6.0_8187ide oolslibgccarm-none-eabi10.3.1

二、GCC支持的優化等級

既然咱們聊得是優化等級設置方法,首先我們得知道GCC下支持哪些優化等級,我們可以在MCUXpresso IDE安裝目錄或者GCC官網找到用戶手冊(gcc.pdf),手冊里面 Section 3.11 Options that Control Optimization 章節有詳細的解釋。

MCUXpressoIDE_11.6.0_8187ide oolssharedocgcc-arm-none-eabipdfgcc.pdf

https://gcc.gnu.org/onlinedocs/gcc-10.3.0/gcc.pdf

GCC本身支持非常多的優化策略小項,大概有如下 100 多個,可以在手冊里去看每個小項的具體解釋,了解了這些小項,我們在編譯時當然可以把這些策略參數按需加上去,不過這種方式顯然比較繁瑣。

6b364c9a-2f0e-11ed-ba43-dac502259ad0.png

GCC為了化繁為簡,將這些策略小項做了分類整理,形成了如下8個等級(基于代碼大小和運行速度兩個方向逐步加檔),我們在實際編譯時一般直接用這8個優化等級即可。

優化等級 策略解釋
-O0 不進行任何優化(如果沒有指定優化級別,即為此默認設置)。
-O或者-O1 在不影響編譯速度的前提下,盡量采用一些優化算法降低代碼大小和提高可執行代碼的運行速度。
- 此等級執行了 45 個策略小項。
-O2 犧牲部分編譯速度,采用幾乎所有的目標配置支持的優化算法,用以提高目標代碼的運行速度。
-此等級在-O1所有優化策略小項之上增加了 48 個策略小項。?
-O3 采取很多向量化算法,提高代碼的并行執行程度,比如利用現代CPU中的流水線,Cache等,目標是寧愿增加目標代碼的大小,也要拼命的提高運行速度。
-此等級在-O2所有優化策略小項之上增加了16個策略小項。
-Os 與-O3有異曲同工之妙,但兩者的目標不一樣,這個等級是為了盡量的降低目標代碼的大小,這對于存儲容量很小的設備來說非常重要。
-此等級在-O2所有優化策略小項之上減掉了 6 個策略小項,然后使能了 -finline-functions 策略。
-Ofast 不會嚴格遵循語言標準,會針對某些語言啟用部分優化,以達到最快的運行速度。
-此等級在-O3所有優化策略小項之上增加了 -ffast-math 和 -fallow-store-data-races 策略。
-Og 在保持快速編譯和良好調試體驗的同時,提供合理的優化級別。
-Oz 比-Os更激進的去降低目標代碼的大小,GCC v12.x之后的版本才引入。

三、MCUX下設置優化等級的三種方法

在 MCUXpresso IDE 工程里,我們有三種方法來設置優化等級,分別針對單個函數、單個源文件、整個工程源文件。

3.1 在源文件中設置

第一種優化等級設置方法主要針對單個函數,即使用 __attribute__ 來修飾函數(這其實是GCC下通用做法,與MCUX關系不大),經過修飾的函數可以不受 MCUXpresso IDE工程整體優化等級設置影響。

void __attribute__((optimize("O3"))) function(void)
{
    ...
}

第二種優化等級設置方法主要針對多個相鄰函數或者整個源文件,即使用如下 #pragma組合語句來修飾代碼(這也是GCC下通用做法,與MCUX關系不大),經過修飾的代碼也同樣不受MCUXpresso IDE工程整體優化等級設置影響。

#pragma GCC push_options     // 代碼作用范圍起始處
#pragma GCC optimize("O3")   // 代碼優化等級設置
void function1(void)
{
    ...
}
void function2(void)
{
    ...
}
...
#pragma GCC pop_options      // 代碼作用范圍結尾處

3.2 在IDE選項中設置

第三種優化等級設置方法主要針對工程全部源文件,即在MCUXpresso IDE工程選項里Optimization Level一欄項目里做切換選擇,這里基本上與 GCC v10.3 優化等級定義是一致的,但是缺少了 -Ofast 選項。

6b647174-2f0e-11ed-ba43-dac502259ad0.png

四、MCUX下設置-Ofast等級

使用一塊MIMXRT595-EVK開發板(主芯片為Cortex-M33內核),在其配套SDK 里的hello world工程基礎之上移植了coremark程序,在IAR v9.10最高優化等級下(High-Size No size constraints)得到了3.94 CoreMark/MHz的跑分,這很接近Arm基準值,但是在MCUXpresso IDE最高優化等級下(-O3)僅得到了2.76 CoreMark/MHz。

莫非是必須要在MCUXpresso IDE下開啟GCC的最快運行優化等級 -Ofast 才能得到理想coremark跑分,但是MCUXpresso IDE選項里并沒有 -Ofast 怎么辦?

別著急,剛才工程選項下還有Other optimization flags后門,我們在這里手動添加上 -Ofast 比 -O3 多的那兩個優化策略小項,以及MCUX團隊要求的 -fno-semantic-interposition 小項,這樣基本就等于 - Ofast 效果。

-ffast-math -fallow-store-data-races -fno-semantic-interposition

6ba61c50-2f0e-11ed-ba43-dac502259ad0.png

重新編譯,再跑一次 -Ofast 等級下的MCUXpresso IDE工程,發現coremark跑分結果并沒有比 -O3 等級下有多大提升。

想了想雖然跑不到IAR 上 3.94 CoreMark/MHz的高分有點不甘心,但是這也很正常嘛,免費的GCC編譯器如果能達到商業IAR編譯器那樣的效果,那人家商業編譯器還怎么收費呢,理解萬歲!

審核編輯:彭靜
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴

原文標題:MCUXpresso IDE下設置代碼編譯優化等級的幾種方法

文章出處:【微信號:NXP_SMART_HARDWARE,微信公眾號:恩智浦MCU加油站】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    IAR編譯優化等級設置介紹

    IAR擁有靈活的優化等級設置,包括不同等級和不同層級的編譯優化
    發表于 11-21 17:36

    如何使用MDK/MCUXpresso IDE/IAR工具編譯生成燒錄固件文件

    使用MDK/MCUXpresso IDE/IAR工具編譯生成燒錄固件文件。使用MCU BootUtility來加載hex文件或者bin文件或者是.srec文件進行一站式燒錄。默認情況
    發表于 11-04 06:55

    RISC-V MCU IDE MRS(MounRiver Studio)開發之: 設置函數的優化等級

    在嵌入式開發過程中,有時為了調試代碼,我們需要對單個函數或多個函數設置單獨的優化等級,下面以RISC-V MCU IDE MounRiver Studio(MRS)為例,介紹兩種添加函
    發表于 12-13 14:27

    MCUXpresso IDE怎么使用?

    為什么NXP的跨界 RT單片機沒有什么人用?教程也非常少。在外面其實很多人用的。 使用MCUXpresso IDE就更少。我不是開發技術。我是做產品設計的。先了解一怎么回事。希望大家指教。1
    發表于 01-12 06:14

    分享MCUXpresso IDE將關鍵函數重定向到RAM中執行的幾種方法

      大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是MCUXpresso IDE將關鍵函數重定向到RAM中執行的幾種方法。  前段時間痞子衡寫了一篇 《在IAR開發環
    發表于 02-10 06:44

    MCUXpresso IDE將應用程序RW段分散鏈接有哪幾種方法

    MCUXpresso IDE將應用程序RW段分散鏈接有哪幾種方法
    發表于 02-10 08:03

    求分享MCUxpresso IDE的LPC54113 ADC代碼和配置設置

    我需要 MCUxpresso IDE 的 LPC54113 ADC 代碼和配置設置
    發表于 04-10 07:51

    MCUXpresso IDE在Flash調試的注意事項

    大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是 MCUXpresso IDE 使用 J-Link 下載算法在 Flash 調試注意事項。 介紹一如何使用新生成的
    的頭像 發表于 12-23 13:53 ?1238次閱讀

    痞子衡嵌入式:MCUXpresso IDE將關鍵函數重定向到RAM中執行的幾種方法

      大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家分享的是MCUXpresso IDE將關鍵函數重定向到RAM中執行的幾種方法。  前段時間痞子衡寫了一篇 《在IAR開發環
    發表于 12-06 19:36 ?9次下載
    痞子衡嵌入式:<b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b><b class='flag-5'>下</b>將關鍵函數重定向到RAM中執行的幾種<b class='flag-5'>方法</b>

    LPC1768 MCUXpresso IDE環境使用完整64K內存的方法

    MCUXpresso IDE是NXP公司免費提供的一款針對自家平臺的IDE簡單來說就是 Eclipses 外加GCC編譯器和自家芯片平臺的IDE
    發表于 12-07 13:06 ?7次下載
    LPC1768 <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>環境<b class='flag-5'>下</b>使用完整64K內存的<b class='flag-5'>方法</b>

    不同IDE應用程序RW段分散鏈接的方法~

    今天痞子衡給大家介紹的是MCUXpresso IDE將應用程序RW段分散鏈接的幾種方法。早期的 MCU 芯片,一般都會嵌入內部 Flash 和 RAM,并且 Flash 和 RAM
    發表于 12-07 13:21 ?9次下載
    不同<b class='flag-5'>IDE</b><b class='flag-5'>下</b>應用程序RW段分散鏈接的<b class='flag-5'>方法</b>~

    MCUXpresso IDE下工程鏈接文件配置管理與自動生成機制介紹

    我們知道不同 IDE 鏈接文件語法是不一樣的,而恩智浦 MCUXpresso IDE 底層編譯器是 Arm GCC,因此其鏈接文件就是標準
    的頭像 發表于 11-17 10:41 ?3517次閱讀
    <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>下工程鏈接文件配置管理與自動生成機制介紹

    MCUXpresso IDE下生成鏡像文件的方法及其與IAR,MDK差異

    MCUXpresso IDE下生成鏡像文件的方法及其與IAR,MDK差異
    的頭像 發表于 09-28 17:05 ?1126次閱讀
    <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>下生成鏡像文件的<b class='flag-5'>方法</b>及其與IAR,MDK差異

    MCUXpresso IDE將源碼制作成Lib庫方法及其與IAR,MDK差異

    MCUXpresso IDE將源碼制作成Lib庫方法及其與IAR,MDK差異
    的頭像 發表于 11-07 17:13 ?1776次閱讀
    <b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b><b class='flag-5'>下</b>將源碼制作成Lib庫<b class='flag-5'>方法</b>及其與IAR,MDK差異

    如何在MCUXpresso IDE中測量能耗?

    如何在MCUXpresso IDE中測量能耗?
    的頭像 發表于 09-19 16:40 ?828次閱讀
    如何在<b class='flag-5'>MCUXpresso</b> <b class='flag-5'>IDE</b>中測量能耗?
    主站蜘蛛池模板: 美女把尿口扒开让男人桶出水 | 欧美色视频日本片免费高清 | 久青草久青草高清在线播放 | 手机在线看片福利盒子 | 操女人网址 | 久久综合97色综合网 | 黄色拍拍拍 | 色多多18免费观看 | 永久免费视频网站在线观看 | 日韩欧美在线中文字幕 | 国产精品久久久久久影院 | 日日日日人人人夜夜夜2017 | 黄色香蕉网站 | 操美女视频网站 | 中国三级视频 | 日本免费黄色网 | 国产午夜免费一区二区三区 | 天天爽夜夜爽夜夜爽精品视频 | 一二三区视频 | 人阁色第四影院在线观看 | 久久天天综合 | 色老头成人免费综合视频 | 久久国产免费福利永久 | 一级特黄女人生活片 | 91美女啪啪| 男女免费在线视频 | 久久91精品牛牛 | 日本人的色道www免费一区 | 成人网在线 | 国产热视频 | www.久久精品视频 | 男男生子大肚play做到生 | 欧美久久综合 | 天天做天天爽 | 性xxxx黑人与亚洲 | 岛国大片在线播放 | 国产成人综合欧美精品久久 | 日韩特黄特色大片免费视频 | 日日干夜夜操 | 色a4yy综合私人 | 天天透天天射 |