在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于STM32浮點運算單元FPU的應(yīng)用示例

茶話MCU ? 來源:ST MCU 信息交流 ? 作者:ST MCU 信息交流 ? 2021-01-02 18:09 ? 次閱讀

有人利用STM32芯片做些DSP處理,在啟用FPU單元進(jìn)行調(diào)試、驗證過程中可能會遇到些小問題、小困惑,這里通過STM32F4芯片一個具體的應(yīng)用示例簡單分享下,希望順便能給同仁提供些幫助或提醒。

我這里通過調(diào)用DSP庫里的FFT相關(guān)函數(shù)實現(xiàn)1024點的FFT運算,樣點數(shù)據(jù)及運算結(jié)果均為浮點數(shù)。

cf4aaab0-445e-11eb-8b86-12bb97331649.png

上圖中A區(qū)代碼是做樣點數(shù)據(jù)準(zhǔn)備,B區(qū)代碼完成FFT運算。我們來一起看看基本的配置以及不啟用硬件浮點單元和啟用硬件浮點單元執(zhí)行B區(qū)代碼的時間上的差別。

程序里要調(diào)用一些數(shù)學(xué)函數(shù),而這些數(shù)學(xué)函數(shù)往往集成在相應(yīng)的數(shù)學(xué)函數(shù)庫里。我們選用ARM公司的DSP數(shù)學(xué)庫,該庫系專門針對AMR核芯片及指令系統(tǒng)而組織的代碼,相比IDE自帶的通用數(shù)學(xué)函數(shù)庫會更優(yōu)化、高效。

目前該DSP數(shù)學(xué)庫包括基本數(shù)學(xué)函數(shù)、復(fù)數(shù)數(shù)學(xué)函數(shù)、濾波函數(shù)、矩陣函數(shù)等幾大塊,詳細(xì)內(nèi)容可以去ARM網(wǎng)站閱讀比較方便。【可點擊左下方原文鏈接前往】

cfc025ce-445e-11eb-8b86-12bb97331649.png

我們開發(fā)時,這些文件具體在哪里呢?在各個編譯環(huán)境的安裝目錄下都不難找到。不妨看看ARM keil MDK環(huán)境下它們所在位置。

d00fcdb8-445e-11eb-8b86-12bb97331649.png

上面我們看到的是DSP庫源文件所在目錄,在另一個目錄存放著基于不同內(nèi)核、不同存儲端格式以及是否支持硬件浮點單元而編譯出來的庫文件。我們在開發(fā)時,直接添加合適的庫文件進(jìn)工程即可,不必逐個查找源文件來添加。下圖就是可以用于ARM MDK環(huán)境的庫文件。【對于不同IDE,庫文件名后綴略有差異】

d0591e1e-445e-11eb-8b86-12bb97331649.png

這里以用于M4內(nèi)核的DSP數(shù)學(xué)函數(shù)庫稍作解釋,詳見下面表格。

d0c45cc4-445e-11eb-8b86-12bb97331649.png

從上表可以看出,基于Cortex M4內(nèi)核芯片進(jìn)行DSP運算可以能用到的庫有四個,但具體到STM32 基于M4內(nèi)核的芯片可以選用的只有兩個,即xxxM4l_math.lib或xxxM4lf_math.lib,因為STM32芯片的存儲設(shè)計都是小端模式。所謂小端模式,簡單點說就是指多字節(jié)數(shù)據(jù)在內(nèi)存中存儲時,按照低位字節(jié)對應(yīng)地址低位來存放,反之則為大端模式。

在上面截圖中,我還截取了對應(yīng)M0內(nèi)核可用的DSP數(shù)學(xué)庫,它為什么只有兩個?這是因為M0內(nèi)核沒有FPU硬件單元,不存在FPU是否啟用的可選情況。

現(xiàn)在就利用STM32F429開發(fā)板,基于開篇的截圖代碼進(jìn)行測試,并用定時器測量下面執(zhí)行代碼在不使用FPU和使用FPU分別所花費的時間,并計算二者的時間比。【注:STM32F429芯片自身是帶硬件FPU的】

d10e74ee-445e-11eb-8b86-12bb97331649.png

必要的配置和文件包含及添加,如下表所示:

d149fb18-445e-11eb-8b86-12bb97331649.png

基于上面條件執(zhí)行FFT運算代碼,不使用FPU和使用FPU的時間比為16。

采用相似的條件,基于IAR環(huán)境對相同功能代碼段進(jìn)行測試,不使用FPU和使用FPU的時間比為11。

關(guān)于這個時間比,除了跟是否使用微庫、優(yōu)化等級、浮點精度等有關(guān)外,跟你所選取的測試代碼也有很大關(guān)系,因為有些代碼只能靠CPU執(zhí)行的話,開不開FPU硬件單元對這部分時間是沒有影響的。不難理解,被測試代碼里只能靠CPU運行的代碼占比越多,上面的這個比值就會越小。一般來說,我們不必太過糾結(jié)這個值的大小,知道有這個硬件浮點單元,既減輕了CPU負(fù)荷,又可以提升計算速度就好。

另外,我們在做DSP相關(guān)應(yīng)用時,注意添加的DSP庫既要跟所用芯片匹配,還要跟IDE里的配置匹配。還是以上面測試代碼為例,本意是想啟用FPU,結(jié)果添加的DSP庫卻是基于不使用FPU硬件的數(shù)學(xué)庫,那會怎么樣呢?

d199418c-445e-11eb-8b86-12bb97331649.png

本應(yīng)該添加arm_cortexM4lf_math.h的,結(jié)果弄錯了。如果按照上面條件構(gòu)建ARM MDK工程,一路編譯下來沒有任何警告或錯誤提示。程序也能流暢運行,F(xiàn)FT運算結(jié)果似乎也出來了。

d1fd51ae-445e-11eb-8b86-12bb97331649.png

但仔細(xì)查看結(jié)果,跟之前正確配置的運行結(jié)果明顯不一樣。經(jīng)驗證核對,這次運算結(jié)果是錯的。為此我特意添加一行計算90°的正弦值代碼,它算出來結(jié)果竟然是1.5!逆天了。

d236a81e-445e-11eb-8b86-12bb97331649.png

如果說在不知情的情況下這一路下來,估計要被摧殘一頓了。畢竟很多數(shù)學(xué)函數(shù)結(jié)果常人是無法一眼能看出對錯的,即使看出錯了若沒未及時想到庫問題的話,恐怕還得折騰折騰。

針對這種情形,基于同樣代碼于IAR環(huán)境下測試,情況相比ARM MDK貌似要好點。至少編譯時有警告提示,提示引用沖突之類的。計算結(jié)果沒有MDK的那么具有隱蔽性【至少對于本次測試是這樣】,基本是清一色的0,頗有沖擊效果!當(dāng)然,此時讓它計算90°的正弦值結(jié)果也是明顯錯的。

d2617c24-445e-11eb-8b86-12bb97331649.png

感覺上,這種情形下,使用IAR時挖的坑似乎稍微淺些,更容易讓人警醒懷疑哪里出問題了。

好,就分享到這里,祝君好運!

原文標(biāo)題:關(guān)于STM32浮點運算單元FPU的小話題

文章出處:【微信公眾號:ST MCU 信息交流】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    459

    文章

    52243

    瀏覽量

    436737
  • STM32
    +關(guān)注

    關(guān)注

    2290

    文章

    11017

    瀏覽量

    362571
  • FPU
    FPU
    +關(guān)注

    關(guān)注

    0

    文章

    45

    瀏覽量

    21703

原文標(biāo)題:關(guān)于STM32浮點運算單元FPU的小話題

文章出處:【微信號:stmcu832,微信公眾號:茶話MCU】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點推薦

    STM32F429VGT6 ST(意法半導(dǎo)體) LQFP-100(14x14) 嵌入式 單片機(jī)以及規(guī)格參數(shù),應(yīng)用領(lǐng)域

    ### **STM32F429VGT6 規(guī)格參數(shù)** ? **1. 核心架構(gòu)** ? - **CPU**: ARM Cortex-M4 內(nèi)核,帶 FPU浮點運算
    的頭像 發(fā)表于 05-20 15:57 ?109次閱讀

    STM32H743VIT6 ST單片機(jī) 參數(shù)及應(yīng)用場景

    特性,廣泛應(yīng)用于工業(yè)控制、消費電子、醫(yī)療設(shè)備等領(lǐng)域。以下是其關(guān)鍵參數(shù)、應(yīng)用場景及市場前景分析: 一、關(guān)鍵參數(shù) 內(nèi)核與性能 Cortex-M7 內(nèi)核,主頻高達(dá) 480 MHz,支持雙精度浮點運算FPU
    的頭像 發(fā)表于 05-12 11:19 ?330次閱讀
    <b class='flag-5'>STM32</b>H743VIT6 ST單片機(jī) 參數(shù)及應(yīng)用場景

    MAX32670高可靠性、超低功耗微控制器技術(shù)手冊

    ? Cortex?-M4 (帶浮點運算單元FPU)。MAX32670也為傳統(tǒng)設(shè)計從8或16位微控制器升級提供了簡便、成本優(yōu)化的途徑。
    的頭像 發(fā)表于 05-08 11:48 ?204次閱讀
    MAX32670高可靠性、超低功耗微控制器技術(shù)手冊

    搭載32 位 RXv2 CPU內(nèi)核以及增強(qiáng)型DSP和FPU的RX231系列微控制器數(shù)據(jù)手冊

    RX231 系列器件充分利用 32 位 RXv2 CPU 內(nèi)核、經(jīng)過改進(jìn)的數(shù)字信號處理器(DSP)/浮點單元FPU)以及低功耗技術(shù)的最佳組合,實現(xiàn)了極高的電源效率。即使在低電流供電的環(huán)境下,也能
    的頭像 發(fā)表于 03-20 17:39 ?484次閱讀
    搭載32 位 RXv2 CPU內(nèi)核以及增強(qiáng)型DSP和<b class='flag-5'>FPU</b>的RX231系列微控制器數(shù)據(jù)手冊

    搭載32位RXv2 CPU內(nèi)核以及增強(qiáng)型DSP和FPU的RX230系列低功耗、高性能微控制器數(shù)據(jù)手冊

    RX230 系列器件充分利用了 32 位 RXv2 CPU 內(nèi)核、經(jīng)過改進(jìn)的數(shù)字信號處理器(DSP)/浮點單元FPU)以及低功耗技術(shù)的最佳組合,從而實現(xiàn)了極高的電源效率。即使在低電流供電能力的環(huán)境
    的頭像 發(fā)表于 03-20 17:26 ?516次閱讀
    搭載32位RXv2 CPU內(nèi)核以及增強(qiáng)型DSP和<b class='flag-5'>FPU</b>的RX230系列低功耗、高性能微控制器數(shù)據(jù)手冊

    FCP32C335——對標(biāo)TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設(shè)備!

    FCP32C335以TMS320F28335為標(biāo)桿,搭載150MHz主頻的32位浮點處理單元FPU),支持單周期32×32位乘法運算,單精度浮點
    的頭像 發(fā)表于 03-07 10:45 ?517次閱讀
    FCP32C335——對標(biāo)TI TMS320F28335的高性能DSP芯片,賦能工業(yè)控制與智能設(shè)備!

    【RA-Eco-RA4E2-64PIN-V1.0開發(fā)板試用】RA4E2的DSP浮點性能的軟件浮點測試和硬件浮點測試對比

    RA4E2是一款基于Cortex -M33內(nèi)核的ARM MCU,理論上是具備硬件浮點運算單元的,所以這里就測試下RA4E2的硬件浮點運算能力
    發(fā)表于 12-30 17:55

    4G模組Air780E的LuatOS開發(fā)之位運算(bit)示例

    本文我要說的是低功耗4G模組Air780E的LuatOS開發(fā),關(guān)于運算(bit)示例,我將詳細(xì)解析分享給大家。
    的頭像 發(fā)表于 12-02 14:33 ?476次閱讀
    4G模組Air780E的LuatOS開發(fā)之位<b class='flag-5'>運算</b>(bit)<b class='flag-5'>示例</b>

    FPGA中的浮點四則運算是什么

    由于定點的四則運算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則運算的實現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 12:51 ?826次閱讀
    FPGA中的<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>是什么

    FPGA中浮點四則運算的實現(xiàn)過程

    由于定點的四則運算比較簡單,如加減法只要注意符號擴(kuò)展,小數(shù)點對齊等問題即可。在本文中,運用在前一節(jié)中描述的自定義浮點格式FPGA中數(shù)的表示方法(下),完成浮點四則運算的實現(xiàn)過程 1.自
    的頭像 發(fā)表于 11-16 11:19 ?1300次閱讀
    FPGA中<b class='flag-5'>浮點</b>四則<b class='flag-5'>運算</b>的實現(xiàn)過程

    【RA-Eco-RA2E1-48PIN-V1.0開發(fā)板試用】在M23內(nèi)核上使用qfplib浮點運算庫進(jìn)行浮點運算

    瑞薩的RA2E1系列MCU是基于M23內(nèi)核的,這款芯片是不帶FPU浮點運算單元的,使用串口prinf函數(shù)打印時是無法打印出浮點數(shù)的,只有Co
    發(fā)表于 11-05 22:07

    如何提高單片機(jī)的運算效率之FPU

    只要STM32或者其他32位單片機(jī),自帶FPU功能,就可以加速float類型數(shù)據(jù)的加減乘除運算。在STM32中要啟用FPU,需要啟動滿足兩個
    的頭像 發(fā)表于 08-30 11:47 ?1147次閱讀
    如何提高單片機(jī)的<b class='flag-5'>運算</b>效率之<b class='flag-5'>FPU</b>

    請問AURIX TC3xx tricore架構(gòu)下浮點運算和將浮點數(shù)小數(shù)點去掉變成整數(shù)來計算哪種方式更加節(jié)省算力?

    ? tricore架構(gòu)下CPU有專門的FPU來處理浮點數(shù)運算,是否意味著用12.89參與運算,在調(diào)用FPU來計算的情況下,計算時間不會比12
    發(fā)表于 08-26 06:54

    如何關(guān)閉ESP32-S3中的FPU浮點數(shù)計算單元

    如何關(guān)閉ESP32-S3中的FPU浮點數(shù)計算單元。如題,之前的項目在esp32s2 上面運行良好,但是移植到esp32s3上后由于fpu造成浮點
    發(fā)表于 06-27 07:32

    請問esp32 wroom 32u默認(rèn)開啟硬件浮點運算單元了嗎?

    請問esp32 wroom 32u 默認(rèn)開啟硬件浮點運算單元了嗎?感謝
    發(fā)表于 06-21 11:08
    主站蜘蛛池模板: 色偷偷91久久综合噜噜噜噜 | 欧美激欧美啪啪片免费看 | 久久亚洲精选 | 男人搡女人视频免费看 | 亚洲一级毛片免观看 | 亚洲开心激情网 | 香蕉爱爱网 | 天天做天天爱天天爽综合区 | 欧美日韩一区二区三区视频在线观看 | 6080午夜 | 天天摸天天操天天射 | 欧美jizzhd精品欧美4k | 人人草人人爱 | 拍拍拍美女黄色1000视频 | 在线免费看一级片 | 操你啦在线视频 | 免费人成网站 | 亚洲欧洲一区二区三区在线观看 | 三级网站在线播放 | 国产免费啪啪 | 男女午夜剧场 | 99久久婷婷国产综合精品电影 | a爱视频| 天天综合天天看夜夜添狠狠玩 | 色啦啦影院 | 天天天天做夜夜夜夜 | 5151hh四虎国产精品 | 四虎影视最新地址 | 免费国产在线视频 | 手机在线看片福利盒子 | 欧美不卡1卡2卡三卡老狼 | 久久夜夜肉肉热热日日 | 国产欧美亚洲精品第二区首页 | 国产精品久久久久国产精品三级 | 国产va免费精品高清在线观看 | 狠狠躁夜夜躁人人爽天天3 狠狠躁夜夜躁人人爽天天段 | 国产特黄一级毛片特黄 | 久久天天躁狠狠躁夜夜不卡 | 中国又粗又大又爽的毛片 | 天堂福利视频 | 亚洲一区二区三区高清 |