Cortex-M處理器家族是一系列具有擴展性,兼容性,節能和易于使用的處理器,旨在幫助開發人員滿足未來智能互聯嵌入式應用的需要。2010年推出的Cortex-M4是建立在Cortex-M3的基礎上并加入了一系列專門為數字信號處理定制的指令集擴展,并搭配可選的性能可達1.25 DMIPS/ MHz的單精度浮點單元。自推出以來,有10家以上的半導體廠商推出了基于Cortex-M4的通用MCU產品,以及非常廣泛的基于Cortex-M4的sensor hub產品。
在過去的幾年里,對支持互聯的嵌入式系統的功能特性和處理能力的需求變得更加苛刻。即使是最簡單的系統,也預期支持多種連接方式,圖形用戶界面,人機界面,語音識別或其他自然的交互方式。處理器需要變得更加強大,并能提供更多的本地處理能力。在汽車行業和工業自動化中應用的微控制器需要支持更高的處理能力和CPU性能提升,對計算精度和短時間內處理大量數據的要求在迅速提高。這些未來系統的要求包括:以較低的成本提供更多的功能,增加連接性,更好的代碼重復利用,以及提高能效。正是著眼于這樣的未來需求,ARM和合作伙伴一起設計了當前Cortex-M家族中性能最強的ARM Cortex-M7處理器。
近觀Cortex-M7
Cortex-M7能夠應對最嚴格的應用環境,并克服了以前基于Cortex-M處理器的解決方案所面臨的問題,性能達到了上一代Cortex-M4的兩倍,大約為5 CoreMark/ MHz。Cortex-M7是專為各種嵌入式應用,包括微控制器,汽車控制器,工業控制系統和無線通信控制器(例如無線網絡)設計的。對于那些熟悉Cortex-M系列CPU的嵌入式應用開發者來說,Cortex-M7基于Cortex-M架構,從架構上兼容從Cortex-M0以來的所有產品(圖1)。
圖1
ARM Cortex-M7處理器特性
Cortex-M7包含六階段的超標量流水線,并和緊耦合內存、高速緩存和大內存支持選項集成在一起以提供整數、浮點和DSP處理能力并保證確定性的行為。Cortex-M7先進的流水線能提供相對于Cortex-M4更高的性能,允許在每個時鐘周期執行兩條指令。
Cortex-M7開發的一大重點是相對于之前的Cortex-M系列處理器提高IPC(instructions-per-clock)效率。Cortex -M7是Cortex-M家族中第一個提高最高64KB指令和數據緩存選項的處理器,高速緩存能提供對更大的存儲器系統的有效操作(外存通常比處理器慢很多)。此外還添加了緊耦合內存接口,集成ECC支持。對內存的快速訪問使得高速中斷處理和實時應用處理成為可能。這樣的集成使得工程師們可以在內部緩存中執行大部分代碼,以減少對外部存儲器讀寫訪問,從而降低功耗。
Cortex-M7也提供了對每個內部緩存單元增加ECC支持的選項,以提高系統的可靠性。對于給定解決方案,如果某個內存位置的單個比特值被破壞,該數據可被校正和恢復。除了ECC,存儲器系統也可以通過可選的存儲器保護單元(MPU)設定8或16個區域為受保護區域以增強系統可靠性。
為了支持提高了的CPU處理能力,內存系統也從32位AXI總線改進為64位AXI總線,64位AXI比32位AXI提供了更大的帶寬,并支持多個outstanding transfer以最大化系統性能。為了易于集成在先前的Cortex-M設計中使用的傳統外圍設備,還有一個可選的低延遲AHB外設總線接口。為了允許靈活的中斷管理和低中斷延遲,集成嵌套矢量中斷控制器(NVIC)用1到240個中斷,以及3至8位可編程優先級寄存器實現與處理器的緊密集成。此外,還有ETM支持,專為CoreSight(ARM支持全系統調試和跟蹤的架構)設計。
Cortex-M7包含的雙精度支持可選項,進一步擴大了Cortex-M家族的浮點能力。如果FPU存在時,還支持整數和浮點指令的并發。鑒于存在大量基于Cortex-M7的MCU應用,它還具有完全的強大的調試功能,以及可選的全指令和數據跟蹤支持。對已經使用了Cortex-M4處理器的設備,在應用對性能的要求提高時,前述特性使得Cortex-M7成為一種極具吸引力的解決方案。
遷移設計到Cortex-M7
鑒于大多數嵌入式工程師和開發人員都熟悉Cortex-M4,讓我們來看看Cortex-M7帶來的一些軟件開發的優點。從開發者的角度來看,在Cortex-M7支持所有的Cortex-M4處理器指令,并使用相同的中斷模型來處理異常。在大多數情況下,針對Cortex-M4處理器編寫的程序代碼應該可以在Cortex-M7處理器上沒有任何問題地運行。但是,在有些情況下可能需要做一些改動,軟件開發人員必須了解這些改動以減少把應用程序從Cortex-M4遷移到Cortex-M7所需的時間。
為了獲得Cortex-M7處理器的最佳性能,一些C編譯器和運行時庫已經進行了優化和更新(圖2)。此外,由于相當多的Cortex-M7相對于Cortex-M4在調試系統上的變化,軟件開發者必須更新他們的工具鏈,以在基于Cortex-M7的微控制器產品上調試應用程序。在某些情況下,調試適配器上的固件可能還需要更新。因此,強烈建議更新到最新的開發工具鏈。
圖2
相對于Cortex-M4的2倍性能改進
通常情況下,把軟件從Cortex-M4遷移到Cortex-M7處理器時,需要完成以下改動:
(1)、更新CMSIS- CORE頭文件為Cortex-M7對應的頭文件。對應Cortex-M7處理器的CMSIS-CORE頭文件包含在CMSIS 4.2之后的版本中。(最新的CMSIS可以從www.arm.com/cmsis獲得。)
(2)、更新CMSIS-DSP庫為Cortex-M7定制版本。Cortex-M7定制版本為Cortex-M7處理器的流水線行為進行了優化,因此可以提供更高的性能。
(3)、進行緩存配置的新API包含在CMSIS-CORE頭文件中。如果正在使用的Cortex-M7裝置經由AXI接口從慢速存儲器(例如Flash)執行程序,應該啟用高速緩存以獲得更好的性能。
此外,所有的代碼應該被重編譯以允許編譯器針對Cortex-M7處理器流水線更好地優化指令序列。在某些情況下,可能在運行時需要額外的緩存維護操作。例如,在處理器和外設DMA控制器共享一塊帶緩存的內存時,必須進行適當的緩存維護操作以保證內存一致性。
a) 如果被Cortex-M7處理器更新過的內存需要被另一個外設通過總線訪問,需要先清緩存(clean cache)以保證外設看到最新的數據。
b) 如果內存被外設通過總線更新,在Cortex-M7處理器訪問該內存前,需要先做一個緩存無效(cache invalidate),這樣在讀取該位置的內容時,處理器將直接從主存儲器中獲取最新的數據。
Cortex-M7處理器支持多種浮點支持選項,允許沒有FPU,只包含單精度FPU或者同時包含單精度和雙精度FPU。如果應用程序可以從雙精度浮點單元支持中獲益,該應用程序應該重新編譯以利用雙精度FPU。即使應用程序只使用單精度浮點運算,重新編譯為Cortex-M7處理器的代碼也是有益的,因為在Cortex-M7的FPU基于FPv5,而Cortex-M4處理器的FPU的是FPv4。FPv5增加了額外的浮點處理指令,有助于目標應用程序加速浮點數據處理。
程序代碼更改
有許多可能需要更改程序代碼的潛在領域。由于處理器具有更高的性能,一些程序代碼可能需要由于執行速度變快進行適當的調節。最常見的例子是使用硬編碼(hard code)的循環來實現延遲的應用程序,必須調整原本的循環次數以確保延時。
從一個微控制器設備遷移到另一個時,系統內存映射經常發生變化。另外,Cortex-M7處理器初始矢量表并不是必須從地址0x00000000開始。如果應用程序代碼假設初始向量表地址為0,用戶可能需要更新代碼,以便能夠通過讀取Vector Table Offset寄存器來確定初始矢量表的位置。
由于在Cortex-M7處理器的多總線接口和更強大的寫緩存,用戶可能會發現有必要在程序代碼中插入額外的內存barrier指令。內存barrier的使用指南請參閱“ARM application note AN321 – ARM Cortex-M Programming Guide to Memory Barrier Instructions”。在Cortex-M4處理器上,由于處理器流水線本身的特性,忽略內存barrier指令并不會造成任何問題。但在Cortex-M7處理器上,對內存barrier的需求是很嚴格的。
行動起來
Cortex-M7不僅繼承了Cortex-M系列處理器的特性,如能源效率、高性能、易用性和更小的代碼,它專門設計的靈活出色的內存和連接選項使得它特別適合于汽車、物聯網和工業連接市場。在Cortex-M7處理器發布之后,基于它的MCU已經相繼推出:
-- 意法半導體于2014年10月在ARM TechCon上發布的STM32 F7系列。
-- Atmel公司在2015 CES上發布的針對連接性和通用工業應用AM E70和SAM S70系列
-- Atmel公司在2015 CES上發布的SAM V70和V71系列已取得汽車工業合格證,其采用Cortex-M7 DSP擴展,針對信息娛樂連接和音頻應用。
-- NXP也公開宣布了采用Cortex-M7的Kinetis KV5x,針對高性能電源轉換、馬達控制和工業自動化。
由于ARM Cortex-M4和Cortex-M7處理器在架構上有很多相似之處,確保了大部分應用程序代碼可以直接遷移。軟件開發人員可以開始動手,以確保他們的應用程序都適合于下一代智能連接嵌入式設備。遷移需要用戶進行一些適應性修改。開發者可以根據從ARM Cortex-M4處理器到Cortex-M7處理器的應用程序遷移 - 軟件開發人員指南( “Migrating Applications from an ARM Cortex-M4 Processor to a Cortex-M7 Processor - A Software Developer’s Guide”)”白皮書進一步了解遷移過程的細節。該白皮書可以在ARM Connected Community中找到,并提供了深入的技術討論。
評論