功耗是芯片中比較重要的一個性能指標,有時甚至可以決定一個芯片的成敗。眾所周知,前段時間鬧得沸沸揚揚的“驍龍火龍”事件,就大大影響了這款芯片的市占率。對于工業級和車規級的芯片,功耗的高低體現的不是很明顯。對于消費級芯片(如手機CPU,IoT芯片等),由于往往應用在小型移動設備中,低功耗設計就顯得尤為重要。
有業內專家曾經指出,在不同的設計層次,進行功耗優化的效果也不同。下表顯示了在一個產品的不同周期,可以減少功耗的百分比。
設計層次 | 降低功耗百分比 |
版圖級 | <5% |
晶體管級 | 5% |
門級 | 10% |
RTL級 | 20% |
系統級 | >50% |
門控時鐘介紹
一般來講,時鐘樹貫穿于整個芯片內部,由大量的buffer和反相器組成。時鐘信號作為芯片中toggle率最高的信號,功耗可高達整個芯片功耗的30%,甚至更高。加入門控時鐘(clock gating,cg)電路,可大大降低時鐘樹的toggle行為,從而降低開關功耗。此外,時鐘引腳開關行為的減少,寄存器的內部功耗也會減少。門控時鐘是減少功耗的有力手段,在時鐘被門控關閉后,該時鐘網絡和其中的寄存器都會停止翻轉,因此功耗會顯著減低。一個典型的門控時鐘設計如下圖所示:
對于時鐘源clk_source經過一個額外的與門U2A,當clk_en為高時,clk_source能過通過到達U1A觸發器,當clk_en為低時clk_source無法到達觸發器。當clk_en為低時,觸發器及其時鐘網絡中的所有組合邏輯停止翻轉,out端保持不變。由于clk_source經過了U2A與門,所有會產生一定的時鐘偏移。在波形分析上,下面這個圖可以比較好的理解門控時鐘的概念,只有當clk_en為高的時候,clk_out=clk_in,否則,clk_out=0。
cg方法1:使用與邏輯
這個也是最簡單的方法,直接將時鐘使能控制(門控)信號與時鐘做"與"邏輯。這個辦法簡單粗暴,但是也有一個嚴重的缺點:會有毛刺。當clk為低的時候,clk_en可任意變化,gclk都是低。但當clk為高的時候,clk_en必須保持不變,才能保證沒有毛刺,那什么東西能讓clk_en保持不變呢?答案就是:鎖存器
cg方法2:加入鎖存器
在clk為低時鎖存器連通、clk為高時鎖存器鎖住,如下圖:
![29c6da62-1dcb-11ed-ba43-dac502259ad0.png](https://file1.elecfans.com//web2/M00/96/21/wKgZomTnF0WAS3TpAABEgLYv7cU174.png)
波形圖如下,可見當clk為低的時候gclk為低沒跑,但clk為高的時候,gclk的值可看作是clk上升沿采樣的clk_en的值。所以使用Latch可以有效地鎖存clk_en值,同時不影響clk的周期性。Latch門控時鐘的本質是clk上升沿鎖住了clk_en值,讓clk為高時clk_temp不會翻轉,所以消除了毛刺。
其RTL代碼如下:
always@(*) begin
if(clk)
clk_temp = clk_en;
else
clk_temp = clk_en;
end
assign gclk = clk & clk_temp;
cg方法3:使用標準單元庫
雖然使用 latch 可以解決門控時鐘毛刺的出現,但是時序也需要嚴格的約束。FPGA 或 IC 設計時,綜合庫中往往會有集成門控邏輯單元。此類門控邏輯單元經過了大量的更新迭代和驗證,使用起來更加的方便、安全。因此一般情況下,門控時鐘的設計也都會直接調用專用的集成門控邏輯單元。調用方式和基本的與門、緩沖器等基本單元類似,直接例化即可。
審核編輯:湯梓紅
-
芯片
+關注
關注
456文章
51262瀏覽量
427748 -
低功耗
+關注
關注
10文章
2420瀏覽量
103915 -
門控時鐘
+關注
關注
0文章
27瀏覽量
8974
原文標題:數字芯片中的低功耗設計
文章出處:【微信號:IP與SoC設計,微信公眾號:IP與SoC設計】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論