NVIDIA發明的具有主動電源管理系統的GPU,借助于人工智能技術,在保證性能的前提下提供了更好的可靠性,并且可用于需要高度可靠性的計算場景中。
3D圖形顯卡在1999年NVIDIA公司推出GeForce 256時開始了其首次變革,這種硬件光影轉換技術,極大的提高了計算機的圖像顯示性能,對游戲領域產生了重要的革命意義,同時也帶給了用戶極高的畫面真實感。
當前,圖形處理器已經無處不在,GPU不再僅僅用于圖形應用,而是被廣泛用于密集計算操作的應用程序,包括人工智能、實時識別和自動駕駛等領域中。
就在2020年9月2日凌晨,NVIDIA發布了RTX30系列顯卡,分別為RTX3070、RTX3080和RTX3090,據悉,3070的性能比2080更強,價格確更加便宜,3080的性能是2080的兩倍,價格卻和2080一樣,而3090則支持8K 60幀光線追蹤。
而隨著人工智能芯片的興起,不僅僅是各種人工智能訓練需要借助于NVIDIA的圖形顯卡,NVIDIA也在嘗試將人工智能技術應用在GPU圖形處理單元中。在18年,NVIDIA發布了一款全新的AI芯片,它將價值10000美元的性能,塞進了一個售價僅為1299美元的小盒子,30W功耗就可以與1萬美元的工作站媲美。
無疑,這樣的技術對于AI芯片的功耗的要求非常高,因此需要電源控制器來最小化AI芯片的功率。為達此目的,NVIDIA在2020年2月13日發明了一項名為“指令和機器學習的能量特征有效地操作處理系統的技術”的發明專利(公開號:US 2020/0050920 A1),申請人為NVIDIA公司。
根據該專利目前公開的資料,讓我們一起來看看這項AI芯片的動態功率控制技術吧。
如上圖,為該專利中發明的AI芯片中主動電源管理控制系統的示意圖,系統100中包含有多個GPU(102),這些GPU通過數字通信總線與其他部件互相通信。在供電方面,這些GPU由配電網110供電,電源管理單元140監視著配電網供給的電流,同時電源管理單元接受由并行處理器116發送的功率控制指令。
基于GPU當前的工作功率以及處理器所發送的信號,電源管理單元可以預測處理器在未來時段所需要的電量,并控制提供給GPU的電壓,以便于為GPU提供適當的功率。這樣不僅可以保證GPU發揮穩定的性能,同時也可以控制GPU的功耗,更重要的是,通過預先在需要高功率的時段來限制其功率,可以避免出現電流過載的情況,否則可能導致電路損壞或者電源過熱。
由此看來,電源管理模塊的預測工作是十分重要的,在NVIDIA的方案中,使用基于硬件的深度學習加速器對于深度神經網絡進行加速,從而對處理器的功耗進行預測。
如上圖,為預測GPU功率的功率控制技術流程圖,首先,輸入功率監視器采用ADC(數模轉換芯片)來對于提供給GPU的電源進行采樣,采樣包括輸入的電流以及電壓,并將采樣結果轉換為數字信號輸出。
其次,并行處理器接收預測功率信號的指令,這樣可以確定預測的GPU功率與當前功率之間的差值,在確定誤差之前,需要對預測功率進行縮放,以使其與當前功率處于正常的比例之中。
這種操作基于深度學習的方法,來更新自適應PID控制器,因為并行處理器的工作負載可以在短時間尺度上變化,因此,處理器可以主動控制輸入到GPU的電源,并根據并行處理器中的工作負載變化來優化處理器的性能和功耗。
如上圖,為這種具有學習機制的實現主動電源管理技術的電路示意圖,其中電路400包括ADC(118)、濾波和縮放器電路420、狀態向量寄存器430、PID控制器440、電壓控制器450以及學習系統460。
該專利中特別提及,雖然處理器可以通過對于指令進行解析,來估計是否需要更高或者更小的功率,但是處理器可能并不知道通過執行這種指定的指令具體需要消耗多少功率。
這就像一個長跑運動員,他可能大概知道在半程馬拉松比賽中可能會消耗多少卡路里的能量,但是通常無法預測小段路途中的具體卡路里能量消耗,因為具體的能量消耗與太多的因素關聯,例如環境條件、溫度、實際速度以及自身體重等的變化。
所以,具體的電源使用情況還是取決于處理器的軟件指令的特定順序,盡管處理器可以預估消耗的功耗,并對GPU的功率進行大致的調整,但是由于制造工藝以及不同的計算任務,因此并不能精準的進行功耗控制。
以上就是NVIDIA發明的基于人工智能的芯片功耗控制系統,這種具有主動電源管理系統的GPU智能芯片,在保證芯片性能的前提下具有更高的可靠性,因此可用于需要高度可靠性的計算環境,例如:數據種心、服務器環境等。此外,在目前較為火熱的智能駕駛領域中,這種方案不僅可以避免電流因為瞬間的下降而影響自動駕駛的通信信號,而且還可以通過實現更快的功率管理響應來改善車輛的功耗消耗。
關于嘉德
深圳市嘉德知識產權服務有限公司由曾在華為等世界500強企業工作多年的知識產權專家、律師、專利代理人組成,熟悉中歐美知識產權法律理論和實務,在全球知識產權申請、布局、訴訟、許可談判、交易、運營、標準專利協同創造、專利池建設、展會知識產權、跨境電商知識產權、知識產權海關保護等方面擁有豐富的經驗。
責任編輯:tzh
-
芯片
+關注
關注
457文章
51337瀏覽量
428075 -
gpu
+關注
關注
28文章
4794瀏覽量
129480 -
AI
+關注
關注
87文章
31834瀏覽量
270598 -
人工智能
+關注
關注
1796文章
47864瀏覽量
240712
發布評論請先 登錄
相關推薦
碳化硅功率器件的封裝技術解析
深度解析研華全棧式AI產品布局
《AI for Science:人工智能驅動科學創新》第二章AI for Science的技術支撐學習心得
功放芯片功率小會出現什么樣的效果
AI網絡物理層底座: 大算力芯片先進封裝技術
![<b class='flag-5'>AI</b>網絡物理層底座: 大算力<b class='flag-5'>芯片</b>先進封裝<b class='flag-5'>技術</b>](https://file1.elecfans.com/web2/M00/05/FA/wKgZombg91KAag9sAAA0QuzXOPg894.jpg)
一文詳解動態多點VPN技術
![](https://file1.elecfans.com/web2/M00/EB/91/wKgaomZZjwCAN_uBAAymuuihSJQ815.png)
risc-v多核芯片在AI方面的應用
![](https://file1.elecfans.com/web2/M00/C5/FA/wKgZomYD8NKAa5cEAAhYhvdFLsw797.png)
高功率因數線性恒流LED控制芯片
NanoEdge AI的技術原理、應用場景及優勢
![](https://file1.elecfans.com/web2/M00/C1/20/wKgaomXTJROASUxYAAbccsQ1Hvk670.png)
評論