隨著AI技術(shù)的廣泛應(yīng)用,從智能手機(jī)到自動駕駛汽車,從智能家居到工業(yè)自動化,AI供電芯片的需求量正呈爆炸式增長。它不僅為AI系統(tǒng)提供穩(wěn)定的電力供應(yīng),確保系統(tǒng)的正常運(yùn)行,而且還肩負(fù)著節(jié)能減排、降低能耗的重任。然而隨著算力需求的提升,AI設(shè)備的能耗、散熱等問題凸顯,這無疑給AI供電芯片帶來了新的挑戰(zhàn),如何實(shí)現(xiàn)高效率、低功耗、持續(xù)穩(wěn)定的供電成為了業(yè)界關(guān)注的焦點(diǎn)。
能耗“突飛猛進(jìn)”:算力比拼加速,能耗日益攀升
算力核心設(shè)備由傳統(tǒng)的CPU向GPU的轉(zhuǎn)移,不僅提升了計(jì)算效率,更使得復(fù)雜的數(shù)據(jù)處理和深度學(xué)習(xí)模型得以實(shí)現(xiàn)。然而,高性能往往伴隨著高能耗。在追求更快計(jì)算速度的同時,GPU的能耗也在不斷上升,給數(shù)據(jù)中心和服務(wù)器帶來了巨大的能源壓力。荷蘭數(shù)據(jù)科學(xué)家Alex de Vries在專注能源研究的學(xué)術(shù)期刊《Joule》上發(fā)表的一項(xiàng)研究顯示,按照當(dāng)前趨勢,到2027年,整個人工智能行業(yè)每年將消耗85至134太瓦時的電力(1太瓦時=10億千瓦時)。
散熱“力不從心”:高性能AI芯片的燙手難題
高性能的AI芯片在運(yùn)行過程中會產(chǎn)生大量熱量,如果不能及時有效地散熱,不僅會影響設(shè)備的穩(wěn)定運(yùn)行,還可能縮短其使用壽命,制約AI算力的進(jìn)一步增長。未來,單顆高性能AI芯片的熱設(shè)計(jì)功耗將突破1000W,達(dá)到了傳統(tǒng)風(fēng)冷散熱的極限。因此,各大公司紛紛投入研發(fā),探索更有效的散熱解決方案,例如行業(yè)巨頭們正在推進(jìn)的液冷技術(shù)等。
可靠性“搖擺不定”:大模型訓(xùn)練,AI芯片一損俱損
AI應(yīng)用對芯片的性能與可靠性要求非常高。為了完成一個大模型的訓(xùn)練任務(wù),通常需要幾千張甚至幾萬張計(jì)算卡進(jìn)行級聯(lián),提供充足的算力。如果有一張卡出了問題,那么整個大模型的訓(xùn)練都會受到影響。如何定位到失效的板卡也是非常費(fèi)時費(fèi)力的工作,嚴(yán)重影響訓(xùn)練的效率。
MPS AI電源解決方案的四大突破,助力化解上述難題
MPS深耕計(jì)算領(lǐng)域多年,從筆記本、臺式機(jī)到自動計(jì)算平臺,再到數(shù)據(jù)中心服務(wù)器,與各大平臺都有緊密的合作。隨著傳統(tǒng)數(shù)據(jù)中心通過集成AI技術(shù)來實(shí)現(xiàn)智能化升級,MPS也在快速迭代電源方案,為行業(yè)和客戶提供高品質(zhì)、可靠的AI電源解決方案,適用于AI 推理卡、訓(xùn)練卡、邊緣計(jì)算設(shè)備、超算服務(wù)器等各類應(yīng)用場景。
△圖1:MPS AI硬件電源解決方案
△圖2:MPS典型AI電源應(yīng)用
突破一:體量更緊湊、功率密度更高、配電損耗更低
MPS的AI電源方案采用創(chuàng)新設(shè)計(jì),體量更緊湊,配電損耗更低,使數(shù)據(jù)中心在給定機(jī)柜范圍內(nèi)的計(jì)算能力得以提升。
相比競爭對手的方案,MPS的功率轉(zhuǎn)換技術(shù)在主板上占用的空間更小,這樣所有處理器能更緊密地結(jié)合為一體,在更小的空間內(nèi)實(shí)現(xiàn)更強(qiáng)的計(jì)算能力。下圖是MPS新型開放式框架電源模塊Intelli-Module的3D概念圖,展現(xiàn)了高度集成的數(shù)字多相電源模塊。
△圖3:高度集成的Intelli-Module
MPS 專注改善數(shù)據(jù)中心的功率密度,因?yàn)閿?shù)據(jù)中心面臨著人工智能等新計(jì)算應(yīng)用的更大功率需求。以創(chuàng)新手段提升功率密度意味著減小配電損耗,從而降低數(shù)據(jù)中心的總運(yùn)營成本、單次計(jì)算輸出的總成本以及碳排放。而機(jī)柜數(shù)量減少后,數(shù)據(jù)中心的物理占用空間也能最大限度地縮減。
130A、兩相、非隔離式降壓電源模塊MPC22167-130是MPS Intelli-Module系列的最新產(chǎn)品,它將 DrMOS、電感和其他無源元件集成到單個封裝中,不僅占位面積小,功率密度還提高了2.5 倍。而且,它允許將多相穩(wěn)壓器(VR)放置在更靠近處理器的位置,從而減少了配電網(wǎng)絡(luò) (PDN) 的損耗(見圖4)。
△圖4: Intelli-Module 與 DrMOS 的占板面積比較
多個 MPC22167-130 器件可與第一級電源模塊配合使用,以支持端到端的電源解決方案,同時能夠滿足AI 處理器的高功率要求。下圖展示了采用 MPC22167-130 實(shí)現(xiàn)的參考設(shè)計(jì)示例。
△圖5:具有 48V 輸入和 0.8V 輸出的 2000A OAM 外形規(guī)格參考設(shè)計(jì)
該參考設(shè)計(jì)可應(yīng)用于OAM 形態(tài)的 AI 處理器,它采用 MPC22167-130 支持 2000A 的最大輸出電流 (IOUT),其中第二級方案的設(shè)計(jì)采用了MPC22167-130 與 數(shù)字16 相控制器MP2891的組合方案。
突破二:電源轉(zhuǎn)換效率更高、頂部散熱設(shè)計(jì)兼容液冷
為了解決高功率密度電源模塊中的散熱問題,MPS多管齊下:一方面優(yōu)化內(nèi)部結(jié)構(gòu)和器件設(shè)計(jì),提升電源轉(zhuǎn)換效率,降低功耗,同時減少熱量產(chǎn)生,確保設(shè)備穩(wěn)定運(yùn)行;另一方面,將模塊做成頂部散熱,方便散熱器的設(shè)計(jì);不僅如此,器件還能兼容液冷的應(yīng)用,借助液冷增強(qiáng)服務(wù)器散熱效果,從而進(jìn)一步發(fā)揮電源的極致性能,使單機(jī)柜功率大幅提升。
△圖6:MPS磁芯設(shè)計(jì)對電源模塊效率的影響
突破三:嚴(yán)密的仿真計(jì)算、嚴(yán)格的出廠測試
AI芯片批量的一致性和可靠性是非常重要的,沒有多年的經(jīng)驗(yàn)積累和嚴(yán)格的市場檢驗(yàn),是磨礪不出好的AI電源的。MPS在設(shè)計(jì)階段,會通過仿真和理論計(jì)算,確定所有器件的工作條件,從而選取合適的電子器件。采用高電流等級、高耐壓的電子器件,內(nèi)部電感為MPS專利設(shè)計(jì),飽和電流高。而在研發(fā)階段,MPS則采用不同批次的模塊產(chǎn)品進(jìn)行可靠性實(shí)驗(yàn),出廠前會逐項(xiàng)測試模塊電氣性能及參數(shù),最后還會進(jìn)行老化測試及前后參數(shù)對比分析。
△圖7: MP2891 和MPC22167-130 的 SIMPLIS 模型
△圖8:SIMPLIS 仿真與實(shí)驗(yàn)室測量的比較,誤差僅為 5mV
突破四:實(shí)用的仿真工具、專業(yè)的技術(shù)支持、靈活的供應(yīng)鏈管理
MPS能夠提供很多好用的前期評估工具,如PDN仿真工具、仿真模型、靈活的GUI等,在前期和后期都能協(xié)助客戶更方便地進(jìn)行方案測試,確保精準(zhǔn)落地。
△圖9:由 MPS 支持的用戶測試可視化界面(GUI)
同時,MPS的工程師也將全程提供專業(yè)的技術(shù)支持,幫助客戶及時解決實(shí)際應(yīng)用中遇到的難題。另外,MPS采用供應(yīng)鏈multi-source管理,提高供應(yīng)鏈的靈活性和自主性,優(yōu)化生產(chǎn)工藝,以保證充足的產(chǎn)能,支撐AI對芯片大規(guī)模用量的需求。
MPS 電源方案,助力每一個人工智能(AI)硬件系統(tǒng)!
MPS 的AI電源解決方案提高了數(shù)據(jù)中心的計(jì)算能力,創(chuàng)新型電源架構(gòu)方法增大了每個機(jī)柜的功率密度,減小了服務(wù)器的配電損耗,在提升AI算力的同時有效降低能耗,從而助力節(jié)省能源和降低運(yùn)行成本。另外,兼容液冷應(yīng)用的設(shè)計(jì)、芯片的一致性與可靠性保障、便捷好用的仿真工具、專業(yè)及時的技術(shù)支持、靈活自主的供應(yīng)鏈等眾多優(yōu)勢,也能夠讓客戶在設(shè)計(jì)方案時更省時、更安心!
以上部分資料轉(zhuǎn)載“車乾6G”網(wǎng)絡(luò)平臺,文章僅僅用于交流學(xué)習(xí)版權(quán)歸原作者。如有侵權(quán),請告知立刪。
-
散熱
+關(guān)注
關(guān)注
3文章
536瀏覽量
32200 -
AI
+關(guān)注
關(guān)注
87文章
34063瀏覽量
275188 -
供電芯片
+關(guān)注
關(guān)注
0文章
9瀏覽量
5436
發(fā)布評論請先 登錄
晶科能源N型TOPCon組件滿足AI數(shù)據(jù)中心的能源剛需
誰說高性能必須高能耗?揭秘企業(yè)級SSD功耗管理“黑科技”

高能耗時代,安科瑞能量管理系統(tǒng)如何化解微電網(wǎng)能量管理難題?

關(guān)于移動數(shù)據(jù)中心能耗管理系統(tǒng)的設(shè)計(jì)研究

解決輕工紡織行業(yè)能耗高 落實(shí)方案難 安科瑞EMS2.0助力轉(zhuǎn)型

安科瑞EMS2.0:部隊(duì)能效管理的“戰(zhàn)備引擎”—破解高能耗困局,打造安全、高效、綠色的軍事基地

物聯(lián)網(wǎng)工業(yè)制造企業(yè)高能耗解決方案

DeepSeek挑戰(zhàn)AI高能耗認(rèn)知
解鎖建筑節(jié)能密碼,安科瑞監(jiān)測系統(tǒng)讓能耗清晰可見

基于物聯(lián)網(wǎng)的工業(yè)企業(yè)能耗監(jiān)控系統(tǒng)的設(shè)計(jì)與應(yīng)用

建筑能耗監(jiān)測對建筑節(jié)能的研究

淺談能耗管理系統(tǒng)在LF12-3油田的應(yīng)用

關(guān)于安科瑞能耗管理系統(tǒng)在LF12-3油田的應(yīng)用說明

解決方案丨PPEC inside車載逆變器,車載高能耗設(shè)備需求的理想之選
淺談能耗監(jiān)測系統(tǒng)在煤礦行業(yè)的應(yīng)用

評論