AI 工作負載的指數級增長正在增加數據中心的功率需求。傳統的 54 V 機架內配電專為千瓦(KW)-scale 機架設計,無法支持即將進入現代 AI 工廠的兆瓦(MW)-scale 機架。
從 2027 年開始,NVIDIA 正在率先向 800 V HVDC 數據中心電力基礎設施過渡,以支持 1 MW 及以上的 IT 機架。為了加速采用,NVIDIA 正在與數據中心電氣生態系統中的主要行業合作伙伴合作,包括:
- 芯片提供商: Infineon、MPS、Navitas、ROHM、STMicroelectronics、Texas Instruments
- **動力系統組件: **Delta、Flex Power、Lead Wealth、LiteOn、Megmeet
- 數據中心電力系統: Eaton、Schneider Electric、Vertiv
該計劃將推動創新,旨在為新一代 AI 工作負載建立高效、可擴展的供電,以確保提高可靠性并降低基礎設施復雜性。
傳統機架電源系統的極限
如今, AI 工廠的機架依賴于 54 V DC 電源,其中笨重的 copper busbars 將電力從機架式電源架傳輸到計算托盤。當機架功率超過 200 kilowatts 時,這種方法開始達到物理極限:
- **空間限制: **如今的 NVIDIA GB200 NVL72 或 NVIDIA GB300 NVL72 配備多達八個電源架,為 MGX 計算和交換機架提供動力支持。使用相同的 54 V DC 直流配電意味著,在 MW 規模下,Kyber 的電源架將消耗高達 64 U 的機架空間,沒有任何計算空間。在 GTC 2025 大會上,NVIDIA 展示了一臺 800 V 的邊車,可在單個 Kyber 機架中為 576 個 Rubin Ultra GPU 提供動力支持。另一種方法是為每個計算機架使用專用電源機架。
- **銅纜過載 ** :在單個 1 MW 機架中使用 54 V DC 的物理特性需要多達 200 千克的銅母線。單單 1 GW 數據中心的機架式母線就需要多達 50 萬噸銅。顯然,當前的配電技術在 GW 數據中心的未來是不可持續的。
- **低效轉換: **整個電力鏈中重復的 AC/DC 轉換不節能,并會增加故障點。
圖 1。當前的 Data Center 電源架構
800 V HVDC 革命
NVIDIA 800 V HVDC 架構通過全面重新設計來應對這些挑戰。NVIDIA 正在與數據中心能源生態系統合作,研究實現這一概念所需的創新和變革。
圖 2。NVIDIA 800 V HVDC 架構可更大限度地減少能源轉換。
電網到電力機房
傳統的數據中心配電涉及多次電壓轉換,這可能會導致效率低下并增加電氣系統的復雜性。通過使用工業級整流器,在數據中心周邊將 13.8 kV AC 網電源直接轉換為 800 V HVDC,消除了大多數中間轉換步驟。這種簡化的方法可更大限度地減少能源損失,這些損失通常發生在多個 AC/DC 和 DC/DC 轉換期間。
這種方法還顯著減少了電源鏈中需要的帶風扇的電源單元 (PSU) 的數量。更少的 PSU 和風扇可提高系統可靠性、降低散熱并提高能效,從而使 HVDC 配電成為現代數據中心更有效的解決方案,并顯著減少組件總數。
通過單步 AC/DC 轉換,該系統可受益于更直接、更高效的電源流,從而降低電氣復雜性和維護需求。要全面提供可能的過流保護可靠性和維護收益,仍需要創新。HVDC 還可降低傳輸損失并提供更好的電壓穩定性,確保向關鍵基礎設施持續供電,同時降低銅纜成本和總體材料成本。這種設計可以提高運營效率,同時簡化數據中心電源架構。
行級電源管理
在配電中,使用 800 V 總線通道并從 415 V AC 切換到 800 V DC,可通過相同的導體尺寸多傳輸 85% 的功率。出現這種情況的原因是,較高的電壓會降低電流需求,降低電阻損耗并提高功率傳輸效率。
“使用較低的電流,較薄的導體可以處理相同的負載,從而將銅纜需求降低 45%。此外,DC 系統還可消除 AC 特有的低效現象,例如蒙皮效應和無功功率損失,從而進一步提高效率。通過采用 800 V DC 配電,設施可獲得更高的功率容量、更高的能效和更低的材料成本。”
IT 機架實施
“通過采用直接 800 V 輸入,計算機架可以高效地處理電源傳輸,而無需依賴集成的 AC/DC 轉換階段。這些機架接受兩條 800 V 導體饋送,并利用計算機架中的 DC/DC 轉換來驅動 GPU 設備。消除機架級 AC/DC 轉換元件可騰出寶貴空間來處理更多計算資源,從而實現更高密度的配置并提高散熱效率。與需要額外電源模塊的傳統 AC/DC 轉換相比,直接 800 V 輸入可簡化設計,同時提高性能。”
IT 機架的 800 V HVDC 配電以及 GPU 的 12 V DC/DC 轉換
800 V HVDC 的主要優勢
**可擴展性: **使用相同的數據中心電力基礎設施,支持功率在 100 kW 到 1 MW 以上的機架,從而實現無縫擴展。
**效率 ** :與當前的 54 V 系統相比,端到端效率提升高達 5%,確保更高的能源利用率。
銅纜減少:與傳統的 415 V AC 或 480 V DC 架構相比,800 V HVDC 可顯著減少數據中心主干的電流、銅纜用量和熱損耗。
可靠性: 傳統的 IT 機架式 PSU 依靠過度配置來減少機時間,但這會導致頻繁的維護周期來更換出現故障的模塊。 雖然集中式電源轉換可提高系統可靠性,但在 HVDC 系統中,故障檢測和可維護性是關鍵的創新領域。
IT 機架式 PSU 的空間限制會造成散熱挑戰,導致在成本和長期可靠性之間做出權衡。將 Power Conversion 從機架中移出可降低這些風險。
**面向未來 ** :旨在滿足 1 MW 機架的要求,能夠隨著數據中心需求的發展高效擴展到更高功率的機架。
應對設施級 HVDC 的挑戰
雖然高壓直流架構在過去曾進行過試點,但由于技術和部署方面的挑戰,其廣泛采用受到了限制。如今,AI 驅動的機架密度、電源轉換的進步以及圍繞電動汽車(EV)充電標準建立的工業基礎的融合正在改變這一格局。
在設施層面部署 800 V HVDC 給安全、標準和員工培訓帶來了新的挑戰。NVIDIA 及其合作伙伴正在積極研究基于傳統 Transformer 的和固態 Transformer (SST) 方法的 CapEx 和 OpEx 以及安全影響,以實現這一過渡。
前進之路
800 V HVDC 不僅僅是當今的機架,而是面向未來的 AI 基礎設施。2027 年,800 V HVDC 數據中心將與 NVIDIA Kyber 機架級系統同步全面投產,確保為要求日益嚴苛的 AI 模型提供無縫可擴展性。
幫助數據中心基礎設施處理負載峰值和次秒級 GPU 功率波動的能源存儲解決方案是 800 V HVDC 架構的一部分。敬請關注,了解更多詳情。
由于 AI 工作負載每次查詢所需的計算量增加了 100 倍到 1000 倍,因此該架構可實現持續增長,同時通過提高效率、可靠性和系統架構改進將總體擁有成本 (TCO) 降低高達 30%。
主要效率提升
- 端到端能效提升高達 5%
- 由于 PSU 故障減少,組件維護的人工成本降低,維護成本最多可降低 70%
- 無需在 IT 機架內配備 AC/DC PSU,從而降低散熱費用
NVIDIA 不僅在構建速度更快的 GPU,還在重新設計整個功率堆棧,以充分發揮 AI 的潛力。超高效、MW-scale AI 工廠的時代由此開始。
By Mathias Blake, Martin Hsu, Harry Petty and Jared Huntington
關于作者
Mathias Blake 是 NVIDIA 杰出的工程師核心技術。Blake 負責確保關鍵技術為未來的 NVIDIA 產品和解決方案做好大規模生產準備。他在廣泛的垂直市場背景下擁有二十多年的硬件和產品設計經驗。
Martin Hsu 專注于數據中心基礎設施,專注于與合作伙伴和供應商一起管理 NVIDIA MGX 生態系統。此外,Martin 還代表 NVIDIA 擔任 VESA 和 HDMI 的董事會成員。他擁有法國國立高等電信學院 (ENST) 電氣工程碩士學位和臺灣 NCTU 電氣工程學士學位。
Harry Petty 是一位經驗豐富的數據中心營銷人員和技術專家,曾在大型科技公司擔任領導職務,為混合云、存儲解決方案、網絡處理器和服務器產品線推廣 SDN 產品。他曾與許多客戶合作,在多個數據中心部署應用程序。當 Harry 不討論 HPC 數據中心的 IO 子系統時,他喜歡在北加利福尼亞州附近的 Sierra 山麓和湖泊中進行戶外活動。
Jared Huntington 是一位高級電源架構師,專注于機架和數據中心電源系統。加入 NVIDIA 之前,Jared 從事音頻放大器、功率半導體和筆記本電腦電源適配器的研究。他在 Cal Poly San Luis Obispo 學習電氣工程。
-
NVIDIA
+關注
關注
14文章
5238瀏覽量
105726 -
數據中心
+關注
關注
16文章
5127瀏覽量
73174 -
AI
+關注
關注
87文章
34130瀏覽量
275229 -
HVDC
+關注
關注
0文章
27瀏覽量
12482 -
智能工廠
+關注
關注
3文章
1069瀏覽量
43061
發布評論請先 登錄
NVIDIA宣布推出 Hopper 架構,掀起新一代加速計算浪潮

數據中心電力架構革命!英偉達強推800V HVDC,2年后量產

優化800G數據中心:高速線纜、有源光纜和光纖跳線解決方案
請問數據中心機房機架式UPS如何配置合適的UPS電源?
什么是800V高壓系統?800V高壓系統的驅動力和系統架構分析

基于800V平臺對電池系統提出的挑戰與應對

華為發布新一代站點能源架構及AI數據中心建設原則
SiC MOSFET模塊在英偉達800V HVDC電源系統中的技術優勢與應用價值

NVIDIA 采用納微半導體開發新一代數據中心電源架構 800V HVDC 方案,賦能下一代AI兆瓦級算力需求

評論