AI 工作負(fù)載的指數(shù)級(jí)增長(zhǎng)正在增加數(shù)據(jù)中心的功率需求。傳統(tǒng)的 54 V 機(jī)架內(nèi)配電專為千瓦(KW)-scale 機(jī)架設(shè)計(jì),無(wú)法支持即將進(jìn)入現(xiàn)代 AI 工廠的兆瓦(MW)-scale 機(jī)架。
從 2027 年開(kāi)始,NVIDIA 正在率先向 800 V HVDC 數(shù)據(jù)中心電力基礎(chǔ)設(shè)施過(guò)渡,以支持 1 MW 及以上的 IT 機(jī)架。為了加速采用,NVIDIA 正在與數(shù)據(jù)中心電氣生態(tài)系統(tǒng)中的主要行業(yè)合作伙伴合作,包括:
- 芯片提供商: Infineon、MPS、Navitas、ROHM、STMicroelectronics、Texas Instruments
- **動(dòng)力系統(tǒng)組件: **Delta、Flex Power、Lead Wealth、LiteOn、Megmeet
- 數(shù)據(jù)中心電力系統(tǒng): Eaton、Schneider Electric、Vertiv
該計(jì)劃將推動(dòng)創(chuàng)新,旨在為新一代 AI 工作負(fù)載建立高效、可擴(kuò)展的供電,以確保提高可靠性并降低基礎(chǔ)設(shè)施復(fù)雜性。
傳統(tǒng)機(jī)架電源系統(tǒng)的極限
如今, AI 工廠的機(jī)架依賴于 54 V DC 電源,其中笨重的 copper busbars 將電力從機(jī)架式電源架傳輸?shù)接?jì)算托盤。當(dāng)機(jī)架功率超過(guò) 200 kilowatts 時(shí),這種方法開(kāi)始達(dá)到物理極限:
- **空間限制: **如今的 NVIDIA GB200 NVL72 或 NVIDIA GB300 NVL72 配備多達(dá)八個(gè)電源架,為 MGX 計(jì)算和交換機(jī)架提供動(dòng)力支持。使用相同的 54 V DC 直流配電意味著,在 MW 規(guī)模下,Kyber 的電源架將消耗高達(dá) 64 U 的機(jī)架空間,沒(méi)有任何計(jì)算空間。在 GTC 2025 大會(huì)上,NVIDIA 展示了一臺(tái) 800 V 的邊車,可在單個(gè) Kyber 機(jī)架中為 576 個(gè) Rubin Ultra GPU 提供動(dòng)力支持。另一種方法是為每個(gè)計(jì)算機(jī)架使用專用電源機(jī)架。
- **銅纜過(guò)載 ** :在單個(gè) 1 MW 機(jī)架中使用 54 V DC 的物理特性需要多達(dá) 200 千克的銅母線。單單 1 GW 數(shù)據(jù)中心的機(jī)架式母線就需要多達(dá) 50 萬(wàn)噸銅。顯然,當(dāng)前的配電技術(shù)在 GW 數(shù)據(jù)中心的未來(lái)是不可持續(xù)的。
- **低效轉(zhuǎn)換: **整個(gè)電力鏈中重復(fù)的 AC/DC 轉(zhuǎn)換不節(jié)能,并會(huì)增加故障點(diǎn)。
圖 1。當(dāng)前的 Data Center 電源架構(gòu)
800 V HVDC 革命
NVIDIA 800 V HVDC 架構(gòu)通過(guò)全面重新設(shè)計(jì)來(lái)應(yīng)對(duì)這些挑戰(zhàn)。NVIDIA 正在與數(shù)據(jù)中心能源生態(tài)系統(tǒng)合作,研究實(shí)現(xiàn)這一概念所需的創(chuàng)新和變革。
圖 2。NVIDIA 800 V HVDC 架構(gòu)可更大限度地減少能源轉(zhuǎn)換。
電網(wǎng)到電力機(jī)房
傳統(tǒng)的數(shù)據(jù)中心配電涉及多次電壓轉(zhuǎn)換,這可能會(huì)導(dǎo)致效率低下并增加電氣系統(tǒng)的復(fù)雜性。通過(guò)使用工業(yè)級(jí)整流器,在數(shù)據(jù)中心周邊將 13.8 kV AC 網(wǎng)電源直接轉(zhuǎn)換為 800 V HVDC,消除了大多數(shù)中間轉(zhuǎn)換步驟。這種簡(jiǎn)化的方法可更大限度地減少能源損失,這些損失通常發(fā)生在多個(gè) AC/DC 和 DC/DC 轉(zhuǎn)換期間。
這種方法還顯著減少了電源鏈中需要的帶風(fēng)扇的電源單元 (PSU) 的數(shù)量。更少的 PSU 和風(fēng)扇可提高系統(tǒng)可靠性、降低散熱并提高能效,從而使 HVDC 配電成為現(xiàn)代數(shù)據(jù)中心更有效的解決方案,并顯著減少組件總數(shù)。
通過(guò)單步 AC/DC 轉(zhuǎn)換,該系統(tǒng)可受益于更直接、更高效的電源流,從而降低電氣復(fù)雜性和維護(hù)需求。要全面提供可能的過(guò)流保護(hù)可靠性和維護(hù)收益,仍需要?jiǎng)?chuàng)新。HVDC 還可降低傳輸損失并提供更好的電壓穩(wěn)定性,確保向關(guān)鍵基礎(chǔ)設(shè)施持續(xù)供電,同時(shí)降低銅纜成本和總體材料成本。這種設(shè)計(jì)可以提高運(yùn)營(yíng)效率,同時(shí)簡(jiǎn)化數(shù)據(jù)中心電源架構(gòu)。
行級(jí)電源管理
在配電中,使用 800 V 總線通道并從 415 V AC 切換到 800 V DC,可通過(guò)相同的導(dǎo)體尺寸多傳輸 85% 的功率。出現(xiàn)這種情況的原因是,較高的電壓會(huì)降低電流需求,降低電阻損耗并提高功率傳輸效率。
“使用較低的電流,較薄的導(dǎo)體可以處理相同的負(fù)載,從而將銅纜需求降低 45%。此外,DC 系統(tǒng)還可消除 AC 特有的低效現(xiàn)象,例如蒙皮效應(yīng)和無(wú)功功率損失,從而進(jìn)一步提高效率。通過(guò)采用 800 V DC 配電,設(shè)施可獲得更高的功率容量、更高的能效和更低的材料成本。”
IT 機(jī)架實(shí)施
“通過(guò)采用直接 800 V 輸入,計(jì)算機(jī)架可以高效地處理電源傳輸,而無(wú)需依賴集成的 AC/DC 轉(zhuǎn)換階段。這些機(jī)架接受兩條 800 V 導(dǎo)體饋送,并利用計(jì)算機(jī)架中的 DC/DC 轉(zhuǎn)換來(lái)驅(qū)動(dòng) GPU 設(shè)備。消除機(jī)架級(jí) AC/DC 轉(zhuǎn)換元件可騰出寶貴空間來(lái)處理更多計(jì)算資源,從而實(shí)現(xiàn)更高密度的配置并提高散熱效率。與需要額外電源模塊的傳統(tǒng) AC/DC 轉(zhuǎn)換相比,直接 800 V 輸入可簡(jiǎn)化設(shè)計(jì),同時(shí)提高性能。”
IT 機(jī)架的 800 V HVDC 配電以及 GPU 的 12 V DC/DC 轉(zhuǎn)換
800 V HVDC 的主要優(yōu)勢(shì)
**可擴(kuò)展性: **使用相同的數(shù)據(jù)中心電力基礎(chǔ)設(shè)施,支持功率在 100 kW 到 1 MW 以上的機(jī)架,從而實(shí)現(xiàn)無(wú)縫擴(kuò)展。
**效率 ** :與當(dāng)前的 54 V 系統(tǒng)相比,端到端效率提升高達(dá) 5%,確保更高的能源利用率。
銅纜減少:與傳統(tǒng)的 415 V AC 或 480 V DC 架構(gòu)相比,800 V HVDC 可顯著減少數(shù)據(jù)中心主干的電流、銅纜用量和熱損耗。
可靠性: 傳統(tǒng)的 IT 機(jī)架式 PSU 依靠過(guò)度配置來(lái)減少機(jī)時(shí)間,但這會(huì)導(dǎo)致頻繁的維護(hù)周期來(lái)更換出現(xiàn)故障的模塊。 雖然集中式電源轉(zhuǎn)換可提高系統(tǒng)可靠性,但在 HVDC 系統(tǒng)中,故障檢測(cè)和可維護(hù)性是關(guān)鍵的創(chuàng)新領(lǐng)域。
IT 機(jī)架式 PSU 的空間限制會(huì)造成散熱挑戰(zhàn),導(dǎo)致在成本和長(zhǎng)期可靠性之間做出權(quán)衡。將 Power Conversion 從機(jī)架中移出可降低這些風(fēng)險(xiǎn)。
**面向未來(lái) ** :旨在滿足 1 MW 機(jī)架的要求,能夠隨著數(shù)據(jù)中心需求的發(fā)展高效擴(kuò)展到更高功率的機(jī)架。
應(yīng)對(duì)設(shè)施級(jí) HVDC 的挑戰(zhàn)
雖然高壓直流架構(gòu)在過(guò)去曾進(jìn)行過(guò)試點(diǎn),但由于技術(shù)和部署方面的挑戰(zhàn),其廣泛采用受到了限制。如今,AI 驅(qū)動(dòng)的機(jī)架密度、電源轉(zhuǎn)換的進(jìn)步以及圍繞電動(dòng)汽車(EV)充電標(biāo)準(zhǔn)建立的工業(yè)基礎(chǔ)的融合正在改變這一格局。
在設(shè)施層面部署 800 V HVDC 給安全、標(biāo)準(zhǔn)和員工培訓(xùn)帶來(lái)了新的挑戰(zhàn)。NVIDIA 及其合作伙伴正在積極研究基于傳統(tǒng) Transformer 的和固態(tài) Transformer (SST) 方法的 CapEx 和 OpEx 以及安全影響,以實(shí)現(xiàn)這一過(guò)渡。
前進(jìn)之路
800 V HVDC 不僅僅是當(dāng)今的機(jī)架,而是面向未來(lái)的 AI 基礎(chǔ)設(shè)施。2027 年,800 V HVDC 數(shù)據(jù)中心將與 NVIDIA Kyber 機(jī)架級(jí)系統(tǒng)同步全面投產(chǎn),確保為要求日益嚴(yán)苛的 AI 模型提供無(wú)縫可擴(kuò)展性。
幫助數(shù)據(jù)中心基礎(chǔ)設(shè)施處理負(fù)載峰值和次秒級(jí) GPU 功率波動(dòng)的能源存儲(chǔ)解決方案是 800 V HVDC 架構(gòu)的一部分。敬請(qǐng)關(guān)注,了解更多詳情。
由于 AI 工作負(fù)載每次查詢所需的計(jì)算量增加了 100 倍到 1000 倍,因此該架構(gòu)可實(shí)現(xiàn)持續(xù)增長(zhǎng),同時(shí)通過(guò)提高效率、可靠性和系統(tǒng)架構(gòu)改進(jìn)將總體擁有成本 (TCO) 降低高達(dá) 30%。
主要效率提升
- 端到端能效提升高達(dá) 5%
- 由于 PSU 故障減少,組件維護(hù)的人工成本降低,維護(hù)成本最多可降低 70%
- 無(wú)需在 IT 機(jī)架內(nèi)配備 AC/DC PSU,從而降低散熱費(fèi)用
NVIDIA 不僅在構(gòu)建速度更快的 GPU,還在重新設(shè)計(jì)整個(gè)功率堆棧,以充分發(fā)揮 AI 的潛力。超高效、MW-scale AI 工廠的時(shí)代由此開(kāi)始。
By Mathias Blake, Martin Hsu, Harry Petty and Jared Huntington
關(guān)于作者
Mathias Blake 是 NVIDIA 杰出的工程師核心技術(shù)。Blake 負(fù)責(zé)確保關(guān)鍵技術(shù)為未來(lái)的 NVIDIA 產(chǎn)品和解決方案做好大規(guī)模生產(chǎn)準(zhǔn)備。他在廣泛的垂直市場(chǎng)背景下?lián)碛卸嗄甑挠布彤a(chǎn)品設(shè)計(jì)經(jīng)驗(yàn)。
Martin Hsu 專注于數(shù)據(jù)中心基礎(chǔ)設(shè)施,專注于與合作伙伴和供應(yīng)商一起管理 NVIDIA MGX 生態(tài)系統(tǒng)。此外,Martin 還代表 NVIDIA 擔(dān)任 VESA 和 HDMI 的董事會(huì)成員。他擁有法國(guó)國(guó)立高等電信學(xué)院 (ENST) 電氣工程碩士學(xué)位和臺(tái)灣 NCTU 電氣工程學(xué)士學(xué)位。
Harry Petty 是一位經(jīng)驗(yàn)豐富的數(shù)據(jù)中心營(yíng)銷人員和技術(shù)專家,曾在大型科技公司擔(dān)任領(lǐng)導(dǎo)職務(wù),為混合云、存儲(chǔ)解決方案、網(wǎng)絡(luò)處理器和服務(wù)器產(chǎn)品線推廣 SDN 產(chǎn)品。他曾與許多客戶合作,在多個(gè)數(shù)據(jù)中心部署應(yīng)用程序。當(dāng) Harry 不討論 HPC 數(shù)據(jù)中心的 IO 子系統(tǒng)時(shí),他喜歡在北加利福尼亞州附近的 Sierra 山麓和湖泊中進(jìn)行戶外活動(dòng)。
Jared Huntington 是一位高級(jí)電源架構(gòu)師,專注于機(jī)架和數(shù)據(jù)中心電源系統(tǒng)。加入 NVIDIA 之前,Jared 從事音頻放大器、功率半導(dǎo)體和筆記本電腦電源適配器的研究。他在 Cal Poly San Luis Obispo 學(xué)習(xí)電氣工程。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5308瀏覽量
106342 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5226瀏覽量
73499 -
AI
+關(guān)注
關(guān)注
88文章
35093瀏覽量
279494 -
HVDC
+關(guān)注
關(guān)注
0文章
28瀏覽量
12532 -
智能工廠
+關(guān)注
關(guān)注
3文章
1081瀏覽量
43247
發(fā)布評(píng)論請(qǐng)先 登錄
數(shù)據(jù)中心電力架構(gòu)革命!英偉達(dá)強(qiáng)推800V HVDC,2年后量產(chǎn)

優(yōu)化800G數(shù)據(jù)中心:高速線纜、有源光纜和光纖跳線解決方案
適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)
請(qǐng)問(wèn)數(shù)據(jù)中心機(jī)房機(jī)架式UPS如何配置合適的UPS電源?
數(shù)據(jù)中心的建設(shè)也看重風(fēng)水
如何去推進(jìn)新一代數(shù)據(jù)中心的發(fā)展?
什么是800V高壓系統(tǒng)?800V高壓系統(tǒng)的驅(qū)動(dòng)力和系統(tǒng)架構(gòu)分析

基于800V平臺(tái)對(duì)電池系統(tǒng)提出的挑戰(zhàn)與應(yīng)對(duì)

華為發(fā)布新一代站點(diǎn)能源架構(gòu)及AI數(shù)據(jù)中心建設(shè)原則
SiC MOSFET模塊在英偉達(dá)800V HVDC電源系統(tǒng)中的技術(shù)優(yōu)勢(shì)與應(yīng)用價(jià)值

NVIDIA 采用納微半導(dǎo)體開(kāi)發(fā)新一代數(shù)據(jù)中心電源架構(gòu) 800V HVDC 方案,賦能下一代AI兆瓦級(jí)算力需求

評(píng)論