AI時代,數(shù)據(jù)是驅(qū)動智能的關(guān)鍵引擎。作為存儲和處理這些數(shù)據(jù)的核心基礎(chǔ)設(shè)施,數(shù)據(jù)中心持續(xù)滋養(yǎng)著我們的數(shù)字世界——
對大眾生活而言,AI大模型的參與,讓搜索和內(nèi)容生成進(jìn)入一個全新階段;
對企業(yè)而言,要實現(xiàn)工業(yè)自動化,需要基于AI分析優(yōu)化改進(jìn)控制流程;
對政府機構(gòu)亦是如此,更多、更廣泛的數(shù)據(jù)將促進(jìn)決策和政策制定......
據(jù)施耐德電氣估算,到2028年,人工智能電力消耗將占數(shù)據(jù)中心總電力消耗的15%-20%。AI需要愈加澎湃的算力助其不斷演進(jìn),也為數(shù)據(jù)中心的設(shè)計和運營帶來顛覆性的變革。
急需“重塑根骨”的數(shù)據(jù)中心將何去何從?
施耐德電氣通過分析人工智能工作負(fù)載的相關(guān)屬性和趨勢,針對數(shù)據(jù)中心多個物理基礎(chǔ)設(shè)施類別提供應(yīng)對指南,幫助大家尋獲破局之法。
4個根本原因驅(qū)動數(shù)據(jù)中心革新
當(dāng)前數(shù)據(jù)中心相關(guān)企業(yè)主要面臨三個挑戰(zhàn):
首先是如何在確保計算與存儲能力提升的同時,建設(shè)可持續(xù)發(fā)展的數(shù)據(jù)中心;
第二個挑戰(zhàn)是在數(shù)字化基礎(chǔ)設(shè)施方面,如何更好地利用覆蓋全生命周期的數(shù)字化軟件,貫穿設(shè)計、建造和運營維護,從而提升速度、準(zhǔn)確性和可持續(xù)性;
第三個挑戰(zhàn)是如何實現(xiàn)由傳統(tǒng)基礎(chǔ)設(shè)施建設(shè)向智能、數(shù)字化的基礎(chǔ)設(shè)施轉(zhuǎn)變。
其中,傳統(tǒng)的基礎(chǔ)設(shè)施之所以面臨挑戰(zhàn),與生成式人工智能(如ChatGPT)的涌現(xiàn)和AI相關(guān)的數(shù)據(jù)需求激增密切相關(guān)。
為了更好地實現(xiàn)大規(guī)模的高性能計算,數(shù)據(jù)中心需要解決由人工智能工作負(fù)載、GPU的熱設(shè)計功耗(TDP)、網(wǎng)絡(luò)延遲、人工智能集群規(guī)模所帶來的一系列問題。因此,擁有更智能與數(shù)字化的物理基礎(chǔ)設(shè)施,將成為AI席卷下數(shù)據(jù)中心升級過程中的重要發(fā)力點。
錨定關(guān)鍵挑戰(zhàn)重塑高性能數(shù)據(jù)中心
數(shù)據(jù)中心基礎(chǔ)設(shè)施演變涉及供配電、制冷、機柜等多個方面。依托前沿的行業(yè)洞察和豐富實踐經(jīng)驗,施家基于創(chuàng)新技術(shù)與解決方案,融合數(shù)字化服務(wù)與創(chuàng)新型服務(wù),為數(shù)據(jù)中心的重塑提供四個可靠思路。
01優(yōu)化供配電系統(tǒng),提高數(shù)據(jù)中心韌性
AI工作負(fù)載主要分為訓(xùn)練和推理。訓(xùn)練所需的大規(guī)模機柜陣列,組成了“人工智能集群”,增加了供電壓力。而推理所需工作負(fù)載通常為業(yè)務(wù)關(guān)鍵型負(fù)載,需要具備更高韌性。因此,我們可采取以下5點措施,對供配電系統(tǒng)進(jìn)行優(yōu)化:
加大配電模塊的規(guī)格,滿足高密度集群的需求。
改用多個現(xiàn)成的標(biāo)準(zhǔn)rPDU,或采用額定電流大于60A和63A的定制化rPDU增加容量。
通過弧閃風(fēng)險評估和負(fù)載分析,使用適當(dāng)?shù)?a target="_blank">連接器、插座和rPDU,以減少弧閃危害。
人工智能負(fù)載缺乏變化,易增加上游斷路器脫扣的風(fēng)險。需確保主斷路器與負(fù)載總和匹配,不建議過載使用。
分析人工智能集群內(nèi)的所有負(fù)載,以確保使用適當(dāng)?shù)倪B接器和插座。避免機柜溫度過高,增加故障風(fēng)險和安全隱患。
02改變傳統(tǒng)的制冷方式,從風(fēng)冷轉(zhuǎn)向液冷
盡管風(fēng)冷一直是IT行業(yè)的主流選擇,但大型人工智能集群中的服務(wù)器難以分散放置等諸多因素,正迫使數(shù)據(jù)中心逐漸從風(fēng)冷向液冷轉(zhuǎn)變。
然而,液冷的應(yīng)用也存在很多的挑戰(zhàn),如缺乏標(biāo)準(zhǔn)化設(shè)計、缺乏運維經(jīng)驗等。數(shù)據(jù)中心需采取以下6點針對性措施,應(yīng)對制冷挑戰(zhàn):
機柜功率密度20kW以下可采用風(fēng)冷,人工智能集群機柜功率密度超過20kW,推薦采用液冷服務(wù)器。
部署液冷技術(shù)之前,需要對液冷負(fù)載和設(shè)施的現(xiàn)有條件進(jìn)行設(shè)計評估。
由于不確定的未來TDP增加了制冷設(shè)計淘汰的風(fēng)險,建議在設(shè)計制冷系統(tǒng)時要考慮到風(fēng)冷和液冷技術(shù)的兼容性。
由專家對液冷設(shè)計進(jìn)行全面評估,并制定詳細(xì)規(guī)劃,減少操作失誤和故障風(fēng)險。
選擇可靠的供應(yīng)商,并應(yīng)制定應(yīng)急操作流程(EOP),減少IT機柜內(nèi)漏液的風(fēng)險。
為實現(xiàn)可持續(xù)發(fā)展,建議使用采用水作為冷卻液的冷板式液冷。
03升級所需機柜,實現(xiàn)量體裁衣
由于人工智能服務(wù)器深度和重量不斷增加,因此,機柜也需要針對性變化,以適配優(yōu)化后的機群。
建議至少采用750毫米寬的機柜,以容納所需的配電和制冷裝置安裝空間。
為IT機柜配有可調(diào)節(jié)的安裝軌道,以適應(yīng)不同IT設(shè)備深度。
建議將人工智能訓(xùn)練集群部署在48U或高度更高的機柜上。
建議指定機柜的靜態(tài)承重能力大于1,800kg,動態(tài)承重能力大于1,200kg,并評估數(shù)據(jù)中心地板,確保其滿足承重需求。
04應(yīng)用軟件工具,賦能運營管理
在管理人工智能集群時,應(yīng)用軟件工具可降低復(fù)雜電氣網(wǎng)絡(luò)出現(xiàn)意外故障的風(fēng)險,并為布局的決策提供依據(jù)。其中,EPMS和DCIM能準(zhǔn)確查看當(dāng)前的配電能力及其趨勢,包括IT空間內(nèi)的大容量電力和配電級別,電氣設(shè)計(又稱電力系統(tǒng)工程)軟件工具可簡化數(shù)據(jù)收集和計算工作,數(shù)字化單線圖(iSLD)優(yōu)化安全評估過程,更是讓維護工作的復(fù)雜性大大降低。
通過軟件工具,對整個IT空間(包括機柜中的設(shè)備和虛擬機)創(chuàng)建數(shù)字孿生,實現(xiàn)數(shù)據(jù)中心可視化,也能盡可能增大動態(tài)環(huán)境中的容錯裕量,降低運營風(fēng)險,解鎖數(shù)據(jù)中心運維的“新境界”。
凡事預(yù)則立,無論是“東數(shù)西算”工程,還是“算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動”等,都在進(jìn)一步明確數(shù)據(jù)中心產(chǎn)業(yè)變革在加速推進(jìn)。面對“萬物皆可AI”的智算浪潮,施家正積極從產(chǎn)品、技術(shù)到服務(wù)多方面,持續(xù)賦能數(shù)據(jù)中心的升級迭代。
未來
以創(chuàng)新為引擎的施耐德電氣
將持續(xù)以行業(yè)前沿理念為基礎(chǔ),推動面向未來的數(shù)字化基礎(chǔ)設(shè)施建設(shè),助力數(shù)據(jù)中心提升能效、提高可用性和實現(xiàn)可持續(xù)發(fā)展,幫助更多企業(yè)共贏數(shù)智未來。
審核編輯:湯梓紅
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5177瀏覽量
73316 -
AI
+關(guān)注
關(guān)注
88文章
34657瀏覽量
276518 -
施耐德電氣
+關(guān)注
關(guān)注
0文章
214瀏覽量
15779
原文標(biāo)題:重磅白皮書 | AI驅(qū)動數(shù)據(jù)中心重塑根骨,升級煥新!
文章出處:【微信號:施耐德電氣,微信公眾號:施耐德電氣】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
施耐德電氣助力數(shù)據(jù)中心突破電力系統(tǒng)運維瓶頸
安科瑞能為數(shù)據(jù)中心電氣規(guī)劃及供配電系統(tǒng)提供哪些方案

施耐德電氣發(fā)布數(shù)據(jù)中心高密度AI集群部署解決方案

施耐德電氣新型電力系統(tǒng)創(chuàng)新中心正式啟用
適用于數(shù)據(jù)中心和AI時代的800G網(wǎng)絡(luò)
華為攜手中控技術(shù)打造全國數(shù)據(jù)中心網(wǎng)絡(luò)創(chuàng)新示范項目
施耐德電氣如何助力數(shù)據(jù)中心行業(yè)平衡能耗與算力
施耐德電氣即將亮相2025中國數(shù)據(jù)中心液冷技術(shù)大會
施耐德電氣助力數(shù)據(jù)中心運維管理

速看!Atlassian云版與數(shù)據(jù)中心版的創(chuàng)新進(jìn)展
全球視野 算領(lǐng)未來,施耐德電氣助力數(shù)據(jù)中心把握智算機遇

施耐德電氣亮相2024進(jìn)博會
當(dāng)今數(shù)據(jù)中心新技術(shù)趨勢
施耐德電氣與英偉達(dá)推出首個智算中心參考設(shè)計
RFID無線測溫技術(shù)在數(shù)據(jù)中心管理中的革新與應(yīng)用。

評論