作者簡(jiǎn)介
本文是第二屆電力電子科普征文大賽的獲獎(jiǎng)作品,來自上海科技大學(xué)的諸葛英健投稿。
2
AI還是個(gè)耗水狂魔
根據(jù)蘭道爾原理,處理信息是有能量成本的。但這一部分只是AI耗電中的一小部分,更多的能量消耗來自焦耳定律。
當(dāng)芯片在進(jìn)行信息處理時(shí),其中的晶體管會(huì)在開關(guān)狀態(tài)中進(jìn)行切換,而這就產(chǎn)生了電流。又由于電路中電阻的存在,這些能量不可避免地轉(zhuǎn)化成熱能。目前臺(tái)積電等芯片巨頭已經(jīng)在積極推進(jìn)2nm工藝節(jié)點(diǎn),在每平方毫米的面積上,植入3億顆晶體管。即使單個(gè)晶體管產(chǎn)生的熱量微乎其微,但在這么大的體量下,熱量還是不容忽視的。以英偉達(dá)最新的B200芯片為例,其內(nèi)含超過2080億個(gè)晶體管,可想而知熱量一定相當(dāng)可觀。
要進(jìn)行散熱,早些年利用空調(diào)冷卻系統(tǒng)來降溫,但這因?yàn)樘M(fèi)電而逐漸淘汰,轉(zhuǎn)為利用水。
根據(jù)美國(guó)加州大學(xué)河濱分校的一項(xiàng)研究發(fā)現(xiàn),ChatGPT等大模型的用水量令人吃驚。僅僅是訓(xùn)練GPT-3,15天就用掉了70萬升水,更別說GPT-4等參數(shù)更多的大模型了。而在后續(xù)的使用中,據(jù)估計(jì),每交流10-50個(gè)問題,就需要500ml水來降溫。根據(jù)谷歌2024年環(huán)境報(bào)告,2023年谷歌總用水量為64億加侖,同比增長(zhǎng)了14%,其中數(shù)據(jù)中心用水用水量61億加侖,同比增加17%[5]。61億加侖,換算過來大約2379萬立方米,足足可以裝滿一個(gè)半西湖。
除了運(yùn)營(yíng)維護(hù)過程中耗水,在生產(chǎn)芯片階段,也需要消耗大量的水資源。制造芯片需要在晶圓上燒刻電路,而這一過程中需要大量的超純水進(jìn)行沖洗。據(jù)悉,制造8英寸晶圓每小時(shí)耗水250立方米,12英寸晶圓耗水則達(dá)到500立方米,也就是說,平均生產(chǎn)一個(gè)2克重的計(jì)算機(jī)芯片,就需要32公斤的水資源。根據(jù)報(bào)道,臺(tái)積電2nm晶圓代工廠每日用水量預(yù)計(jì)約為4.3萬噸。
根據(jù)預(yù)測(cè),到2027年,全球人工智能需求可能會(huì)產(chǎn)生42-66億立方米的取水量,這相當(dāng)于丹麥每年取水總量的4-6倍。
耗水問題也制約著人工智能的飛速發(fā)展。盡管業(yè)界已經(jīng)采取了許多措施來應(yīng)對(duì)這些挑戰(zhàn),包括提高水資源利用率、推廣水資源循環(huán)利用技術(shù)、加強(qiáng)廢水處理、利用再生水等。另一方面,利用天然冷水資源為數(shù)據(jù)中心降溫,例如阿里云千島湖數(shù)據(jù)中心、微軟北方群島數(shù)據(jù)中心等,但這依然面臨著嚴(yán)峻的挑戰(zhàn)。
3
能耗優(yōu)化新動(dòng)態(tài)
在解決AI能耗的問題上,業(yè)內(nèi)已經(jīng)使出了渾身解數(shù)。
第一個(gè)辦法就是開源。
利用風(fēng)能、光伏等可再生能源,以及核能,作為數(shù)據(jù)中心的運(yùn)行能量。早在2021年,OpenAI CEO Sam Altman就投資了核聚變初創(chuàng)公司Helion Energy。2023年,亞馬遜總購(gòu)電量8.8GW,其中超60%的交易為購(gòu)買光伏發(fā)電,其余為購(gòu)買風(fēng)電。亞馬遜表示,其目前90%的電力都來自可再生能源,并在2025年將比例提升至100%。而開源這一辦法與我國(guó)之前提出的“東數(shù)西算”工程相契合,引導(dǎo)數(shù)據(jù)中心向西部資源豐富地區(qū)聚集。
圖7. 東數(shù)西算八大樞紐 | @ 國(guó)際科技創(chuàng)新中心
第二個(gè)辦法就是節(jié)流。
節(jié)流一方面要從AI本身去降低能耗。剪枝(pruning)、量化(quantization)、蒸餾(distillation)等技術(shù)有望帶來更好的算法,讓 AI 模型更快、更節(jié)能。通過優(yōu)化大模型架構(gòu),優(yōu)化模型參數(shù),從而降低訓(xùn)練及使用的能耗。例如,微軟在4月發(fā)布的Phi-3小語言模型,其中Phi-3 small僅僅使用70億個(gè)參數(shù),在性能表現(xiàn)上就優(yōu)于GPT3.5-T等大模型。在硬件層面,通過設(shè)計(jì)更加高效的芯片,例如AI模型訓(xùn)練專用芯片、專用推理芯片等,可以大大提升效率以及降低能耗。例如,英偉達(dá)最新集成了Blackwell芯片的GB200 NVL72,相較之前提出的Hopper,推理能力提升了30倍,訓(xùn)練能力提升4倍,能源使用效率提升25倍。
圖8. GB200 NVL72 | @ NVIDIA
節(jié)流的另一方面就是降低冷卻能耗和能量回收。華為蕪湖數(shù)據(jù)中心利用直通風(fēng)、液冷和云軟件智能調(diào)節(jié),將液冷機(jī)房年均PUE降至1.1,遠(yuǎn)高于行業(yè)水平,每100萬臺(tái)服務(wù)器每年可節(jié)省約10億度電。除了利用自然冷卻、液冷等技術(shù)降低數(shù)據(jù)中心能耗以外,利用余熱回收技術(shù)進(jìn)行跨季節(jié)儲(chǔ)熱,可以在供暖期間將儲(chǔ)存的熱量供給需求側(cè),如騰訊天津數(shù)據(jù)中心、阿里巴巴千島湖數(shù)據(jù)中心、Facebook丹麥數(shù)據(jù)中心等。
除此以外,政策層面也需要一定程度的監(jiān)管。截至2023年,美國(guó)AI相關(guān)的監(jiān)管機(jī)構(gòu)已經(jīng)增加到了21個(gè),并頒布了相關(guān)法規(guī)[5]。2024年3月,歐盟通過了世界上第一個(gè)全面的人工智能法律框架——《人工智能法案》。法案要求AI企業(yè)進(jìn)行一定的信息披露,并致力于更高效、可持續(xù)的大模型開發(fā)。2023年4月11日,國(guó)家網(wǎng)信辦發(fā)布了《生成式人工智能服務(wù)管理辦法(征求意見稿)》,對(duì)生成式人工智能發(fā)展和規(guī)范應(yīng)用提出了一系列要求。除此以外,北京及內(nèi)蒙古等地都發(fā)布文件,限制數(shù)據(jù)中心冷卻使用地下水、引導(dǎo)利用再生水等。
4
結(jié)語
人工智能正在引領(lǐng)一場(chǎng)科技革命,帶給世界深遠(yuǎn)影響和巨大潛力。而人工智能的飛速發(fā)展,我們也面臨著前所未有的挑戰(zhàn)。在人工智能重塑世界的同時(shí),我們也應(yīng)該關(guān)注能源領(lǐng)域的進(jìn)展,也許聚變的科技點(diǎn)就在AI之后。
-
AI
+關(guān)注
關(guān)注
88文章
35194瀏覽量
280300 -
能源
+關(guān)注
關(guān)注
3文章
2029瀏覽量
44679
發(fā)布評(píng)論請(qǐng)先 登錄
AI的盡頭是能源?(1)

AI+新能源,共創(chuàng)多贏!易事特集團(tuán)2025數(shù)字能源合作伙伴聯(lián)席大會(huì)圓滿舉行

Banana Pi 最新邊緣 AI 系統(tǒng)模塊 BPI-AI2N 采用瑞薩電子 RZ/V2N

晶科能源N型TOPCon組件滿足AI數(shù)據(jù)中心的能源剛需
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
華為發(fā)布新一代站點(diǎn)能源架構(gòu)及AI數(shù)據(jù)中心建設(shè)理念

Banana Pi 與瑞薩電子攜手共同推動(dòng)開源創(chuàng)新:BPI-AI2N
華為發(fā)布新一代站點(diǎn)能源架構(gòu)及AI數(shù)據(jù)中心建設(shè)原則
安科瑞緊跟時(shí)代潮流,推出AI企業(yè)能源管控平臺(tái)

AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
生成式AI的興起引發(fā)能源與環(huán)境雙重挑戰(zhàn)
《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感
你認(rèn)為嵌入式軟件開發(fā)的盡頭是什么?

名單公布!【書籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

評(píng)論