準(zhǔn)確的天氣模型對(duì)于企業(yè)正確預(yù)測(cè)可再生能源的生產(chǎn)和制定自然災(zāi)害預(yù)案至關(guān)重要。僅 2022 年,無(wú)效和無(wú)法預(yù)測(cè)的天氣就造成了約 7140 億 美元的損失。為了避免這種情況,企業(yè)需要更快、更便宜、更精準(zhǔn)的天氣模型。
在 GTC23上,微軟和 TempoQuest 詳細(xì)介紹了他們?nèi)绾闻c NVIDIA 合作一起解決這個(gè)能源和氣候問(wèn)題。NVIDIA 初創(chuàng)加速計(jì)劃成員 TempoQuest 實(shí)現(xiàn)了超本地、低延遲的天氣和環(huán)境預(yù)測(cè)。該多學(xué)科合作團(tuán)隊(duì)涵蓋大氣科學(xué)、氣象學(xué)、高性能計(jì)算(HPC)AI、機(jī)器學(xué)習(xí)(ML)、工程等領(lǐng)域,是將 GPU 引入環(huán)境領(lǐng)域的先鋒,包括:
-
第一個(gè)將 WRF 移植到 GPU 上
-
第一個(gè)以比基于 CPU 的預(yù)測(cè)更快、更便宜的方式創(chuàng)建更高分辨率的預(yù)測(cè)
-
第一個(gè)開(kāi)發(fā)出 GPU 軟件即服務(wù)的天氣預(yù)報(bào)系統(tǒng)
本文中將介紹 TempoQuest 如何利用微軟 Azure 上的 NVIDIA 加速計(jì)算,將傳統(tǒng)的天氣研究和預(yù)報(bào)(WRF)軟件移植到 GPU 上、提供高于 1 公里的分辨率以及 1 分鐘至 1 小時(shí)的時(shí)間分辨率并加快對(duì)可再生風(fēng)能和太陽(yáng)能資源發(fā)電的預(yù)測(cè)。
公用事業(yè)單位在整合可再生能源過(guò)程中所面臨的挑戰(zhàn)
公用事業(yè)單位在他們的電網(wǎng)中使用可再生能源(主要是風(fēng)能和太陽(yáng)能)是具有挑戰(zhàn)性的。這些能源因環(huán)境因素而異,比如云層覆蓋和風(fēng)速等。如果可再生能源的發(fā)電量不足以滿(mǎn)足需求,公用事業(yè)單位必須使用“旋轉(zhuǎn)備用”,即由發(fā)電機(jī)生產(chǎn)的碳基電力來(lái)彌補(bǔ)缺口。為了更好地預(yù)測(cè)可再生能源發(fā)電,需要快速、準(zhǔn)確、經(jīng)濟(jì)的天氣預(yù)報(bào)。

圖 1 標(biāo)準(zhǔn)電網(wǎng)基礎(chǔ)設(shè)施示意圖,包括發(fā)電、輸電和配電
能源行業(yè)需要實(shí)現(xiàn)三個(gè)關(guān)鍵功能:發(fā)電、輸電和配電。發(fā)電目前主要使用碳基燃料,但正在向包括風(fēng)能和太陽(yáng)能在內(nèi)的可再生能源過(guò)渡,以實(shí)現(xiàn)凈零排放。輸電指的是產(chǎn)生的電力通過(guò)升壓變壓器后經(jīng)高壓線傳輸。在遙遠(yuǎn)的電網(wǎng)邊緣,電力經(jīng)變壓器和變電站“降壓”后,輸送給家庭和企業(yè)的用電者(240 V / 120 V)。
如果要在電網(wǎng)中增加更多可再生能源,公用事業(yè)單位不僅要整合新的發(fā)電站,還要建造更多高壓輸電線路和塔架。這就給電網(wǎng)維護(hù)帶來(lái)了更高的復(fù)雜性和成本,包括投資和運(yùn)營(yíng)費(fèi)用。高分辨率的 GPU 加速 WRF 可以通過(guò)減少對(duì)碳基電力的依賴(lài)和優(yōu)化可再生能源的使用幫助實(shí)現(xiàn)這一目標(biāo)。
使用 GPU 加速 WRF
AceCAST 代表“加速預(yù)測(cè)”,通過(guò)運(yùn)行一個(gè)名為“天氣研究和預(yù)報(bào)”(WRF)的區(qū)域模型可實(shí)現(xiàn)加速預(yù)測(cè)。目前,已有 160 個(gè)國(guó)家的 5 萬(wàn)名用戶(hù)使用該模型。通過(guò)將 WRF 移植到使用專(zhuān)有的 OpenACC 和 CUDA 帶有 NVIDIA GPU 的 x86 系統(tǒng)上運(yùn)行,并在多 GPU 和多節(jié)點(diǎn)系統(tǒng)上進(jìn)行擴(kuò)展。AceCAST 支持所有主要的 WRF 動(dòng)力學(xué)、物理學(xué)方案和名詞表選項(xiàng),可直接取代現(xiàn)有的 WRF 配置。
AceCAST 的眾多優(yōu)點(diǎn)包括更快的求解時(shí)間、更高的分辨率和精度、對(duì)局部天氣現(xiàn)象更加深入的認(rèn)識(shí)以及更低的計(jì)算成本。
測(cè)試表明,在天氣預(yù)報(bào)和可再生能源預(yù)測(cè)方面,GPU 比 CPU 速度更快、分辨率更高且更具成本效益。這一加速解決方案對(duì)于減少碳排放、提升電網(wǎng)可靠性和管理以及降低用電者的用電成本十分重要。
AceCAST 驗(yàn)證和性能成本分析
為了驗(yàn)證基準(zhǔn)測(cè)試結(jié)果,首先要保證 CPU WRF 與 GPU WRF 的差異在可接受的范圍內(nèi)。團(tuán)隊(duì)在幾個(gè)時(shí)間和空間預(yù)測(cè)范圍內(nèi)測(cè)試了模型性能,最終驗(yàn)證了數(shù)千個(gè)測(cè)試案例,以確保 AceCAST 產(chǎn)生與 CPU WRF 相同的結(jié)果。在微軟 Azure 上運(yùn)行性能測(cè)試時(shí),團(tuán)隊(duì)發(fā)現(xiàn)兩者在性能和成本上都有很大的差異。
基于 CPU 的 WRF – Standard HB120rs_v3 VMs(HBv3):
-
120 顆 AMD EPYC7V73X 系列(Milan-X)CPU 核
-
450 GB 內(nèi)存( 350 GB/s 內(nèi)存帶寬)
-
200 Gb/s HDR InfiniBand
-
2 個(gè)1 TB NVMe 固態(tài)硬盤(pán)
-
NCAR WRF 4.2.2
-
使用 Parallel net-CDF
-
使用英特爾編譯器和 MPI 進(jìn)行編譯
GPU 加速 WRF - Standard_ND96amsr_A100_v4(NDmv4):
-
8 個(gè) NVIDIA A100 Tensor Core GPUs (80GB)
-
NVLink 3.0(200 Gb/s HDR InfiniBand)
-
96 顆 AMD EPYC7V12 系列(Rome)CPU 核
-
8 個(gè) 1 TB NVMe 固態(tài)硬盤(pán)
-
AceCAST 2.1
-
使用 OpenACC 和 CUDA 的專(zhuān)有實(shí)現(xiàn)
-
使用 MPI 在多節(jié)點(diǎn)和多 GPU 上進(jìn)行擴(kuò)展
Azure 代管式 Lustre 文件系統(tǒng)
-
40 TiB 存儲(chǔ)Azure 代管容量
-
10000 MB/s 最大吞吐量

圖 2 基于 CPU 的 WRF 與 TempoQuest AceCAST 的性能價(jià)格比較分析
結(jié)果顯示,與一個(gè)節(jié)點(diǎn)上基于 CPU 的 WRF 相比,一個(gè)節(jié)點(diǎn)上的 GPU 加速 WRF(AceCAST)的速度加快了約 9 倍,而要實(shí)現(xiàn)與一個(gè) GPU 節(jié)點(diǎn)類(lèi)似的性能,需要 18 個(gè) CPU 節(jié)點(diǎn)。這些結(jié)果至關(guān)重要,因?yàn)楦臁⒏统杀镜奶鞖忸A(yù)報(bào)使公用事業(yè)單位能夠更加準(zhǔn)確地預(yù)測(cè)可再生能源發(fā)電、提供穩(wěn)定可靠的電力并避免過(guò)長(zhǎng)時(shí)間的停電。
AceCAST 3.0.1 上的進(jìn)一步測(cè)試顯示其可繼續(xù)提升性能。團(tuán)隊(duì)使用了一個(gè)嵌套域,外域由 500 萬(wàn)個(gè)網(wǎng)格點(diǎn)(430x331x38v)和 15 公里的網(wǎng)格間距組成,內(nèi)域由 8000 萬(wàn)個(gè)網(wǎng)格點(diǎn)(1551x1361x38v)和 3 公里的網(wǎng)格間距組成。

圖 3 TempoQuest AceCAST 以最佳配置運(yùn)行一項(xiàng)作業(yè)的性能成本圖
結(jié)果顯示,AceCAST 在 1xNDmA100V4(8 個(gè) GPU)上的內(nèi)域計(jì)算和通信時(shí)間比 1xHBv3(64 個(gè)CPU)快 16.8 倍。單個(gè)作業(yè)的最佳配置是在 16 個(gè) HBv3(CPU)虛擬機(jī)上運(yùn)行 WRF,在 1 個(gè)包含 8 個(gè) GPU 的 NDmA100(GPU)虛擬機(jī)上運(yùn)行 AceCAST。在這種情況下,AceCAST 比基于 CPU 的 WRF 運(yùn)行速度快 7%,成本低 75%。
可再生發(fā)電功率預(yù)測(cè)
最后一步是將 AceCAST 應(yīng)用于可再生能源預(yù)測(cè)。美國(guó)的公用事業(yè)單位掌握著所有 7 萬(wàn)多臺(tái)風(fēng)力發(fā)電機(jī)的規(guī)格以及每個(gè)風(fēng)能和太陽(yáng)能節(jié)點(diǎn)的位置。通過(guò)使用專(zhuān)有的天氣-電力算法,AceCAST 可提供更高的預(yù)測(cè)分辨率,每天對(duì)特定可再生能源發(fā)電站點(diǎn)作出小時(shí)級(jí)的精確功率預(yù)測(cè)(MW)。
電網(wǎng)脫碳化
隨著發(fā)電資產(chǎn)從集中化的碳基技術(shù)過(guò)渡到清潔的分布式能源資源,電網(wǎng)面臨著實(shí)時(shí)管理供需的挑戰(zhàn)。通過(guò)預(yù)測(cè)可再生資產(chǎn)的性能,電力公司能夠提高電網(wǎng)的可靠性和彈性。NVIDIA、微軟和 TempoQuest 正在聯(lián)手幫助解決這一重大的社會(huì)及全球挑戰(zhàn)。
憑借 AceCAST 這一 GPU 加速 WRF,TempoQuest 正在以更低的成本加速風(fēng)能和太陽(yáng)能可再生資源的發(fā)電功率預(yù)測(cè)。這有助于優(yōu)化負(fù)載和發(fā)電的平衡、減少公用事業(yè)單位的運(yùn)營(yíng)成本、管理可再生能源輸出的波動(dòng)并產(chǎn)生更加可靠的預(yù)測(cè),進(jìn)而減少對(duì)碳基電力儲(chǔ)備的依賴(lài)。
點(diǎn)擊“閱讀原文”深入了解加速計(jì)算,訪問(wèn) GPU 加速庫(kù)論壇。
掃描下方海報(bào)二維碼,觀看 NVIDIA 創(chuàng)始人兼 CEO 黃仁勛在 COMPUTEX 2023 的主題演講直播回放,主題演講中文字幕版已上線,了解 AI、圖形及其他領(lǐng)域的最新進(jìn)展!
原文標(biāo)題:微軟和 TempoQuest 利用 AceCast 加速風(fēng)能預(yù)測(cè)
文章出處:【微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
-
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3912瀏覽量
93028
原文標(biāo)題:微軟和 TempoQuest 利用 AceCast 加速風(fēng)能預(yù)測(cè)
文章出處:【微信號(hào):NVIDIA_China,微信公眾號(hào):NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
雅詩(shī)蘭黛利用微軟科技AI技術(shù)加速高端美妝創(chuàng)新
QNX與微軟攜手加速軟件定義汽車(chē)創(chuàng)新
QNX攜手微軟加速軟件定義汽車(chē)發(fā)展
NVIDIA預(yù)測(cè)2025年AI行業(yè)發(fā)展
微軟股東投票反對(duì)配置比特幣
微軟與FIDO利用AI技術(shù)精準(zhǔn)定位漏水點(diǎn)
微軟攜手英偉達(dá)與GitHub推出生成式AI加速器
MathWorks亮相2024北京國(guó)際風(fēng)能大會(huì)
印孚瑟斯與微軟擴(kuò)大戰(zhàn)略合作,加速客戶(hù)云與AI轉(zhuǎn)型
PCB風(fēng)能板:為可持續(xù)發(fā)展注入新動(dòng)力
利用邊沿速率加速器和自動(dòng)感應(yīng)電平轉(zhuǎn)換器

評(píng)論