電子發(fā)燒友網(wǎng)報(bào)道(文/黃晶晶)日前,AMD推出Alveo V80加速卡,Versal FPGA自適應(yīng)SoC搭配HBM,可處理計(jì)算以及內(nèi)存密集型的工作負(fù)載,用于高性能計(jì)算、數(shù)據(jù)分析、金融科技、存儲(chǔ)壓縮等等。
突破網(wǎng)絡(luò)訪問(wèn)和內(nèi)存的瓶頸
此次Alveo V80為何采用HBM高速內(nèi)存,AMD 自適應(yīng)和嵌入式計(jì)算事業(yè)部( AECG )高級(jí)產(chǎn)品線經(jīng)理Shyam Chander分析,在傳統(tǒng)的處理器架構(gòu)中,無(wú)論是存儲(chǔ)器還是網(wǎng)絡(luò)訪問(wèn)都容易形成瓶頸。網(wǎng)絡(luò)接口只支持25G、100G,內(nèi)存采用DDR而FPGA的帶寬遠(yuǎn)高于內(nèi)存提供的帶寬。
那么Alveo V80針對(duì)于這兩個(gè)問(wèn)題進(jìn)行了優(yōu)化,帶來(lái)顯著的性能提升。內(nèi)存采用高帶寬存儲(chǔ)器HBM2e,提供820 GB/s 的存儲(chǔ)器帶寬,容量達(dá)32GB。網(wǎng)絡(luò)訪問(wèn)上采用QSFP56光纖模塊可以支持從10G到800G的帶寬,支持4X200G,以及4X10G/25G/40G/50G等不同工作模式。
這款加速卡采用全高、3/4 長(zhǎng)( FH?L )尺寸規(guī)格,由 AMD Versal HBM 自適應(yīng) SoC 提供支持,具備 2,600,000 個(gè) LUT 邏輯單元的 FPGA 架構(gòu)、10,848 個(gè) DSP 計(jì)算邏輯片以及 820 GB/s 的存儲(chǔ)器帶寬。
與前代產(chǎn)品 AMD Alveo U55C 計(jì)算加速卡相比,Alveo V80 的邏輯密度至高翻倍、存儲(chǔ)器帶寬至高翻倍且網(wǎng)絡(luò)帶寬可高至 4 倍,可以實(shí)現(xiàn)強(qiáng)大的計(jì)算集群,同時(shí)還能優(yōu)化卡、服務(wù)器數(shù)量以及機(jī)架空間。
Alveo V80還配有32GB DDR DIMM擴(kuò)展插槽,MCIO擴(kuò)展端口可直連NVMe驅(qū)動(dòng)器,實(shí)現(xiàn)存儲(chǔ)卡的連接。系統(tǒng)連接總線支持PCIe 5.0接口,可達(dá)64GB/秒傳輸速率。整卡功率300W,采用被動(dòng)散熱,總熱設(shè)計(jì)功耗TDP則取決于器件和服務(wù)器。
V80集成高帶寬網(wǎng)絡(luò)核心600G以太網(wǎng)和400G加密引擎,硬化基礎(chǔ)設(shè)施連接包括DDR控制器、支持DMA的PCIe 5.0、可編程片上網(wǎng)絡(luò)。Shyam Chander表示,基于這些硬化的功能,用戶沒(méi)有必要使用軟性的IP進(jìn)行部署。
通常來(lái)說(shuō),傳統(tǒng)的加速卡(如GPU)要與CPU進(jìn)行連接,這會(huì)限制能夠使用的加速卡的數(shù)量。但是V80能夠避開CPU到加速卡的PCle瓶頸、低時(shí)延處理傳入的網(wǎng)絡(luò)數(shù)據(jù),消除分立式網(wǎng)絡(luò)接口卡、實(shí)現(xiàn)每服務(wù)器的卡數(shù)和計(jì)算密度最大化。同時(shí),按照需求以網(wǎng)絡(luò)限速的方式管理傳入的數(shù)據(jù),包括在線加密、數(shù)據(jù)包監(jiān)控、傳感器處理等等。
傳統(tǒng)架構(gòu)是固定的緩存層次用于數(shù)據(jù)的讀取和寫入,不規(guī)則的訪問(wèn)模式會(huì)降低效率。而V80的自適應(yīng)計(jì)算,擁有靈活的架構(gòu),在計(jì)算附近分配內(nèi)存,從而降低延遲和低功耗,并可以靈活適應(yīng)自定義的數(shù)據(jù)類型和數(shù)據(jù)遷移。
AMD同時(shí)提供設(shè)計(jì)示例AVED,可在GitHub上獲取,以及用戶可繼續(xù)使用 Vivado設(shè)計(jì)套件,從而硬件開發(fā)者能夠更快地上手,助其縮短開發(fā)上市時(shí)間。
大規(guī)模加速內(nèi)存密集型工作負(fù)載
Alveo V80加速卡可以應(yīng)對(duì)很多大數(shù)據(jù)工作負(fù)載,包括高性能計(jì)算,包括基因組學(xué)和傳感器處理、數(shù)據(jù)分析(像欺詐檢測(cè));金融科技,包括風(fēng)險(xiǎn)分析和算法交易;還有網(wǎng)絡(luò)安全,像數(shù)據(jù)包監(jiān)控;存儲(chǔ)壓縮,這是一個(gè)非常關(guān)鍵的工作負(fù)載。另外在AI計(jì)算領(lǐng)域,包括推薦引擎和大語(yǔ)言模型等等。因此可以幫助客戶大規(guī)模加速以上工作負(fù)載,可以加快數(shù)據(jù)處理的速度,同時(shí)還能夠進(jìn)行實(shí)時(shí)的洞見(jiàn)和分析。
以傳感器處理為例,聯(lián)邦科學(xué)與工業(yè)研究組織( CSIRO )是澳大利亞的國(guó)立研究組織,其參與建造了世界上最大的射電天文學(xué)天線陣列,該天線陣列目前包含 420 張 Alveo U55C 加速器卡用于處理無(wú)線電波,以研究早期宇宙并探索星系演化。
CSIRO計(jì)劃借助 Alveo V80 加速卡縮減占板面積與成本,并將所需加速卡的數(shù)量精簡(jiǎn)多達(dá) 66%,同時(shí)應(yīng)對(duì)來(lái)自望遠(yuǎn)鏡 131,000 個(gè)天線的新信號(hào)處理任務(wù)。考慮到卡、服務(wù)器、機(jī)架空間和功耗的潛在減少,每卡算力的躍升預(yù)計(jì)可帶來(lái)至高 20% 總擁有成本( TCO )下降。
還有具備壓縮與數(shù)據(jù)分析功能的服務(wù)器存儲(chǔ)節(jié)點(diǎn)的例子,通過(guò)Alveo V80進(jìn)行壓縮,利用FPGA架構(gòu)和AMD壓縮IP可擴(kuò)展存儲(chǔ)節(jié)點(diǎn),并可解壓縮,查詢加速等。
從總擁有成本的角度來(lái)分析,比如10Pb數(shù)據(jù)存儲(chǔ),沒(méi)有壓縮時(shí)需要55臺(tái)服務(wù)器,1303個(gè)SSD驅(qū)動(dòng)器,每年約427千瓦時(shí)的功耗。如果進(jìn)行壓縮,同樣10Pb數(shù)據(jù),只需要21臺(tái)服務(wù)器,504個(gè)SSD驅(qū)動(dòng)器,每年約233千瓦時(shí),使用42張AMD Alveo V80卡進(jìn)行壓縮,總擁有成本三年以上至高可以達(dá)到56%的降低,而且服務(wù)器的數(shù)量、服務(wù)器成本以及功耗也都有非常顯著的降低。
小結(jié):
市面上加速卡也有GPU、ASIC等,但這些加速卡各有所長(zhǎng)。Shyam Chander表示,相較而言GPU擅長(zhǎng)浮點(diǎn)、并聯(lián)、定點(diǎn),F(xiàn)PGA擅長(zhǎng)線上訪問(wèn)的實(shí)時(shí)處理,而且低時(shí)延、靈活應(yīng)變,有非常豐富的存儲(chǔ)器架構(gòu)資源。AMD Alveo系列產(chǎn)品主要針對(duì)內(nèi)聯(lián)網(wǎng)絡(luò)、實(shí)時(shí)處理比如傳感器的實(shí)時(shí)處理、金融科技的需求,他們的訴求點(diǎn)在于低時(shí)延和靈活應(yīng)變,F(xiàn)PGA的自適應(yīng)SoC就是極好的解決方案。
另外,HBM的價(jià)格雖然高于DDR,但是如果能夠正確地配置FPGA資源,最終就能實(shí)現(xiàn)高性價(jià)比的競(jìng)爭(zhēng)優(yōu)勢(shì)。在產(chǎn)品路線上,全面看待工作負(fù)載方面的要求,也在考慮引入HBM3等存儲(chǔ)。
-
FPGA
+關(guān)注
關(guān)注
1630文章
21796瀏覽量
606012 -
amd
+關(guān)注
關(guān)注
25文章
5497瀏覽量
134640 -
AI
+關(guān)注
關(guān)注
87文章
31516瀏覽量
270333 -
HBM
+關(guān)注
關(guān)注
0文章
386瀏覽量
14836
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
AMD Alveo媒體加速產(chǎn)品組合SDK 1.2.1發(fā)布
AMD Alveo V80計(jì)算加速器網(wǎng)絡(luò)研討會(huì)
AMD 以全球極快的纖薄尺寸電子交易加速卡擴(kuò)展 Alveo 產(chǎn)品組合,助力廣泛且具性價(jià)比的服務(wù)器部署
![<b class='flag-5'>AMD</b> 以全球極快的纖薄尺寸電子交易<b class='flag-5'>加速卡</b>擴(kuò)展 <b class='flag-5'>Alveo</b> 產(chǎn)品組合,<b class='flag-5'>助力</b>廣泛且具性價(jià)比的服務(wù)<b class='flag-5'>器</b>部署](https://file1.elecfans.com/web2/M00/09/97/wKgZomcPZ-aAMMEBAAjXXztA4DM289.png)
AMD 以全球極快的纖薄尺寸電子交易加速卡擴(kuò)展 Alveo 產(chǎn)品組合,助力廣泛且具性價(jià)比的服務(wù)器部署
AMD推出新款纖薄尺寸電子交易加速卡
貿(mào)澤開售適用于高性能計(jì)算應(yīng)用的AMD Alveo V80加速器卡
授權(quán)代理商貿(mào)澤電子為工程師提供AMD的全新AI和邊緣技術(shù)
HBM上車?HBM2E被用于自動(dòng)駕駛汽車
SK海力士攜手Waymo提供第三代高帶寬存儲(chǔ)器(HBM2E)技術(shù)
借助全新 AMD Alveo? V80 計(jì)算加速卡釋放計(jì)算能力
![借助全新 <b class='flag-5'>AMD</b> <b class='flag-5'>Alveo</b>? <b class='flag-5'>V80</b> 計(jì)算<b class='flag-5'>加速卡</b>釋放計(jì)算能力](https://file1.elecfans.com/web2/M00/E6/DA/wKgaomZFo1aAbF-gAAV64asQSn0097.png)
評(píng)論