NVIDIA的下一代GeForce游戲卡遲遲不肯露面,一方面是缺乏足夠的競(jìng)爭(zhēng)刺激,另一方面則是NVIDIA的業(yè)務(wù)重心早已經(jīng)轉(zhuǎn)移,不再只盯著游戲卡,更關(guān)注的是計(jì)算平臺(tái),畢竟那里發(fā)展空間更大,利潤(rùn)也高得多。
NVIDIA今天宣布推出新一代計(jì)算平臺(tái)“HGX-2”,擁有多達(dá)16塊頂級(jí)計(jì)算卡Tesla V100,而且第一次將AI人工智能、HPC高性能計(jì)算融合在了統(tǒng)一架構(gòu)之內(nèi)。
Tesla V100基于新一代GPU架構(gòu)“Volta”(伏特),采用臺(tái)積電12nm FFN(16nm加強(qiáng)版)工藝制造,擁有5120個(gè)CUDA核心、640個(gè)Tensor深度學(xué)習(xí)核心,面積達(dá)815平方毫米,集成了210億個(gè)晶體管。
其浮點(diǎn)性能高達(dá)半精度30TFlops、單精度15TFlops、雙精度7.5TFlops,Tensor性能則有120TFlops,同時(shí)搭配4096-bit位寬的16GB HBM2高帶寬顯存,頻率1.75GHz,帶寬900GB/s。
NVIDIA此前的計(jì)算平臺(tái)HGX-1整合了8塊Tesla V100,總計(jì)40960個(gè)CUDA核心、5120個(gè)Tensor核心、256GB顯存,通過(guò)300GB/s雙線(xiàn)帶寬的NVLink總線(xiàn)相連,浮點(diǎn)性能單精度125TFlops、雙精度62TFlops,Tensor性能1PFlops。
而新一代HGX-2則用上了16塊Tesla V100,規(guī)模和性能輕松翻番,總計(jì)81920個(gè)CUDA核心、10240個(gè)Tensor核心、512GB顯存,浮點(diǎn)性能單精度250TFlops、雙精度125TFlops,Tensor性能2PFlops。
NVIDIA還在系統(tǒng)內(nèi)部署了12顆NVSwitches開(kāi)關(guān),用于GPU之間的直接互聯(lián),NVLink總線(xiàn)雙向帶寬高達(dá)2.4TB/s。
除了高性能,HGX-2平臺(tái)的最大優(yōu)點(diǎn)是支持多種精度計(jì)算,可適應(yīng)不同需求,比如在科學(xué)計(jì)算和模擬中,可使用FP64、FP32高精度計(jì)算,而在AI訓(xùn)練和推理中,則可使用FP16浮點(diǎn)、Int8整數(shù)精度計(jì)算。
聯(lián)想、超微、QCT、Wiwynn四大服務(wù)器廠(chǎng)商都將在今年晚些時(shí)候發(fā)售各自的HGX-2系統(tǒng)。
富士康、英業(yè)達(dá)、廣達(dá)、緯創(chuàng)四大ODM廠(chǎng)商則正在設(shè)計(jì)基于HGX-2的系統(tǒng),將在今年晚些時(shí)候面世,可用于云計(jì)算數(shù)據(jù)中心。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5187瀏覽量
105385 -
人工智能
+關(guān)注
關(guān)注
1804文章
48418瀏覽量
244703 -
計(jì)算卡
+關(guān)注
關(guān)注
0文章
16瀏覽量
3753
原文標(biāo)題:合體!16塊Tesla V100計(jì)算卡 NVIDIA造頂級(jí)計(jì)算平臺(tái)
文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
Imagination宣布推出新一代GPU架構(gòu)
NVIDIA宣布推出 Hopper 架構(gòu),掀起新一代加速計(jì)算浪潮

評(píng)論