近日,自稱為國(guó)內(nèi)自主創(chuàng)新的通用GPU領(lǐng)軍企業(yè)的登臨科技獲得中國(guó)互聯(lián)網(wǎng)投資基金(簡(jiǎn)稱“中網(wǎng)投”)獨(dú)家投資。
公司稱,這將為登臨新一代Goldwasser(高凜)規(guī)模化量產(chǎn)及商業(yè)化落地提供重要保障。
高凜是一款AI加速卡,首款產(chǎn)品2021年量產(chǎn)投入市場(chǎng),2022年銷售過萬片。
第二代產(chǎn)品2022年流片,2023年實(shí)現(xiàn)量產(chǎn)。根據(jù)現(xiàn)有客戶測(cè)試結(jié)果,二代產(chǎn)品針對(duì)基于transformer類型的模型提供3-5倍的性能提升,大幅降低類ChatGPT及生成式AI應(yīng)用的硬件成本。
在官網(wǎng),登臨介紹自己是國(guó)內(nèi)首家完全憑借自主創(chuàng)新,實(shí)現(xiàn)規(guī)模化商業(yè)落地的通用GPU企業(yè),登臨科技核心IP完全自主研發(fā),其自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內(nèi)異構(gòu)計(jì)算架構(gòu)),在兼容 CUDA/OpenCL 在內(nèi)的編程模型和軟件生態(tài)的基礎(chǔ)上,通過架構(gòu)創(chuàng)新,解決了客戶核心關(guān)注的通用性和高效率的雙重難題。
其表示,經(jīng)過大量客戶產(chǎn)品化驗(yàn)證,針對(duì)AI計(jì)算,GPU+相比現(xiàn)有主流GPU在性能及能效上有顯著提升。
在AI市場(chǎng)上,NVIDIA現(xiàn)在是沒有對(duì)手的階段,AI顯卡份額估計(jì)在90%以上,AMD都很難競(jìng)爭(zhēng),現(xiàn)在Intel也加入這個(gè)市場(chǎng)了,而且找到了NVIDIA的一個(gè)痛點(diǎn),那就是性價(jià)比。
NVIDIA目前受追捧的AI顯卡主要是A100、H100,國(guó)內(nèi)有特供的閹割版A800、H800,性能比原版弱20%左右,但即便如此依然供不應(yīng)求,A800一周時(shí)間就從9萬元漲到11萬元以上,H100價(jià)格在25萬元以上,H800也要20萬出頭,而且不同經(jīng)銷商的價(jià)格差異很大。
Intel自然也不會(huì)放過這個(gè)市場(chǎng),日前在國(guó)內(nèi)舉行發(fā)布會(huì),也推出了AI顯卡Habana Gaudi2,這是去年底發(fā)布的AI推理加速芯片,從第一代的16nm工藝升級(jí)到7nm工藝,Tensor 處理器核心數(shù)量增至 24 個(gè),同時(shí)集成了多媒體處理引擎,內(nèi)存升級(jí)至 96GB HBM2E。
國(guó)內(nèi)版的Gaudi2主要是閹割了部分網(wǎng)絡(luò)接口,但也集成了21路100Gbps網(wǎng)絡(luò)接口,總體來說性能依然很可觀。
Intel還公布了Gaudi2跟H100的AI性能對(duì)比,面對(duì)要求極為苛刻的、1750億參數(shù)的GPT-3模型,384個(gè)Gaudi2加速器上的訓(xùn)練時(shí)間僅為311.9分鐘,而且從256個(gè)加速器到384個(gè)加速器,性能擴(kuò)展幅度達(dá)95%。
NVIDIA這邊在512塊 H100 GPU上的訓(xùn)練時(shí)間則為64分鐘,論單卡性能的話是Gaudi2的3.6倍多,但是Intel不會(huì)跟H100拼極限性能,而是強(qiáng)調(diào)性價(jià)比。
Habana Labs 首席運(yùn)營(yíng)官 Eitan Medina 表示,性價(jià)比是影響H100和Gaudi2相對(duì)價(jià)值的重要考量因素,Gaudi2 服務(wù)器的成本要比H100低得多。
更重要的是,目前Gaudi2還沒有支持AI常用的FP8運(yùn)算格式,這種情況下Gaudi2 在性價(jià)比上也勝過了H100,今年3季度會(huì)升級(jí)支持FP8運(yùn)算,Gaudi2的性能將有明顯飛躍,性價(jià)比要比H100更高了。
-
gpu
+關(guān)注
關(guān)注
28文章
4935瀏覽量
131079 -
AI
+關(guān)注
關(guān)注
88文章
34936瀏覽量
278307 -
ChatGPT
+關(guān)注
關(guān)注
29文章
1589瀏覽量
9024
原文標(biāo)題:國(guó)內(nèi)公司自主研發(fā)GPU+:兼容CUDA、性能及能效超競(jìng)品
文章出處:【微信號(hào):hdworld16,微信公眾號(hào):硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
CSS6404L 在物聯(lián)網(wǎng)設(shè)備中的應(yīng)用優(yōu)勢(shì):低功耗高可靠的存儲(chǔ)革新與競(jìng)品對(duì)比

TNC 連接器競(jìng)品大對(duì)決,質(zhì)量誰更勝一籌?

迅為3A6000開發(fā)板/龍芯3A6000與龍芯3A5000等龍架構(gòu)處理器軟件兼容
天璣8400 搭載G720 GPU性能能效雙飆,打造驚艷越級(jí)游戲體驗(yàn)

IO模塊助力PLC,全面提升中水處理設(shè)備能效

迅為3A6000_7A2000開發(fā)板龍芯全國(guó)產(chǎn)處理器與龍芯 3A5000完全兼容
上海貝嶺超小封裝物聯(lián)網(wǎng)能效監(jiān)測(cè)芯片BL0971介紹

天璣9400技術(shù)詳解:如何蟬聯(lián)GPU性能、能效雙冠軍

【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--了解算力芯片GPU
國(guó)內(nèi)首款自主研發(fā)28nm顯示芯片量產(chǎn)
“超新芯”賦能水表行業(yè),國(guó)產(chǎn)替代與計(jì)量升級(jí) ——龍芯1D超聲波流量測(cè)計(jì)量芯片介紹
打破英偉達(dá)CUDA壁壘?AMD顯卡現(xiàn)在也能無縫適配CUDA了
英國(guó)公司實(shí)現(xiàn)英偉達(dá)CUDA軟件在AMD GPU上的無縫運(yùn)行
淺談建筑樓宇電氣安全與能效管理的應(yīng)用與選型

評(píng)論