云端AI推理需求將在2022年迎來爆發(fā)。繼去年底發(fā)布首款面向數(shù)據(jù)中心的AI訓(xùn)練芯片“邃思”及加速卡“云燧T10”后,燧原科技又發(fā)布了首款面向云端的高性能推理卡。
疫情加快了數(shù)據(jù)中心建設(shè)步伐和AI應(yīng)用的速度。“傳統(tǒng)數(shù)據(jù)中心和AI沒有直接關(guān)系,就是X86+GPU加一堆存儲和數(shù)據(jù)搬運,但現(xiàn)在數(shù)據(jù)中心越來越多引入AI加速平臺。AI的滲透率會越來越高,我們預(yù)計滲透率會從5%到25%-30%,市場非常龐大。”燧原科技CEO趙立東在接受第一財經(jīng)專訪時表示。
12月21日,燧原科技發(fā)布首款面向數(shù)據(jù)中心的AI推理產(chǎn)品 “云燧i10”。該公司是騰訊投資的國內(nèi)AI芯片初創(chuàng)企業(yè)。2018年8月,燧原科技由騰訊領(lǐng)投獲得Pre-A輪融資3.4億元人民幣。今年5月,燧原科技宣布完成B輪融資7億元人民幣,由半導(dǎo)體產(chǎn)業(yè)基金武岳峰資本領(lǐng)投,騰訊、上海雙創(chuàng)等跟投。
按使用場景劃分,AI芯片主要分為云端和終端芯片。目前主流的神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)包括訓(xùn)練和推斷兩個部分。云端追求高性能,開發(fā)成本更大,終端更側(cè)重低成本和低功耗。目前中國AI初創(chuàng)企業(yè)主要布局在終端和邊緣側(cè)。
趙立東認為,面向數(shù)據(jù)中心的高性能AI計算芯片及分布式集群作為人工智能產(chǎn)業(yè)的基礎(chǔ)設(shè)施,從架構(gòu)升級到應(yīng)用場景的落地,都蘊含了巨大的市場空間和機遇。
除了訓(xùn)練側(cè),云端AI推理的需求也不斷攀升。研究機構(gòu)賽迪顧問報告顯示,從2019年到2021年三年中國AI芯片市場規(guī)模仍將保持50%以上的增長速度,到2021年,市場規(guī)模將達到305.7億元。其中,隨著大規(guī)模地方性數(shù)據(jù)中心的建設(shè)陸續(xù)完成,云端訓(xùn)練芯片增長速度放緩;而隨著各領(lǐng)域市場需求的釋放,云端推斷芯片、終端推斷芯片市場增長速度將持續(xù)呈上升趨勢。
數(shù)據(jù)顯示,從2019年到2024年,云端訓(xùn)練芯片的年復(fù)合增長率為32%,而云端推理的增長率將達69%。到2022年,中國云端推理芯片市場規(guī)模將達到189億元,首次超過云端訓(xùn)練市場規(guī)模。
趙立東表示,AI真正起步在過去五六年,國內(nèi)更晚,BAT等大企業(yè)從2018、2019年才開始大量采購英偉達V100訓(xùn)練芯片,“訓(xùn)練跟推理的關(guān)系是訓(xùn)練出來的模型被部署到推理產(chǎn)品上使用。當(dāng)模型、算法不成熟,你需要不斷訓(xùn)練、迭代,成熟了才能被部署到推理上去真正應(yīng)用。從2018年開始到2022年,很多場景的算法和模型經(jīng)過這幾年開始逐漸成熟,真正規(guī)模化應(yīng)用。當(dāng)推理芯片銷售收入超過訓(xùn)練芯片,很多算法、模型已經(jīng)開始被廣泛應(yīng)用了。對AI領(lǐng)域來講,2022年是個重要的節(jié)點。”
在生態(tài)合作方面,燧原科技COO張亞林稱:“云燧i10已完成與浪潮、新華三及Supermicro等服務(wù)器廠商推理服務(wù)器的適配。可適用于視頻圖像、語音、自然語言處理、知識圖譜等多種應(yīng)用場景,并針對內(nèi)容理解、推薦、識別等高精度場景做了優(yōu)化。”
據(jù)悉,云燧i10是單槽位標(biāo)準(zhǔn)卡,支持PCIe 4.0,F(xiàn)P32算力達17.6TFLOPS,BF16/FP16算力70.4TFLOPS,將于明年第一季度上市。同時,燧原科技發(fā)布了推理引擎“鑒算TopsInference”。
燧原科技的云端訓(xùn)練產(chǎn)品已實現(xiàn)商業(yè)落地。今年9月,燧原科技稱,“云燧T10”和由其組成的多卡分布式訓(xùn)練集群已在云數(shù)據(jù)中心落地,正式進入商用階段。騰訊是燧原科技的重要合作伙伴,趙立東告訴第一財經(jīng),雙方將進一步加強合作的廣度和深度。不過,他指出,“騰訊是我們起步期(破冰)的重要伙伴,起步是最難的,從0到1。騰訊給我們很大幫助,是我們第一個具有戰(zhàn)略意義的重要客戶,但絕對不是唯一的。”
據(jù)介紹,燧原科技有三大目標(biāo)市場,一是云服務(wù)提供商,包括公有云、私有云、混合云等,這類企業(yè)有大量的流量和數(shù)據(jù),需要訓(xùn)練算法加速AI相關(guān)應(yīng)用;二是專注于金融、保險、醫(yī)療、交通等領(lǐng)域的行業(yè)服務(wù)商;三是AI超算中心和智慧城市等領(lǐng)域。
責(zé)任編輯:YYX
-
芯片
+關(guān)注
關(guān)注
456文章
51192瀏覽量
427328 -
AI
+關(guān)注
關(guān)注
87文章
31536瀏覽量
270353 -
燧原科技
+關(guān)注
關(guān)注
0文章
128瀏覽量
8405
發(fā)布評論請先 登錄
相關(guān)推薦
燧弘華創(chuàng)與燧原科技戰(zhàn)略合作再升級
福田卡文汽車發(fā)布首款新能源商用車樂福全球VAN
福田卡文汽車首款產(chǎn)品樂福與重卡概念車亮相
燧原科技亮相2024中國人工智能大會
燧原科技入選先進計算賦能新質(zhì)生產(chǎn)力典型應(yīng)用案例
銘瑄發(fā)布高性能800系列主板
澎峰科技高性能大模型推理引擎PerfXLM解析
![澎峰科技<b class='flag-5'>高性能</b>大模型<b class='flag-5'>推理</b>引擎PerfXLM解析](https://file1.elecfans.com/web2/M00/08/86/wKgZomb4uDOATSGEAAGRHaV4N2Q254.png)
弘信電子集團子公司燧弘綠色與首都在線共建慶陽萬卡集群
燧原科技與銳捷網(wǎng)絡(luò)攜手共筑AI數(shù)據(jù)中心高性能網(wǎng)絡(luò)新紀元
從千卡集群卡到萬卡集群,燧原科技打造更好的AI算力底座
![從千<b class='flag-5'>卡</b>集群卡到萬<b class='flag-5'>卡</b>集群,<b class='flag-5'>燧</b>原科技打造更好的AI算力底座](https://file1.elecfans.com/web2/M00/F9/2F/wKgZomaJ832Af2PeABCcpJm281c035.png)
燧原科技與清程極智簽署戰(zhàn)略合作協(xié)議
Infinix面向全球發(fā)布了其首款雙芯游戲旗艦—Infinix GT 20 Pro
![Infinix<b class='flag-5'>面向</b>全球<b class='flag-5'>發(fā)布</b><b class='flag-5'>了</b>其<b class='flag-5'>首</b><b class='flag-5'>款</b>雙芯游戲旗艦—Infinix GT 20 Pro](https://file1.elecfans.com/web2/M00/E1/34/wKgaomY4TfKACoCGAAAOAfmkcCg830.jpg)
評論