電子發燒友網報道(文/吳子鵬)2021年一月,上海天數智芯半導體有限公司(以下簡稱:天數智芯)宣布,公司旗艦7nm工藝GPGPU云端訓練芯片BI成功點亮,這是國內第一款全自研、真正基于GPU架構下的7nm工藝GPGPU訓練芯片。
緊接著,2021年3月31日,天數智芯正式對外發布全自研高性能云端7nm芯片BI及產品卡,實現國產云端高性能GPGPU芯片從0到1的突破。在算力方面,天數智芯BI產品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數智芯在BI產品“點亮”時提到,BI產品的理論峰值性能達市場主流產品的2倍。一時間,國產GPGPU似乎已經站在世界之巔。但天數智芯產品副總裁鄒翾在接受電子發燒友采訪時表示:“實測性能對用戶才是關鍵,目前國內的軟件生態是短板,幾乎90%的AI應用都基于國外的基礎軟件棧,如何在現有軟件生態上充分發揮芯片的計算力,提供優秀的實測性能,這是國產GPGPU 發展的關鍵。”
減少客戶遷移的成本
軟件的重要性是毋庸置疑的,是發揮GPGPU硬件潛力的必要一環,讓抽象的算力資源能夠和具體應用深度結合。目前,在GPGPU領域,無論是CUDA/OpenCL/TensorRT這些硬件加速平臺,還是TensorFlow/PyTorch等主流深度學習開發框架,主導者都是國際廠商或機構。鄒翾認為:“自己的軟件平臺一定是需要的,但目前來說,我們與國外主流廠商還有比較大的差距。而且不能單從某一顆芯片上去對比,還包括產品的覆蓋范圍、生態等方面。尤其是生態建設,這是國內廠商必須要面對的問題。”
他還說到,國內企業一定要敢于承認這種差距,在解決這些問題以后,國內的運算平臺才會有真正的用武之地。我們企業還是要圍繞怎么解決用戶需求去發展,在這個過程中不斷追趕并縮小這種差距。。
在天數智芯的系統軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調API兼容業界主流生態以及無痛遷移。“提供高效率的軟件結構,最大限度降低已有客戶的開發遷移成本,極大地影響著整個產業的發展。” 鄒翾指出,“天數智芯在產品的設計之初就關注到,客戶需要最大限度降低跨平臺的開發成本。我們考慮到GPGPU產品架構的通用兼容性,本著以客戶需求為出發點的原則,從實際角度為客戶實現跨平臺轉換的無痛遷移。”
從云端走向更廣闊的場景
在天數智芯BI產品的介紹中我們看到,這款全自研通用計算GPGPU芯片聚焦于云端訓練市場。長期以來,云端訓練市場被國際巨頭壟斷,不僅加速卡產品成本高,且生態較為封閉,制約了AI產品多元化發展和升級迭代。
鄒翾介紹說,BI產品是國內第一款全自研、真正基于通用GPU架構的GPGPU云端高端訓練芯片,以比同類產品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能。總結而言,BI產品有以下幾個優勢:
全自研IP核心;
GPGPU架構,更具有通用性及靈活性;
采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
軟件對主流生態兼容,客戶的跨平臺開發成本更低。
作為一種通用計算芯片,云端訓練只是GPGPU典型的應用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務。”
在采訪的過程中,我們談到了端側AI的應用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經被驗證的芯片架構。AI端側發展會驅動應用背后更多新型函數和新型算子的出現,這些需求將被融合到GPU未來的軟硬件開發中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結:GPGPU的設計特點在于其通用可編程性,對于層出不窮的新的算法和應用,能做到性能和開發成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構間的產品間進行應用的無痛遷移。
在GPGPU領域,NVIDIA無疑是行業的標桿,不僅擁有百萬開發者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領先優勢,再考慮到產業生態,國產GPGPU替代還有很長的路要走。在NVIDIA官網有提到,AI應用不僅需要大的內存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數據按照同樣的處理流程進行高效并行處理,CPU的優勢是處理復雜邏輯流程。CPU和GPU在一個芯片上是可以實現的,而且以前也存在這種整合性的產品,但是對于高端的、云端的CPU加上GPU同時實現,需要非常大的尺寸規模,而且會限制芯片在各自領域的性價比。
天數智芯的下一步
艾瑞咨詢此前在相關報告中指出,2020年中國人工智能基礎層市場規模為497億元,為AI產業總規模的33%,AI芯片的高增長是產業規模增長的主要推動力。未來,算力模塊的智能服務器國產化率將逐步提升。
毫無疑問,云端訓練在未來很長一段時間內仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術的持續發展與應用落地,端側及邊緣側未來對算力性能的要求會越來越大。其中,數據中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數智芯的產品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領域的高通用性及更廣闊的應用領域。天數智芯始終以市場需求為導向,結合公司技術優勢,關注客戶需求痛點并推出適合的GPGPU產品。隨著城市數字化轉型,傳統行業智能化轉型升級需求逐漸擴大,5G、大數據中心、人工智能、工業物聯網、無人駕駛、智慧城市等眾多智能應用領域對高端GPGPU芯片產品的需求量都在急劇增加。”
2021年3月1日,天數智芯對外宣布完成12億元人民幣的C輪融資。在企業高速發展的過程中,除了資金要到位,人才是重中之重。“天數智芯目前已經擁有了一支全球頂尖的數字集成電路設計與基礎軟件設計科學家團隊,為實現公司‘做算力引擎,創世界一流’的愿景而砥礪前行。
這支完整的GPGPU研發團隊,由公司聯合創始人、高級副總裁及首席科學家鄭金山先生帶領,占比公司總人數85%以上,這其中既有一批行業經驗超過20年的世界級技術專家,也有一大批擁有5-15年業界經驗的高執行力技術菁英,亦不乏來自于全球頂級院校的博士。”
鄒翾對此講到,“按照公司的業務發展,我們將會持續不斷地吸納優秀人才深耕國產GPGPU芯片設計。隨著新產品的推出,團隊也將進一步擴大。另外,根據我們產品規劃和市場發展需要,天數智芯也會進一步通過融資支持公司的長遠發展。”
聲明:本文由電子發燒友原創,轉載請注明以上來源。如需入群交流,請添加微信elecfans999,投稿爆料采訪需求,請發郵箱huangjingjing@elecfans.com。
編輯:jq
-
芯片
+關注
關注
456文章
51192瀏覽量
427325 -
NVIDIA
+關注
關注
14文章
5076瀏覽量
103730 -
gpu
+關注
關注
28文章
4777瀏覽量
129362 -
AI
+關注
關注
87文章
31536瀏覽量
270353 -
SDK
+關注
關注
3文章
1045瀏覽量
46281
原文標題:正視差距,國產GPGPU的進階之路
文章出處:【微信號:elecfans,微信公眾號:電子發燒友網】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
CPU\GPU引領,國產AI PC進階
![CPU\GPU引領,<b class='flag-5'>國產</b>AI PC<b class='flag-5'>進階</b>](https://file1.elecfans.com/web2/M00/04/D7/wKgZombTGU-AU_yXAAVgfNtokok547.png)
國產主板的崛起之路代表著我們的科技實力和創新能力
國芯科技:已結束基于RISC-V架構GPGPU研發
中科銀河芯的國產替代之路
![中科銀河芯的<b class='flag-5'>國產</b>替代<b class='flag-5'>之路</b>](https://file1.elecfans.com/web3/M00/01/E6/wKgZPGdZT-aAK-A_AAAxeaow48w563.png)
國內板對板連接器行情:國產連接器的發展之路與現狀
龍芯中科首款GPGPU芯片9A1000計劃明年流片
開源芯片系列講座第20期:基于RISC-V向量擴展的開源GPGPU軟硬件設計
![開源芯片系列講座第20期:基于RISC-V向量擴展的開源<b class='flag-5'>GPGPU</b>軟硬件設計](https://file1.elecfans.com/web2/M00/E7/38/wKgZomZLCKOADpCZAADosLpjpSY656.png)
從杰發科技AutoChips AC8015看國產汽車芯片突圍之路
![從杰發科技AutoChips AC8015看<b class='flag-5'>國產</b>汽車芯片突圍<b class='flag-5'>之路</b>](https://file1.elecfans.com//web2/M00/C8/39/wKgaomYS7H2AJfyHAAG2UwA_2FM642.jpg)
評論