2021年一月,上海天數(shù)智芯半導體有限公司(以下簡稱:天數(shù)智芯)宣布,公司旗艦7nm工藝GPGPU云端訓練芯片BI成功點亮,這是國內第一款全自研、真正基于GPU架構下的7nm工藝GPGPU訓練芯片。
緊接著,2021年3月31日,天數(shù)智芯正式對外發(fā)布全自研高性能云端7nm芯片BI及產品卡,實現(xiàn)國產云端高性能GPGPU芯片從0到1的突破。在算力方面,天數(shù)智芯BI產品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數(shù)智芯在BI產品“點亮”時提到,BI產品的理論峰值性能達市場主流產品的2倍。一時間,國產GPGPU似乎已經站在世界之巔。但天數(shù)智芯產品副總裁鄒翾在接受電子發(fā)燒友采訪時表示:“實測性能對用戶才是關鍵,目前國內的軟件生態(tài)是短板,幾乎90%的AI應用都基于國外的基礎軟件棧,如何在現(xiàn)有軟件生態(tài)上充分發(fā)揮芯片的計算力,提供優(yōu)秀的實測性能,這是國產GPGPU 發(fā)展的關鍵。”

天數(shù)智芯產品副總裁鄒翾
他還說到,國內企業(yè)一定要敢于承認這種差距,在解決這些問題以后,國內的運算平臺才會有真正的用武之地。我們企業(yè)還是要圍繞怎么解決用戶需求去發(fā)展,在這個過程中不斷追趕并縮小這種差距。。
在天數(shù)智芯的系統(tǒng)軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調API兼容業(yè)界主流生態(tài)以及無痛遷移。“提供高效率的軟件結構,最大限度降低已有客戶的開發(fā)遷移成本,極大地影響著整個產業(yè)的發(fā)展。” 鄒翾指出,“天數(shù)智芯在產品的設計之初就關注到,客戶需要最大限度降低跨平臺的開發(fā)成本。我們考慮到GPGPU產品架構的通用兼容性,本著以客戶需求為出發(fā)點的原則,從實際角度為客戶實現(xiàn)跨平臺轉換的無痛遷移。”
鄒翾介紹說,BI產品是國內第一款全自研、真正基于通用GPU架構的GPGPU云端高端訓練芯片,以比同類產品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能。總結而言,BI產品有以下幾個優(yōu)勢:
a) 全自研IP核心;
b) GPGPU架構,更具有通用性及靈活性;
c) 采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
d) 軟件對主流生態(tài)兼容,客戶的跨平臺開發(fā)成本更低。
作為一種通用計算芯片,云端訓練只是GPGPU典型的應用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業(yè)中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務。”
在采訪的過程中,我們談到了端側AI的應用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經被驗證的芯片架構。AI端側發(fā)展會驅動應用背后更多新型函數(shù)和新型算子的出現(xiàn),這些需求將被融合到GPU未來的軟硬件開發(fā)中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結:
GPGPU的設計特點在于其通用可編程性,對于層出不窮的新的算法和應用,能做到性能和開發(fā)成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構間的產品間進行應用的無痛遷移。
在GPGPU領域,NVIDIA無疑是行業(yè)的標桿,不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領先優(yōu)勢,再考慮到產業(yè)生態(tài),國產GPGPU替代還有很長的路要走。在NVIDIA官網(wǎng)有提到,AI應用不僅需要大的內存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數(shù)據(jù)按照同樣的處理流程進行高效并行處理,CPU的優(yōu)勢是處理復雜邏輯流程。CPU和GPU在一個芯片上是可以實現(xiàn)的,而且以前也存在這種整合性的產品,但是對于高端的、云端的CPU加上GPU同時實現(xiàn),需要非常大的尺寸規(guī)模,而且會限制芯片在各自領域的性價比。
毫無疑問,云端訓練在未來很長一段時間內仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術的持續(xù)發(fā)展與應用落地,端側及邊緣側未來對算力性能的要求會越來越大。其中,數(shù)據(jù)中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數(shù)智芯的產品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領域的高通用性及更廣闊的應用領域。天數(shù)智芯始終以市場需求為導向,結合公司技術優(yōu)勢,關注客戶需求痛點并推出適合的GPGPU產品。隨著城市數(shù)字化轉型,傳統(tǒng)行業(yè)智能化轉型升級需求逐漸擴大,5G、大數(shù)據(jù)中心、人工智能、工業(yè)物聯(lián)網(wǎng)、無人駕駛、智慧城市等眾多智能應用領域對高端GPGPU芯片產品的需求量都在急劇增加。”
2021年3月1日,天數(shù)智芯對外宣布完成12億元人民幣的C輪融資。在企業(yè)高速發(fā)展的過程中,除了資金要到位,人才是重中之重。“天數(shù)智芯目前已經擁有了一支全球頂尖的數(shù)字集成電路設計與基礎軟件設計科學家團隊,為實現(xiàn)公司‘做算力引擎,創(chuàng)世界一流’的愿景而砥礪前行。這支完整的GPGPU研發(fā)團隊,由公司聯(lián)合創(chuàng)始人、高級副總裁及首席科學家鄭金山先生帶領,占比公司總人數(shù)85%以上,這其中既有一批行業(yè)經驗超過20年的世界級技術專家,也有一大批擁有5-15年業(yè)界經驗的高執(zhí)行力技術菁英,亦不乏來自于全球頂級院校的博士。” 鄒翾對此講到,“按照公司的業(yè)務發(fā)展,我們將會持續(xù)不斷地吸納優(yōu)秀人才深耕國產GPGPU芯片設計。隨著新產品的推出,團隊也將進一步擴大。另外,根據(jù)我們產品規(guī)劃和市場發(fā)展需要,天數(shù)智芯也會進一步通過融資支持公司的長遠發(fā)展。”
緊接著,2021年3月31日,天數(shù)智芯正式對外發(fā)布全自研高性能云端7nm芯片BI及產品卡,實現(xiàn)國產云端高性能GPGPU芯片從0到1的突破。在算力方面,天數(shù)智芯BI產品單芯每秒可進行147萬億次FP16計算(147TFLOPS@FP16)。
天數(shù)智芯在BI產品“點亮”時提到,BI產品的理論峰值性能達市場主流產品的2倍。一時間,國產GPGPU似乎已經站在世界之巔。但天數(shù)智芯產品副總裁鄒翾在接受電子發(fā)燒友采訪時表示:“實測性能對用戶才是關鍵,目前國內的軟件生態(tài)是短板,幾乎90%的AI應用都基于國外的基礎軟件棧,如何在現(xiàn)有軟件生態(tài)上充分發(fā)揮芯片的計算力,提供優(yōu)秀的實測性能,這是國產GPGPU 發(fā)展的關鍵。”

天數(shù)智芯產品副總裁鄒翾
減少客戶遷移的成本
軟件的重要性是毋庸置疑的,是發(fā)揮GPGPU硬件潛力的必要一環(huán),讓抽象的算力資源能夠和具體應用深度結合。目前,在GPGPU領域,無論是CUDA/OpenCL/TensorRT這些硬件加速平臺,還是TensorFlow/PyTorch等主流深度學習開發(fā)框架,主導者都是國際廠商或機構。鄒翾認為:“自己的軟件平臺一定是需要的,但目前來說,我們與國外主流廠商還有比較大的差距。而且不能單從某一顆芯片上去對比,還包括產品的覆蓋范圍、生態(tài)等方面。尤其是生態(tài)建設,這是國內廠商必須要面對的問題。”他還說到,國內企業(yè)一定要敢于承認這種差距,在解決這些問題以后,國內的運算平臺才會有真正的用武之地。我們企業(yè)還是要圍繞怎么解決用戶需求去發(fā)展,在這個過程中不斷追趕并縮小這種差距。。
在天數(shù)智芯的系統(tǒng)軟件方案中有標注,該公司除了提供高效的全棧式解決方案和全套SDK,也強調API兼容業(yè)界主流生態(tài)以及無痛遷移。“提供高效率的軟件結構,最大限度降低已有客戶的開發(fā)遷移成本,極大地影響著整個產業(yè)的發(fā)展。” 鄒翾指出,“天數(shù)智芯在產品的設計之初就關注到,客戶需要最大限度降低跨平臺的開發(fā)成本。我們考慮到GPGPU產品架構的通用兼容性,本著以客戶需求為出發(fā)點的原則,從實際角度為客戶實現(xiàn)跨平臺轉換的無痛遷移。”
從云端走向更廣闊的場景
在天數(shù)智芯BI產品的介紹中我們看到,這款全自研通用計算GPGPU芯片聚焦于云端訓練市場。長期以來,云端訓練市場被國際巨頭壟斷,不僅加速卡產品成本高,且生態(tài)較為封閉,制約了AI產品多元化發(fā)展和升級迭代。鄒翾介紹說,BI產品是國內第一款全自研、真正基于通用GPU架構的GPGPU云端高端訓練芯片,以比同類產品更小的芯片面積 、更低的功耗,提供主流廠商實測接近的性能。總結而言,BI產品有以下幾個優(yōu)勢:
a) 全自研IP核心;
b) GPGPU架構,更具有通用性及靈活性;
c) 采用先進的 7nm工藝制程,性能效率高,在同樣的 power水平上性能更高;
d) 軟件對主流生態(tài)兼容,客戶的跨平臺開發(fā)成本更低。
作為一種通用計算芯片,云端訓練只是GPGPU典型的應用場景之一,正如NVIDIA所言,GPGPU最終的目的是將AI引入到各行各業(yè)中。鄒翾也談到:“我們做的GPGPU全稱是通用圖形處理器(General-Purpose Computing on Graphics Processing Units),就是讓本為圖形圖像處理而生的GPU能夠運行圖形渲染之外的通用計算任務。”
在采訪的過程中,我們談到了端側AI的應用。鄒翾表示,GPU在端到端AI部署中,屬于一個已經被驗證的芯片架構。AI端側發(fā)展會驅動應用背后更多新型函數(shù)和新型算子的出現(xiàn),這些需求將被融合到GPU未來的軟硬件開發(fā)中。
下面這段引述是他對于GPGPU在與各類型AI芯片相比特點的總結:
GPGPU的設計特點在于其通用可編程性,對于層出不窮的新的算法和應用,能做到性能和開發(fā)成本間較好的平衡。同時,基于GPGPU的通用性,客戶可以在類似軟硬件架構間的產品間進行應用的無痛遷移。
在GPGPU領域,NVIDIA無疑是行業(yè)的標桿,不僅擁有百萬開發(fā)者支持的CUDA,還在指令集的覆蓋面、顆粒度、效率等維度有領先優(yōu)勢,再考慮到產業(yè)生態(tài),國產GPGPU替代還有很長的路要走。在NVIDIA官網(wǎng)有提到,AI應用不僅需要大的內存池,也需要CPU和GPU緊密耦合。
對于這一點,鄒翾認為,GPU注重的是同類型的數(shù)據(jù)按照同樣的處理流程進行高效并行處理,CPU的優(yōu)勢是處理復雜邏輯流程。CPU和GPU在一個芯片上是可以實現(xiàn)的,而且以前也存在這種整合性的產品,但是對于高端的、云端的CPU加上GPU同時實現(xiàn),需要非常大的尺寸規(guī)模,而且會限制芯片在各自領域的性價比。
天數(shù)智芯的下一步
艾瑞咨詢此前在相關報告中指出,2020年中國人工智能基礎層市場規(guī)模為497億元,為AI產業(yè)總規(guī)模的33%,AI芯片的高增長是產業(yè)規(guī)模增長的主要推動力。未來,算力模塊的智能服務器國產化率將逐步提升。毫無疑問,云端訓練在未來很長一段時間內仍將是AI芯片的主要市場,市場占比會一直處于前列。但正如鄒翾所言,隨著AI、5G技術的持續(xù)發(fā)展與應用落地,端側及邊緣側未來對算力性能的要求會越來越大。其中,數(shù)據(jù)中心以及金融、電信等方面將會是很大的市場。
他表示:“目前天數(shù)智芯的產品是云端7nm通用計算芯片BI及加速卡,未來公司將聚焦GPGPU領域的高通用性及更廣闊的應用領域。天數(shù)智芯始終以市場需求為導向,結合公司技術優(yōu)勢,關注客戶需求痛點并推出適合的GPGPU產品。隨著城市數(shù)字化轉型,傳統(tǒng)行業(yè)智能化轉型升級需求逐漸擴大,5G、大數(shù)據(jù)中心、人工智能、工業(yè)物聯(lián)網(wǎng)、無人駕駛、智慧城市等眾多智能應用領域對高端GPGPU芯片產品的需求量都在急劇增加。”
2021年3月1日,天數(shù)智芯對外宣布完成12億元人民幣的C輪融資。在企業(yè)高速發(fā)展的過程中,除了資金要到位,人才是重中之重。“天數(shù)智芯目前已經擁有了一支全球頂尖的數(shù)字集成電路設計與基礎軟件設計科學家團隊,為實現(xiàn)公司‘做算力引擎,創(chuàng)世界一流’的愿景而砥礪前行。這支完整的GPGPU研發(fā)團隊,由公司聯(lián)合創(chuàng)始人、高級副總裁及首席科學家鄭金山先生帶領,占比公司總人數(shù)85%以上,這其中既有一批行業(yè)經驗超過20年的世界級技術專家,也有一大批擁有5-15年業(yè)界經驗的高執(zhí)行力技術菁英,亦不乏來自于全球頂級院校的博士。” 鄒翾對此講到,“按照公司的業(yè)務發(fā)展,我們將會持續(xù)不斷地吸納優(yōu)秀人才深耕國產GPGPU芯片設計。隨著新產品的推出,團隊也將進一步擴大。另外,根據(jù)我們產品規(guī)劃和市場發(fā)展需要,天數(shù)智芯也會進一步通過融資支持公司的長遠發(fā)展。”
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。
舉報投訴
-
軟件
+關注
關注
69文章
5124瀏覽量
88981 -
天數(shù)智芯
+關注
關注
0文章
99瀏覽量
6091 -
GPGPU
+關注
關注
0文章
29瀏覽量
5073
發(fā)布評論請先 登錄
相關推薦
熱點推薦
CPU\GPU引領,國產AI PC進階
電子發(fā)燒友網(wǎng)報道(文/黃晶晶)當前AI PC已經成為PC產業(yè)的下一個浪潮,國產CPU、GPU廠商在PC市場一直處于追趕態(tài)勢,AI PC給了大家新的機遇,在這個賽道國產廠商加速了布局與滲透。 首款國產

國產濾波器,如何破局!
國產濾波器突圍戰(zhàn): 三重挑戰(zhàn)下的產業(yè)進階之路 隨著 5G 網(wǎng)絡的規(guī)模化商用、RedCap 技術的加速部署、車載V2X的逐步覆蓋以及衛(wèi)星直連通信的落地,移動終端對射頻前端(RFFE)的性能要求與數(shù)量
突發(fā)!全球三大家EDA斷供大陸,國產EDA崛起?
半導體產業(yè)的脫鉤。雖然我們目前都在講國產替代,但還是要正視跟美國的差距,目前全球三大家EDA公司:Synopsys、Cadence和西門子EDA(被收購前叫Men

國產 vs 進口貼片固態(tài)電容:技術差距縮小,本土化替代加速
差異、市場表現(xiàn)及未來趨勢,探討國產替代的機遇與挑戰(zhàn)。 ? 1.性能對比:國產技術迎頭趕上 ? (1)關鍵參數(shù)差距縮小 ? - ESR(等效串聯(lián)電阻):早期國產固態(tài)電容的ESR較高,影響

深度對比:全國產電腦替代方案VS進口設備,性能差距縮小至15%的真相
在工業(yè)、金融、能源等領域,進口電腦設備長期占據(jù)主導地位,但高昂的成本和技術依賴風險成為企業(yè)痛點。如今,以華頡工控機為代表的全國產電腦替代方案,通過CPU、操作系統(tǒng)、芯片組的全面國產化,將性能差距從過去的50%以上縮小至15%以內

國產變頻器與國外品牌存在的差距分析
近日有網(wǎng)友問到:國產低壓變頻器跟合資低壓變頻器的差距到底在哪里?不是說低壓的變頻器其實國內跟合資已經是差不了多少,只是品牌效應?是在芯片?算法?員工素質?高壓變頻器國產跟進口的是不是差距

國芯科技:已結束基于RISC-V架構GPGPU研發(fā)
的GPGPU內核研發(fā)工作,2024年7月公司已完成第一版RTL代碼設計并對外公開發(fā)布。由于公司聚焦汽車電子芯片、服務器和云應用安全芯片、量子安全芯片以及AI MCU芯片的研發(fā)及設計,RISC-V GPGPU當前階段的研發(fā)工作已結束,未來公司將視國際上開源RISC-V
中科銀河芯的國產替代之路
最近國際形勢復雜多變,使得相關半導體領域貿易不確定性增強,國產芯片的自主可控產業(yè)鏈需求變得更加迫切,“國產替代”又成為了一個熱門且關鍵的議題,這不僅是對技術限制的回應,也是國產芯片產業(yè)邁向高端化、實現(xiàn)自主可控的必經

龍芯中科首款GPGPU芯片9A1000計劃明年流片
龍芯中科在GPU領域邁出了堅實步伐,其首款集成自研GPGPU核心的2K3000芯片已在上半年成功交付流片,標志著龍芯在終端應用市場的深入探索。更令人矚目的是,其首款GPGPU芯片9A1000計劃于今
國產FPGA的發(fā)展前景是什么?
,提升產品性能和技術水平。通過與國際巨頭的合作與競爭,國產FPGA在容量、制程、性能等方面逐步縮小與國際先進水平的差距。
技術創(chuàng)新:國產FPGA廠商積極探索新技術、新應用,如SoC FPGA(系統(tǒng)級可編程
發(fā)表于 07-29 17:04
評論